Średnia vs mediana
Porównanie to wyjaśnia statystyczne pojęcia średniej i mediany, szczegółowo opisując, jak oblicza się każdą z tych miar tendencji centralnej, jak zachowują się one w różnych zbiorach danych oraz kiedy jedna może być bardziej przydatna od drugiej w zależności od rozkładu danych i obecności wartości odstających.
Najważniejsze informacje
- Średnia i mediana to miary tendencji centralnej, które podsumowują centralny punkt zbioru danych.
- Średnia jest wrażliwa na każdą pojedynczą wartość, co czyni ją podatną na skrajne punkty danych.
- Mediana dzieli zbiór danych na dwie równe połowy, dzięki czemu jest odporna na wartości odstające.
- Średnia jest najlepsza dla zrównoważonych zbiorów danych, podczas gdy mediana jest preferowana w przypadku zbiorów danych skośnych lub nierównomiernych.
Czym jest Oznacza?
Średnia arytmetyczna obliczana przez zsumowanie wartości i podzielenie przez ich liczbę.
- Kategoria: Miara tendencji centralnej
- Obliczenie: Suma wszystkich wartości podzielona przez liczbę wartości
- Czułość: Wpływana przez każdy punkt danych
- Typowe zastosowanie: Rozkłady symetryczne
- Wpływ wartości odstających: Bardzo wrażliwy na wartości skrajne
Czym jest Mediana?
Mediana w uporządkowanym zbiorze danych oddzielająca połowę niższą od wyższej.
- Kategoria: Miara tendencji centralnej
- Obliczenie: Wartość środkowa po posortowaniu wartości
- Czułość: Zależy tylko od kolejności wartości
- Typowe zastosowanie: Zestawy danych o nierównym lub asymetrycznym rozkładzie
- Wpływ wartości odstających: Odporny na wartości ekstremalne
Tabela porównawcza
| Funkcja | Oznacza | Mediana |
|---|---|---|
| Definicja | Średnia arytmetyczna wszystkich wartości | Wartość środkowa w uporządkowanej liście |
| Metoda obliczania | Suma wartości ÷ liczba | Posortuj wartości i wybierz punkt środkowy |
| Wrażliwość na wartości odstające | Bardzo wrażliwy | Odporny na wartości odstające |
| Najlepsze dla symetrii | Tak | Mniej istotne |
| Najlepsze dla danych skośnych | Mniej reprezentatywny | Bardziej reprezentatywny |
| Wymaga zamówienia | Nie | Tak |
| Typowy przykład użycia | Średni wynik testu | Mediana dochodu gospodarstw domowych |
Szczegółowe porównanie
Podstawowe obliczenia
Średnia jest obliczana poprzez zsumowanie wszystkich liczb w zbiorze danych i podzielenie tej sumy przez liczbę elementów, co daje centralną wartość liczbową. Natomiast mediana jest wyznaczana poprzez uporządkowanie wartości od najniższej do najwyższej i wybranie wartości środkowej lub uśrednienie dwóch środkowych wartości, jeśli liczba elementów jest parzysta.
Wpływ wartości odstających
Średnia uwzględnia wszystkie wartości w równym stopniu, więc skrajnie wysokie lub niskie wartości silnie wpływają na jej wynik, co może prowadzić do błędnego przedstawienia typowej wartości w danych o asymetrycznym rozkładzie. Mediana ignoruje, jak duże lub małe są wartości poza ich kolejnością, dzięki czemu jest mniej podatna na wpływ wartości skrajnych i często bardziej pouczająca w przypadku rozkładów asymetrycznych.
Wpływ kształtu rozkładu
W zbiorach danych symetrycznych, pozbawionych wartości ekstremalnych, średnia i mediana często pokrywają się i obie dobrze opisują centrum zbioru. Jednak w rozkładach z długim ogonem po jednej stronie średnia przesuwa się w kierunku ogona, podczas gdy mediana pozostaje w miejscu, gdzie połowa danych znajduje się powyżej, a połowa poniżej, oferując odmienną perspektywę.
Wymagania obliczeniowe
Średnia jest prosta do obliczenia bez sortowania, co może być szybsze dla prostych list lub obliczeń w czasie rzeczywistym. Mediana wymaga najpierw posortowania wartości, co może wprowadzać dodatkowe obciążenie obliczeniowe dla bardzo dużych list, ale daje wartość centralną niewrażliwą na wielkość wartości odstających.
Zalety i wady
Oznaczać
Zalety
- +Łatwy do obliczenia
- +Wykorzystuje wszystkie punkty danych
- +Standard dla wielu analiz
- +Konwencjonalnie matematycznie
Zawartość
- −Zniekształcone przez wartości odstające
- −Nieodzwierciedlające przekłamanych danych
- −Wymaga danych liczbowych
- −Może wprowadzać w błąd w skrajnych przypadkach
Mediana
Zalety
- +Odporny na wartości odstające
- +Odbija typową wartość
- +Przydatne dla danych o niesymetrycznym rozkładzie
- +Dotyczy uporządkowanych zbiorów danych
Zawartość
- −Wymaga sortowania
- −Ignoruje skrajne wartości wielkości
- −Mniej przydatne w przypadku danych symetrycznych
- −Nakład obliczeniowy
Częste nieporozumienia
Średnia i mediana zawsze dają ten sam wynik.
Średnia i mediana pokrywają się tylko wtedy, gdy dane są mniej więcej symetryczne i nie zawierają wartości skrajnych; w przypadku danych skośnych lub nierównomiernych mogą się one znacznie różnić.
Średnia arytmetyczna jest zawsze najlepszą miarą średniej.
Średnia to konwencjonalna wartość przeciętna, ale może wprowadzać w błąd przy danych skośnych lub wartościach odstających, gdzie mediana często lepiej odzwierciedla typową wartość zbioru danych.
Median ignoruje ważne dane.
Median nie ignoruje danych; koncentruje się na pozycji centralnej i celowo redukuje wpływ wartości odstających, aby dostarczyć solidną wartość centralną.
Median nie działa z zestawami danych o parzystej liczbie elementów.
Dla zbiorów danych o parzystej liczbie elementów mediana jest obliczana jako średnia dwóch środkowych wartości po posortowaniu, więc nadal definiuje punkt centralny.
Często zadawane pytania
Co właściwie oznacza średnia w statystyce?
Jak znaleźć medianę zbioru danych?
Dlaczego mediana może być lepsza od średniej?
Czy średnia i mediana mogą być równe?
Które jest częściej używane w codziennym życiu?
Czy mediana ignoruje punkty danych?
Czy Mean jest lepszy dla dużych zbiorów danych?
Czy średnia i mediana są używane poza lekcjami matematyki?
Wynik
Użyj średniej, gdy twoje dane są w przybliżeniu symetryczne, a wartości odstające są minimalne, ponieważ daje ona tradycyjną średnią. Wybierz medianę, gdy twój zbiór danych jest asymetryczny lub zawiera wartości skrajne, ponieważ podaje ona wartość centralną, która lepiej odzwierciedla typową wartość.
Powiązane porównania
Algebra kontra geometria
Podczas gdy algebra koncentruje się na abstrakcyjnych regułach działań i manipulowaniu symbolami w celu znalezienia niewiadomych, geometria bada fizyczne właściwości przestrzeni, w tym rozmiar, kształt i względne położenie figur. Razem stanowią one fundament matematyki, tłumacząc relacje logiczne na struktury wizualne.
Ciąg arytmetyczny a geometryczny
swojej istocie ciągi arytmetyczne i geometryczne to dwa różne sposoby powiększania lub zmniejszania listy liczb. Ciąg arytmetyczny zmienia się w stałym, liniowym tempie poprzez dodawanie lub odejmowanie, podczas gdy ciąg geometryczny przyspiesza lub zwalnia wykładniczo poprzez mnożenie lub dzielenie.
Funkcja kontra relacja
W świecie matematyki każda funkcja jest relacją, ale nie każda relacja kwalifikuje się jako funkcja. Podczas gdy relacja opisuje po prostu dowolne powiązanie między dwoma zbiorami liczb, funkcja to uporządkowany podzbiór, który wymaga, aby każde wejście prowadziło do dokładnie jednego konkretnego wyniku.
Funkcje jeden do jednego a funkcje na
Chociaż oba terminy opisują sposób mapowania elementów między dwoma zbiorami, odnoszą się one do różnych stron równania. Funkcje jeden do jednego (injekcyjne) koncentrują się na jednoznaczności danych wejściowych, zapewniając, że żadne dwie ścieżki nie prowadzą do tego samego celu, podczas gdy funkcje on (surjektywne) zapewniają, że każdy możliwy cel zostanie faktycznie osiągnięty.
Gradient kontra dywergencja
Gradient i dywergencja to podstawowe operatory w rachunku wektorowym, które opisują, jak pola zmieniają się w przestrzeni. Podczas gdy gradient przekształca pole skalarne w pole wektorowe skierowane w stronę najszybszego wzrostu, dywergencja kompresuje pole wektorowe do wartości skalarnej, która mierzy przepływ wypadkowy lub siłę „źródła” w określonym punkcie.