Comparthing Logo
matematykastatystykitendencja centralnaanaliza danych

Średnia vs mediana

Porównanie to wyjaśnia statystyczne pojęcia średniej i mediany, szczegółowo opisując, jak oblicza się każdą z tych miar tendencji centralnej, jak zachowują się one w różnych zbiorach danych oraz kiedy jedna może być bardziej przydatna od drugiej w zależności od rozkładu danych i obecności wartości odstających.

Najważniejsze informacje

  • Średnia i mediana to miary tendencji centralnej, które podsumowują centralny punkt zbioru danych.
  • Średnia jest wrażliwa na każdą pojedynczą wartość, co czyni ją podatną na skrajne punkty danych.
  • Mediana dzieli zbiór danych na dwie równe połowy, dzięki czemu jest odporna na wartości odstające.
  • Średnia jest najlepsza dla zrównoważonych zbiorów danych, podczas gdy mediana jest preferowana w przypadku zbiorów danych skośnych lub nierównomiernych.

Czym jest Oznacza?

Średnia arytmetyczna obliczana przez zsumowanie wartości i podzielenie przez ich liczbę.

  • Kategoria: Miara tendencji centralnej
  • Obliczenie: Suma wszystkich wartości podzielona przez liczbę wartości
  • Czułość: Wpływana przez każdy punkt danych
  • Typowe zastosowanie: Rozkłady symetryczne
  • Wpływ wartości odstających: Bardzo wrażliwy na wartości skrajne

Czym jest Mediana?

Mediana w uporządkowanym zbiorze danych oddzielająca połowę niższą od wyższej.

  • Kategoria: Miara tendencji centralnej
  • Obliczenie: Wartość środkowa po posortowaniu wartości
  • Czułość: Zależy tylko od kolejności wartości
  • Typowe zastosowanie: Zestawy danych o nierównym lub asymetrycznym rozkładzie
  • Wpływ wartości odstających: Odporny na wartości ekstremalne

Tabela porównawcza

FunkcjaOznaczaMediana
DefinicjaŚrednia arytmetyczna wszystkich wartościWartość środkowa w uporządkowanej liście
Metoda obliczaniaSuma wartości ÷ liczbaPosortuj wartości i wybierz punkt środkowy
Wrażliwość na wartości odstająceBardzo wrażliwyOdporny na wartości odstające
Najlepsze dla symetriiTakMniej istotne
Najlepsze dla danych skośnychMniej reprezentatywnyBardziej reprezentatywny
Wymaga zamówieniaNieTak
Typowy przykład użyciaŚredni wynik testuMediana dochodu gospodarstw domowych

Szczegółowe porównanie

Podstawowe obliczenia

Średnia jest obliczana poprzez zsumowanie wszystkich liczb w zbiorze danych i podzielenie tej sumy przez liczbę elementów, co daje centralną wartość liczbową. Natomiast mediana jest wyznaczana poprzez uporządkowanie wartości od najniższej do najwyższej i wybranie wartości środkowej lub uśrednienie dwóch środkowych wartości, jeśli liczba elementów jest parzysta.

Wpływ wartości odstających

Średnia uwzględnia wszystkie wartości w równym stopniu, więc skrajnie wysokie lub niskie wartości silnie wpływają na jej wynik, co może prowadzić do błędnego przedstawienia typowej wartości w danych o asymetrycznym rozkładzie. Mediana ignoruje, jak duże lub małe są wartości poza ich kolejnością, dzięki czemu jest mniej podatna na wpływ wartości skrajnych i często bardziej pouczająca w przypadku rozkładów asymetrycznych.

Wpływ kształtu rozkładu

W zbiorach danych symetrycznych, pozbawionych wartości ekstremalnych, średnia i mediana często pokrywają się i obie dobrze opisują centrum zbioru. Jednak w rozkładach z długim ogonem po jednej stronie średnia przesuwa się w kierunku ogona, podczas gdy mediana pozostaje w miejscu, gdzie połowa danych znajduje się powyżej, a połowa poniżej, oferując odmienną perspektywę.

Wymagania obliczeniowe

Średnia jest prosta do obliczenia bez sortowania, co może być szybsze dla prostych list lub obliczeń w czasie rzeczywistym. Mediana wymaga najpierw posortowania wartości, co może wprowadzać dodatkowe obciążenie obliczeniowe dla bardzo dużych list, ale daje wartość centralną niewrażliwą na wielkość wartości odstających.

Zalety i wady

Oznaczać

Zalety

  • +Łatwy do obliczenia
  • +Wykorzystuje wszystkie punkty danych
  • +Standard dla wielu analiz
  • +Konwencjonalnie matematycznie

Zawartość

  • Zniekształcone przez wartości odstające
  • Nieodzwierciedlające przekłamanych danych
  • Wymaga danych liczbowych
  • Może wprowadzać w błąd w skrajnych przypadkach

Mediana

Zalety

  • +Odporny na wartości odstające
  • +Odbija typową wartość
  • +Przydatne dla danych o niesymetrycznym rozkładzie
  • +Dotyczy uporządkowanych zbiorów danych

Zawartość

  • Wymaga sortowania
  • Ignoruje skrajne wartości wielkości
  • Mniej przydatne w przypadku danych symetrycznych
  • Nakład obliczeniowy

Częste nieporozumienia

Mit

Średnia i mediana zawsze dają ten sam wynik.

Rzeczywistość

Średnia i mediana pokrywają się tylko wtedy, gdy dane są mniej więcej symetryczne i nie zawierają wartości skrajnych; w przypadku danych skośnych lub nierównomiernych mogą się one znacznie różnić.

Mit

Średnia arytmetyczna jest zawsze najlepszą miarą średniej.

Rzeczywistość

Średnia to konwencjonalna wartość przeciętna, ale może wprowadzać w błąd przy danych skośnych lub wartościach odstających, gdzie mediana często lepiej odzwierciedla typową wartość zbioru danych.

Mit

Median ignoruje ważne dane.

Rzeczywistość

Median nie ignoruje danych; koncentruje się na pozycji centralnej i celowo redukuje wpływ wartości odstających, aby dostarczyć solidną wartość centralną.

Mit

Median nie działa z zestawami danych o parzystej liczbie elementów.

Rzeczywistość

Dla zbiorów danych o parzystej liczbie elementów mediana jest obliczana jako średnia dwóch środkowych wartości po posortowaniu, więc nadal definiuje punkt centralny.

Często zadawane pytania

Co właściwie oznacza średnia w statystyce?
W statystyce średnia to średnia arytmetyczna zbioru liczb. Sumujesz wszystkie wartości w zestawie, a następnie dzielisz przez liczbę tych wartości, uzyskując pojedynczą reprezentatywną liczbę dla danych.
Jak znaleźć medianę zbioru danych?
Aby znaleźć medianę, najpierw uporządkuj dane od najmniejszej do największej. Jeśli liczba wartości jest nieparzysta, mediana jest wartością środkową; jeśli parzysta, jest to średnia dwóch środkowych wartości po uporządkowaniu.
Dlaczego mediana może być lepsza od średniej?
Mediana może być lepsza, gdy zbiór danych zawiera wartości skrajne lub ma asymetryczny rozkład, ponieważ nie jest ona zależna od tego, jak bardzo wartości odstające się różnią, co pomaga bardziej wiarygodnie reprezentować typową wartość.
Czy średnia i mediana mogą być równe?
Tak, średnia i mediana mogą być równe, gdy dane są symetryczne, a wartości odstające minimalne, na przykład w idealnie zrównoważonym rozkładzie.
Które jest częściej używane w codziennym życiu?
Średnia jest częściej używana w codziennych kontekstach jako prosta średnia, ale mediana jest często stosowana w rzeczywistych statystykach, takich jak dochody czy ceny mieszkań, gdzie występują wartości odstające.
Czy mediana ignoruje punkty danych?
Median nie ignoruje punktów danych; wykorzystuje kolejność wartości, aby znaleźć centralną pozycję i zmniejsza wpływ wartości skrajnych, koncentrując się na środku.
Czy Mean jest lepszy dla dużych zbiorów danych?
Średnia sprawdza się dobrze w przypadku dużych zbiorów danych, które są zrównoważone lub symetryczne, ale jeśli zbiór zawiera wartości skrajne, mediana może dać bardziej rzetelny obraz.
Czy średnia i mediana są używane poza lekcjami matematyki?
Zarówno średnia, jak i mediana są szeroko stosowane w dziedzinach takich jak ekonomia, nauki społeczne, analiza danych i badania naukowe do podsumowywania lub opisywania typowych wartości w zbiorach danych.

Wynik

Użyj średniej, gdy twoje dane są w przybliżeniu symetryczne, a wartości odstające są minimalne, ponieważ daje ona tradycyjną średnią. Wybierz medianę, gdy twój zbiór danych jest asymetryczny lub zawiera wartości skrajne, ponieważ podaje ona wartość centralną, która lepiej odzwierciedla typową wartość.

Powiązane porównania

Algebra kontra geometria

Podczas gdy algebra koncentruje się na abstrakcyjnych regułach działań i manipulowaniu symbolami w celu znalezienia niewiadomych, geometria bada fizyczne właściwości przestrzeni, w tym rozmiar, kształt i względne położenie figur. Razem stanowią one fundament matematyki, tłumacząc relacje logiczne na struktury wizualne.

Ciąg arytmetyczny a geometryczny

swojej istocie ciągi arytmetyczne i geometryczne to dwa różne sposoby powiększania lub zmniejszania listy liczb. Ciąg arytmetyczny zmienia się w stałym, liniowym tempie poprzez dodawanie lub odejmowanie, podczas gdy ciąg geometryczny przyspiesza lub zwalnia wykładniczo poprzez mnożenie lub dzielenie.

Funkcja kontra relacja

W świecie matematyki każda funkcja jest relacją, ale nie każda relacja kwalifikuje się jako funkcja. Podczas gdy relacja opisuje po prostu dowolne powiązanie między dwoma zbiorami liczb, funkcja to uporządkowany podzbiór, który wymaga, aby każde wejście prowadziło do dokładnie jednego konkretnego wyniku.

Funkcje jeden do jednego a funkcje na

Chociaż oba terminy opisują sposób mapowania elementów między dwoma zbiorami, odnoszą się one do różnych stron równania. Funkcje jeden do jednego (injekcyjne) koncentrują się na jednoznaczności danych wejściowych, zapewniając, że żadne dwie ścieżki nie prowadzą do tego samego celu, podczas gdy funkcje on (surjektywne) zapewniają, że każdy możliwy cel zostanie faktycznie osiągnięty.

Gradient kontra dywergencja

Gradient i dywergencja to podstawowe operatory w rachunku wektorowym, które opisują, jak pola zmieniają się w przestrzeni. Podczas gdy gradient przekształca pole skalarne w pole wektorowe skierowane w stronę najszybszego wzrostu, dywergencja kompresuje pole wektorowe do wartości skalarnej, która mierzy przepływ wypadkowy lub siłę „źródła” w określonym punkcie.