Comparthing Logo
statystykaanaliza danychmatematykaedukacja

Średnia a odchylenie standardowe

Choć oba stanowią fundamentalne filary statystyki, opisują zupełnie inne cechy zbioru danych. Średnia identyfikuje centralny punkt równowagi lub wartość średnią, natomiast odchylenie standardowe mierzy, jak bardzo poszczególne punkty danych odbiegają od tego punktu, zapewniając kluczowy kontekst dotyczący spójności lub zmienności informacji.

Najważniejsze informacje

  • Średnia informuje „co”, a odchylenie standardowe „jak bardzo” jest zróżnicowane.
  • Średnia może być taka sama dla dwóch grup, które wyglądają zupełnie inaczej.
  • Odchylenie standardowe to w zasadzie średnia odległość każdego punktu od średniej.
  • Bez obu liczb podsumowanie statystyczne jest często niekompletne lub wręcz mylące.

Czym jest Mieć na myśli?

Średnia arytmetyczna zbioru danych, obliczana poprzez zsumowanie wszystkich wartości i podzielenie ich przez całkowitą liczbę.

  • Działa jako środek geometryczny lub „punkt równowagi” rozkładu liczbowego.
  • Obliczenia uwzględniają każdą pojedynczą wartość w obrębie konkretnego zestawu danych.
  • Wartości odstające lub ekstremalne mogą znacząco odbiegać od większości danych.
  • Na idealnie symetrycznej krzywej dzwonowej pokrywa się ona dokładnie z medianą i modą.
  • Statystycy oznaczają wersję populacji grecką literą mu (μ).

Czym jest Odchylenie standardowe?

Metryka określająca ilość zmienności lub rozproszenia w zbiorze wartości danych.

  • Niskie wartości oznaczają, że punkty danych znajdują się bardzo blisko obliczonej średniej.
  • Wyraża się ją w tych samych jednostkach fizycznych, w jakich mierzone są oryginalne dane.
  • Wartość oblicza się poprzez wyciągnięcie pierwiastka kwadratowego z wariancji.
  • Wysokie wartości sugerują duże rozproszenie, co oznacza mniejszą przewidywalność danych.
  • Grecka litera sigma (σ) jest standardowym symbolem używanym do oznaczania odchylenia populacji.

Tabela porównawcza

Funkcja Mieć na myśli Odchylenie standardowe
Główny cel Zlokalizuj środek Zmierz rozprzestrzenianie się
Wrażliwość na wartości odstające Wysoki (łatwo go przechylić) Wysoka (skrajności zwiększają wartość)
Symbol matematyczny μ (Mu) lub x̄ (x-bar) σ (Sigma) lub s
Jednostki miary To samo co dane To samo co dane
Wynik zera Średnia wynosi zero Wszystkie punkty danych są identyczne
Kluczowa aplikacja Określanie ogólnej wydajności Ocena ryzyka i spójności

Szczegółowe porównanie

Centralność kontra rozproszenie

Średnia wskazuje, gdzie znajduje się „środek” danych, oferując szybki podgląd poziomu ogólnego. Natomiast odchylenie standardowe ignoruje położenie środka, koncentrując się wyłącznie na różnicach między liczbami. Możesz mieć dwie grupy o identycznej średniej 50, ale jeśli jedna grupa ma zakres od 49 do 51, a druga od 0 do 100, odchylenie standardowe jest jedynym narzędziem, które ujawnia tę ogromną różnicę w rzetelności.

Wrażliwość na wartości ekstremalne

Obie metryki odczuwają ciężar wartości odstających, ale reagują w odmienny sposób. Wyjątkowo wysoka wartość podniesie średnią, potencjalnie tworząc mylący obraz „typowego” doświadczenia. Ta sama wartość odstająca powoduje gwałtowny wzrost odchylenia standardowego, sygnalizując badaczowi, że dane są zaszumione, a średnia może nie być wiarygodnym odzwierciedleniem całej grupy.

Rola w rozkładzie normalnym

Patrząc na krzywą dzwonową, te dwa czynniki działają w tandemie, definiując kształt. Średnia określa, gdzie na osi poziomej znajduje się szczyt krzywej. Odchylenie standardowe kontroluje szerokość; małe odchylenie tworzy wysoki, wąski szpic, a duże odchylenie rozciąga krzywą w krótki, gruby wzgórek. Razem pozwalają nam przewidzieć, że około 68% danych mieści się w odległości jednego „kroku” od środka.

Praktyczne podejmowanie decyzji

W świecie rzeczywistym średnia jest często wykorzystywana do wyznaczania celów, takich jak docelowa średnia sprzedaży. Jednak odchylenie standardowe to narzędzie, którego specjaliści używają do zarządzania ryzykiem. Na przykład, osoba dojeżdżająca do pracy może wybrać trasę autobusową o nieco dłuższym średnim czasie podróży, jeśli ma ona bardzo niskie odchylenie standardowe, ponieważ gwarantuje to, że rzeczywiście dotrze na czas każdego dnia, zamiast narażać się na nieprzewidywalne wahania.

Zalety i wady

Mieć na myśli

Zalety

  • + Łatwe do obliczenia
  • + Bardzo intuicyjne
  • + Wykorzystuje wszystkie dane
  • + Dobre do porównań

Zawartość

  • Podatny na wartości odstające
  • Wprowadzanie w błąd za pomocą przekłamanych danych
  • Może to być wartość nieistniejąca
  • Ukrywa wewnętrzną różnorodność

Odchylenie standardowe

Zalety

  • + Pokazuje wiarygodność danych
  • + Zachowuje oryginalne jednostki
  • + Kluczowe dla prawdopodobieństwa
  • + Identyfikuje zmienność

Zawartość

  • Trudniej obliczyć ręcznie
  • Bez sensu bez umiaru
  • Dotknięty ekstremami
  • Wymaga dużych próbek

Częste nieporozumienia

Mit

Średnia 80 oznacza, że większość osób uzyskała wynik 80.

Rzeczywistość

Średnia jest tylko punktem równowagi; jest możliwe, że nikt nie uzyskał wyniku 80, jeśli dane są podzielone między wartości bardzo wysokie i bardzo niskie.

Mit

Odchylenie standardowe może być liczbą ujemną.

Rzeczywistość

Ponieważ wzór polega na podniesieniu różnic do kwadratu od średniej, wynik zawsze wynosi zero lub jest dodatni. Wartość ujemna jest matematycznie niemożliwa.

Mit

Wysokie odchylenie standardowe zawsze jest czymś złym.

Rzeczywistość

To po prostu wskazuje na różnorodność. W klasie wysokie odchylenie standardowe w zainteresowaniach to świetna sprawa, nawet jeśli dla producenta próbującego wyprodukować identyczne śruby może to być stresujące.

Mit

Można obliczyć odchylenie standardowe, nie znając średniej.

Rzeczywistość

Średnia jest wymaganym składnikiem wzoru. Najpierw musisz znać położenie środka, zanim zmierzysz, jak daleko od niego znajdują się wszystkie elementy.

Często zadawane pytania

Dlaczego posługujemy się odchyleniem standardowym, a nie tylko zakresem?
Zakres uwzględnia tylko dwie skrajne wartości, co może być mylące, jeśli są to po prostu przypadkowe odchylenia. Odchylenie standardowe jest znacznie bardziej niezawodne, ponieważ uwzględnia położenie każdego punktu danych. Daje to poczucie „gęstości” danych, a nie tylko ich zewnętrznych granic.
Czy dwa różne zestawy danych mogą mieć tę samą średnią i różne odchylenia standardowe?
Zdecydowanie, i to dzieje się nieustannie w realnym świecie. Wyobraź sobie dwa miasta ze średnią temperaturą 70 stopni. W jednym temperatura może utrzymywać się między 68 a 72 stopniami przez cały rok (małe odchylenie), podczas gdy w drugim waha się między 20 a 120 stopniami (duże odchylenie). Średnia jest taka sama, ale doświadczenie życiowe jest zupełnie inne.
Czy niskie odchylenie standardowe oznacza, że dane są „dokładne”?
Niekoniecznie. Oznacza to, że dane są „precyzyjne” lub spójne. Waga mogłaby się zepsuć i zawsze ważyć o 5 funtów za dużo. Odchylenie standardowe byłoby niskie, ponieważ wyniki są spójne, ale średnia byłaby niedokładna w porównaniu z rzeczywistą wagą.
Który z nich jest ważniejszy przy inwestowaniu?
Inwestorzy korzystają z obu, ale często uważniej obserwują odchylenie standardowe, ponieważ reprezentuje ono „ryzyko”. Średnia wskazuje oczekiwany zwrot, a odchylenie standardowe informuje o tym, jak bardzo ten zwrot może się wahać. Wysokie odchylenie oznacza wyboistą drogę z większym prawdopodobieństwem tymczasowych strat.
Jak wartości odstające wpływają na te dwie wartości?
Wartości odstające działają jak magnes na średnią, przyciągając ją do siebie. W przypadku odchylenia standardowego wartość odstająca działa jak wzmacniacz. Ponieważ odległość od średniej jest podnoszona do kwadratu w obliczeniach, pojedynczy, odległy punkt może nieproporcjonalnie zawyżać odchylenie standardowe, sygnalizując duże rozproszenie zbioru danych.
Kiedy powinienem stosować medianę zamiast średniej?
Należy przejść na medianę, gdy dane są „skośne” lub zawierają znaczące wartości odstające, takie jak ceny domów czy pensje. W takich przypadkach kilku miliarderów może sprawić, że średnia będzie wydawać się znacznie wyższa niż rzeczywiste zarobki przeciętnej osoby. Mediana jest „odporna” na takie skrajności.
Czym jest zasada 68-95-99,7?
To przydatna reguła dla rozkładów normalnych. Mówi ona, że 68% danych mieści się w granicach jednego odchylenia standardowego od średniej, 95% w granicach dwóch, a 99,7% w granicach trzech. To skuteczny sposób na sprawdzenie, jak „normalny” lub „dziwny” jest w rzeczywistości konkretny punkt danych.
Czy odchylenie standardowe to to samo co wariancja?
Są one blisko spokrewnione, ale nie to samo. Wariancja to średnia kwadratów różnic od średniej, co daje „kwadratowe jednostki” (jak kwadratowe dolary), które trudno zwizualizować. Bierzemy pierwiastek kwadratowy z wariancji, aby uzyskać odchylenie standardowe, tak aby jednostki ponownie odpowiadały naszym pierwotnym danym.

Wynik

Wybierz średnią, gdy potrzebujesz pojedynczej liczby reprezentatywnej, aby podsumować ogólny poziom grupy. Oprzyj się na odchyleniu standardowym, gdy chcesz zrozumieć wiarygodność tej średniej lub zróżnicowanie w próbie.

Powiązane porównania

Algebra kontra geometria

Podczas gdy algebra koncentruje się na abstrakcyjnych regułach działań i manipulowaniu symbolami w celu znalezienia niewiadomych, geometria bada fizyczne właściwości przestrzeni, w tym rozmiar, kształt i względne położenie figur. Razem stanowią one fundament matematyki, tłumacząc relacje logiczne na struktury wizualne.

Ciąg arytmetyczny a geometryczny

swojej istocie ciągi arytmetyczne i geometryczne to dwa różne sposoby powiększania lub zmniejszania listy liczb. Ciąg arytmetyczny zmienia się w stałym, liniowym tempie poprzez dodawanie lub odejmowanie, podczas gdy ciąg geometryczny przyspiesza lub zwalnia wykładniczo poprzez mnożenie lub dzielenie.

Funkcja kontra relacja

W świecie matematyki każda funkcja jest relacją, ale nie każda relacja kwalifikuje się jako funkcja. Podczas gdy relacja opisuje po prostu dowolne powiązanie między dwoma zbiorami liczb, funkcja to uporządkowany podzbiór, który wymaga, aby każde wejście prowadziło do dokładnie jednego konkretnego wyniku.

Funkcje jeden do jednego a funkcje na

Chociaż oba terminy opisują sposób mapowania elementów między dwoma zbiorami, odnoszą się one do różnych stron równania. Funkcje jeden do jednego (injekcyjne) koncentrują się na jednoznaczności danych wejściowych, zapewniając, że żadne dwie ścieżki nie prowadzą do tego samego celu, podczas gdy funkcje on (surjektywne) zapewniają, że każdy możliwy cel zostanie faktycznie osiągnięty.

Gradient kontra dywergencja

Gradient i dywergencja to podstawowe operatory w rachunku wektorowym, które opisują, jak pola zmieniają się w przestrzeni. Podczas gdy gradient przekształca pole skalarne w pole wektorowe skierowane w stronę najszybszego wzrostu, dywergencja kompresuje pole wektorowe do wartości skalarnej, która mierzy przepływ wypadkowy lub siłę „źródła” w określonym punkcie.