Comparthing Logo
आंकड़ेडेटा विश्लेषणअंक शास्त्रशिक्षा

माध्य बनाम मानक विचलन

हालांकि दोनों स्टैटिस्टिक्स के बुनियादी पिलर के तौर पर काम करते हैं, लेकिन वे डेटासेट की बिल्कुल अलग-अलग खासियतें बताते हैं। मीन सेंट्रल बैलेंसिंग पॉइंट या एवरेज वैल्यू की पहचान करता है, जबकि स्टैंडर्ड डेविएशन यह मापता है कि अलग-अलग डेटा पॉइंट उस सेंटर से कितना भटकते हैं, जिससे जानकारी की कंसिस्टेंसी या वोलैटिलिटी के बारे में ज़रूरी जानकारी मिलती है।

मुख्य बातें

  • मीन 'क्या' बताता है, जबकि स्टैंडर्ड डेविएशन वेरिएशन के बारे में 'कितना' बताता है।
  • एक मीन दो ग्रुप्स के लिए एक जैसा हो सकता है जो देखने में बिल्कुल अलग दिखते हैं।
  • स्टैंडर्ड डेविएशन असल में हर पॉइंट की मीन से औसत दूरी है।
  • दोनों नंबरों के बिना, स्टैटिस्टिकल समरी अक्सर अधूरी या धोखा देने वाली होती है।

अर्थ क्या है?

किसी डेटासेट का अरिथमेटिक एवरेज, जिसे सभी वैल्यू को जोड़कर और टोटल काउंट से डिवाइड करके कैलकुलेट किया जाता है।

  • यह न्यूमेरिकल डिस्ट्रीब्यूशन के ज्योमेट्रिक सेंटर या 'बैलेंस पॉइंट' के तौर पर काम करता है।
  • कैलकुलेशन में खास डेटासेट की हर एक वैल्यू शामिल होती है।
  • आउटलायर्स या एक्सट्रीम वैल्यूज़, ज़्यादातर डेटा से रिज़ल्ट को काफ़ी अलग कर सकते हैं।
  • एक पूरी तरह से सिमेट्रिकल बेल कर्व में, यह मीडियन और मोड के साथ बिल्कुल अलाइन होता है।
  • स्टैटिस्टिशियन पॉपुलेशन वर्शन को ग्रीक अक्षर mu (μ) से दिखाते हैं।

मानक विचलन क्या है?

एक मेट्रिक जो डेटा वैल्यू के एक सेट में वेरिएशन या डिस्पर्शन की मात्रा को मापता है।

  • कम वैल्यू यह बताते हैं कि डेटा पॉइंट कैलकुलेटेड मीन के बहुत करीब हैं।
  • इसे उन्हीं फिजिकल यूनिट्स में दिखाया जाता है, जिनमें मापा जा रहा ओरिजिनल डेटा होता है।
  • वैल्यू वैरिएंस का स्क्वेयर रूट लेकर निकाली जाती है।
  • ज़्यादा वैल्यू का मतलब है कि डेटा का स्प्रेड बहुत बड़ा है, जो डेटा में कम प्रेडिक्टेबिलिटी दिखाता है।
  • ग्रीक अक्षर सिग्मा (σ) पॉपुलेशन डेविएशन के लिए इस्तेमाल किया जाने वाला स्टैंडर्ड सिंबल है।

तुलना तालिका

विशेषता अर्थ मानक विचलन
प्राथमिक उद्देश्य केंद्र का पता लगाएँ प्रसार को मापें
आउटलायर्स के प्रति संवेदनशीलता उच्च (आसानी से तिरछा हो सकता है) ज़्यादा (ज़्यादा होने पर वैल्यू बढ़ जाती है)
गणितीय प्रतीक μ (Mu) या x̄ (x-बार) σ (सिग्मा) या s
माप की इकाइयाँ डेटा के समान डेटा के समान
शून्य का परिणाम औसत शून्य है सभी डेटा पॉइंट एक जैसे हैं
मुख्य आवेदन सामान्य प्रदर्शन का निर्धारण जोखिम और स्थिरता का आकलन

विस्तृत तुलना

केंद्रीयता बनाम फैलाव

मीन आपको बताता है कि आपके डेटा का 'बीच का हिस्सा' कहाँ है, जो आम लेवल का एक छोटा सा स्नैपशॉट देता है। इसके उलट, स्टैंडर्ड डेविएशन सेंटर की जगह को नज़रअंदाज़ करके पूरी तरह से नंबरों के बीच के गैप पर फ़ोकस करता है। आपके पास 50 के एक जैसे मीन वाले दो ग्रुप हो सकते हैं, लेकिन अगर एक ग्रुप 49 से 51 के बीच है और दूसरा 0 से 100 के बीच है, तो स्टैंडर्ड डेविएशन ही एकमात्र टूल है जो भरोसे में इस बड़े अंतर को दिखाता है।

चरम मूल्यों के प्रति संवेदनशीलता

दोनों मेट्रिक्स आउटलायर्स का वज़न महसूस करते हैं, लेकिन वे अलग-अलग तरीकों से रिएक्ट करते हैं। एक बहुत ज़्यादा संख्या मीन को ऊपर खींचेगी, जिससे 'टिपिकल' अनुभव की शायद गुमराह करने वाली तस्वीर बनेगी। वही आउटलायर स्टैंडर्ड डेविएशन को तेज़ी से बढ़ाता है, जिससे रिसर्चर को सिग्नल मिलता है कि डेटा नॉइज़ी है और मीन पूरे ग्रुप का भरोसेमंद रिप्रेजेंटेटिव नहीं हो सकता है।

सामान्य वितरण में भूमिका

बेल कर्व को देखते समय, ये दोनों मिलकर शेप तय करते हैं। मीन यह तय करता है कि हॉरिजॉन्टल एक्सिस पर कर्व का पीक कहाँ होगा। स्टैंडर्ड डेविएशन चौड़ाई को कंट्रोल करता है; एक छोटा डेविएशन एक लंबा, पतला स्पाइक बनाता है, जबकि एक बड़ा डेविएशन कर्व को एक छोटे, मोटे टीले में खींचता है। साथ में, ये हमें यह अनुमान लगाने देते हैं कि लगभग 68% डेटा सेंटर के एक 'स्टेप' के अंदर आता है।

व्यावहारिक निर्णय लेना

असल दुनिया में, मीन का इस्तेमाल अक्सर गोल के लिए किया जाता है, जैसे टारगेट सेल्स एवरेज। लेकिन, स्टैंडर्ड डेविएशन वह है जिसका इस्तेमाल प्रोफेशनल रिस्क मैनेज करने के लिए करते हैं। उदाहरण के लिए, अगर कोई कम्यूटर का स्टैंडर्ड डेविएशन बहुत कम है, तो वह थोड़े ज़्यादा मीन ट्रैवल टाइम वाला बस रूट चुन सकता है, क्योंकि इससे यह पक्का होता है कि वे हर दिन समय पर पहुँचेंगे, न कि अचानक होने वाले उतार-चढ़ाव से निपटना पड़ेगा।

लाभ और हानि

अर्थ

लाभ

  • + गणना करना आसान है
  • + बहुत सहज
  • + सभी डेटा का उपयोग करता है
  • + तुलना के लिए अच्छा

सहमत

  • आउटलायर्स के प्रति संवेदनशील
  • गलत डेटा में गुमराह करने वाला
  • यह एक गैर-मौजूद मान हो सकता है
  • आंतरिक विविधता को छुपाता है

मानक विचलन

लाभ

  • + डेटा विश्वसनीयता दिखाता है
  • + मूल इकाइयों को बनाए रखता है
  • + संभावना के लिए महत्वपूर्ण
  • + अस्थिरता की पहचान करता है

सहमत

  • मैन्युअल रूप से गणना करना कठिन है
  • मतलब के बिना अर्थहीन
  • अतिवाद से प्रभावित
  • बड़े नमूनों की आवश्यकता है

सामान्य भ्रांतियाँ

मिथ

80 का मतलब है कि ज़्यादातर लोगों ने 80 स्कोर किया।

वास्तविकता

मीन सिर्फ़ एक बैलेंस पॉइंट है; अगर डेटा बहुत ज़्यादा और बहुत कम वैल्यू के बीच बंटा हुआ है, तो किसी के लिए भी असल में 80 स्कोर करना मुमकिन नहीं है।

मिथ

स्टैंडर्ड डेविएशन एक नेगेटिव नंबर हो सकता है।

वास्तविकता

क्योंकि फ़ॉर्मूला में मीन से अंतर का स्क्वेयर निकालना शामिल है, इसलिए नतीजा हमेशा ज़ीरो या पॉज़िटिव होता है। नेगेटिव वैल्यू मैथमेटिकली नामुमकिन है।

मिथ

ज़्यादा स्टैंडर्ड डेविएशन हमेशा एक 'बुरी' चीज़ होती है।

वास्तविकता

यह बस वैरायटी दिखाता है। क्लासरूम में, इंटरेस्ट में हाई स्टैंडर्ड डेविएशन बहुत अच्छा होता है, भले ही यह एक जैसे बोल्ट बनाने की कोशिश कर रहे मैन्युफैक्चरर के लिए स्ट्रेसफुल हो।

मिथ

आप मीन जाने बिना भी स्टैंडर्ड डेविएशन कैलकुलेट कर सकते हैं।

वास्तविकता

फ़ॉर्मूला में मीन एक ज़रूरी चीज़ है। आपको पहले यह जानना होगा कि सेंटर कहाँ है, इससे पहले कि आप यह माप सकें कि सब कुछ उससे कितनी दूर है।

अक्सर पूछे जाने वाले सवाल

हम सिर्फ़ रेंज के बजाय स्टैंडर्ड डेविएशन का इस्तेमाल क्यों करते हैं?
रेंज सिर्फ़ दो सबसे ज़्यादा एक्सट्रीम वैल्यू को देखती है, जो धोखा दे सकती हैं अगर वे सिर्फ़ रैंडम फ़्लूक हों। स्टैंडर्ड डेविएशन ज़्यादा मज़बूत है क्योंकि यह देखता है कि हर एक डेटा पॉइंट कहाँ है। यह आपको डेटा की 'डेंसिटी' का अंदाज़ा देता है, सिर्फ़ बाहरी बाउंड्री का नहीं।
क्या दो अलग-अलग डेटासेट का मीन एक जैसा और स्टैंडर्ड डेविएशन अलग-अलग हो सकता है?
बिल्कुल, और असल दुनिया में ऐसा हर समय होता है। सोचिए दो शहर हैं जिनका औसत तापमान 70 डिग्री है। एक शहर का तापमान पूरे साल 68 और 72 के बीच रहता है (कम डेविएशन), जबकि दूसरे शहर का तापमान 20 और 120 के बीच रहता है (ज़्यादा डेविएशन)। औसत वही है, लेकिन रहने का अनुभव बिल्कुल अलग है।
क्या कम स्टैंडर्ड डेविएशन का मतलब है कि डेटा 'सही' है?
ज़रूरी नहीं। इसका मतलब है कि डेटा 'सही' या एक जैसा है। आपके पास एक ऐसा स्केल हो सकता है जो टूटा हुआ हो और हमेशा 5 पाउंड ज़्यादा भारी चीज़ें तौलता हो। स्टैंडर्ड डेविएशन कम होगा क्योंकि नतीजे एक जैसे हैं, लेकिन असली वज़न की तुलना में मीन गलत होगा।
इन्वेस्टिंग के लिए कौन सा ज़्यादा ज़रूरी है?
इन्वेस्टर दोनों का इस्तेमाल करते हैं, लेकिन वे अक्सर स्टैंडर्ड डेविएशन पर ज़्यादा ध्यान देते हैं क्योंकि यह 'रिस्क' दिखाता है। मीन आपको एक्सपेक्टेड रिटर्न बताता है, लेकिन स्टैंडर्ड डेविएशन आपको बताता है कि उस रिटर्न में कितना उतार-चढ़ाव हो सकता है। ज़्यादा डेविएशन का मतलब है उतार-चढ़ाव वाला सफ़र जिसमें कुछ समय के लिए नुकसान होने की ज़्यादा संभावना होती है।
आउटलायर्स इन दो मेट्रिक्स को कैसे प्रभावित करते हैं?
आउटलायर्स मीन के लिए एक मैग्नेट की तरह होते हैं, जो उसे अपनी ओर खींचते हैं। स्टैंडर्ड डेविएशन के लिए, एक आउटलायर एक एम्पलीफायर की तरह काम करता है। क्योंकि कैलकुलेशन में मीन से दूरी का स्क्वेयर किया जाता है, इसलिए एक दूर का पॉइंट स्टैंडर्ड डेविएशन को बहुत ज़्यादा बढ़ा सकता है, जिससे यह पता चलता है कि डेटा सेट बहुत ज़्यादा फैला हुआ है।
मुझे मीन के बजाय मीडियन का इस्तेमाल कब करना चाहिए?
जब आपका डेटा 'तिरछा' हो या उसमें बहुत ज़्यादा आउटलायर्स हों, जैसे घर की कीमतें या सैलरी, तो आपको मीडियन पर स्विच करना चाहिए। ऐसे मामलों में, कुछ अरबपति मीन को एक आम आदमी की असल कमाई से बहुत ज़्यादा दिखा सकते हैं। मीडियन इन एक्सट्रीम्स के लिए 'रेज़िस्टेंट' होता है।
68-95-99.7 नियम क्या है?
यह नॉर्मल डिस्ट्रीब्यूशन के लिए एक काम का नियम है। यह बताता है कि आपका 68% डेटा मीन के एक स्टैंडर्ड डेविएशन के अंदर आएगा, 95% दो के अंदर, और 99.7% तीन के अंदर। यह देखने का एक असरदार तरीका है कि कोई खास डेटा पॉइंट असल में कितना 'नॉर्मल' या 'अजीब' है।
क्या स्टैंडर्ड डेविएशन और वैरिएंस एक ही हैं?
वे बहुत करीब से जुड़े हुए हैं, लेकिन एक जैसे नहीं हैं। वैरिएंस, मीन से स्क्वेयर्ड डिफरेंस का एवरेज है, जिससे 'स्क्वेयर्ड यूनिट्स' (जैसे स्क्वेयर डॉलर) बनते हैं, जिन्हें देखना मुश्किल होता है। हम स्टैंडर्ड डेविएशन पाने के लिए वैरिएंस का स्क्वेयर रूट लेते हैं ताकि यूनिट्स हमारे ओरिजिनल डेटा से फिर से मैच करें।

निर्णय

जब आपको किसी ग्रुप के ओवरऑल लेवल को बताने के लिए एक सिंगल रिप्रेजेंटेटिव नंबर की ज़रूरत हो, तो मीन चुनें। जब आपको उस एवरेज की रिलायबिलिटी या अपने सैंपल में डाइवर्सिटी को समझना हो, तो स्टैंडर्ड डेविएशन पर भरोसा करें।

संबंधित तुलनाएं

अंकगणित बनाम ज्यामितीय अनुक्रम

असल में, अरिथमेटिक और जियोमेट्रिक सीक्वेंस नंबरों की लिस्ट को बढ़ाने या घटाने के दो अलग-अलग तरीके हैं। एक अरिथमेटिक सीक्वेंस जोड़ने या घटाने से एक जैसी, सीधी रफ़्तार से बदलता है, जबकि एक जियोमेट्रिक सीक्वेंस गुणा या भाग से तेज़ी से बढ़ता या घटता है।

अंकगणितीय माध्य बनाम भारित माध्य

अरिथमेटिक मीन हर डेटा पॉइंट को फ़ाइनल एवरेज में बराबर योगदान देने वाला मानता है, जबकि वेटेड मीन अलग-अलग वैल्यू को खास लेवल का महत्व देता है। इस अंतर को समझना सिंपल क्लास एवरेज कैलकुलेट करने से लेकर कॉम्प्लेक्स फ़ाइनेंशियल पोर्टफ़ोलियो तय करने तक, हर चीज़ के लिए ज़रूरी है, जहाँ कुछ एसेट दूसरों की तुलना में ज़्यादा ज़रूरी होते हैं।

अभाज्य संख्या बनाम संयुक्त संख्या

यह तुलना अभाज्य और संयुक्त संख्याओं की परिभाषाओं, गुणों, उदाहरणों और अंतरों को स्पष्ट करती है, जो प्राकृतिक संख्याओं की दो मूलभूत श्रेणियां हैं। यह बताता है कि उन्हें कैसे पहचाना जाता है, वे गुणनखंडन में कैसे व्यवहार करते हैं, और बुनियादी संख्या सिद्धांत में उन्हें पहचानने का महत्व क्यों है।

अभिसारी बनाम अपसारी श्रृंखला

कन्वर्जेंट और डाइवर्जेंट सीरीज़ के बीच का अंतर यह तय करता है कि नंबरों का एक अनंत जोड़ एक खास, सीमित वैल्यू पर आता है या अनंत की ओर भटक जाता है। जबकि एक कन्वर्जेंट सीरीज़ अपने टर्म्स को धीरे-धीरे 'सिकुड़ती' है जब तक कि उनका टोटल एक स्थिर लिमिट तक नहीं पहुँच जाता, एक डाइवर्जेंट सीरीज़ स्थिर नहीं हो पाती, या तो बिना किसी सीमा के बढ़ती रहती है या हमेशा ऑसिलेट करती रहती है।

कर्व बनाम परिमेय संख्या

कर्स्ड और रैशनल नंबरों के बीच की सीमा उन नंबरों के बीच का अंतर बताती है जिन्हें साफ-साफ फ्रैक्शन के तौर पर दिखाया जा सकता है और उन नंबरों के बीच जो इनफिनिट, नॉन-रिपीटिंग डेसिमल में बदल जाते हैं। जबकि रैशनल नंबर सिंपल डिवीज़न के साफ नतीजे होते हैं, कर्स्ड उन इंटीजर के रूट को दिखाते हैं जिन्हें फाइनाइट या रिपीटिंग फॉर्म में बदलना मना है।