गणितआकडेवारीमध्य प्रवृत्तीडेटा-अनॅलिसिस

मीन व मध्यक

हे तुलनात्मक विवरण मध्य आणि मध्यक या सांख्यिकीय संकल्पनांचे स्पष्टीकरण देते, प्रत्येक केंद्रीय प्रवृत्तीच्या मापाची गणना कशी केली जाते, विविध डेटासेट्समध्ये त्यांचे वर्तन कसे असते आणि डेटाच्या वितरण तसेच बाह्यमूल्यांच्या उपस्थितीनुसार एक दुसऱ्यापेक्षा अधिक माहितीपूर्ण कधी असू शकते याबद्दल तपशीलवार माहिती देते.

ठळक मुद्दे

मीन आणि मेडियन हे डेटासेटच्या मध्यवर्ती बिंदूचे सारांश देणारे केंद्रीय प्रवृत्तीचे माप आहेत.
प्रत्येक वैयक्तिक मूल्यामुळे मध्यमानावर परिणाम होतो, ज्यामुळे ते अतिरेकी डेटा बिंदूंना संवेदनशील असते.
डेटासेटला मध्यमाने दोन समान भागांमध्ये विभाजित करते, ज्यामुळे ते बाह्य मूल्यांना प्रतिरोधक असते.
संतुलित डेटासेटसाठी मीन सर्वोत्तम आहे तर तिरपे किंवा असमान डेटासेटसाठी मेडियनला प्राधान्य दिले जाते.

मीन काय आहे?

मूल्यांची बेरीज करून संख्येने भागून मिळवलेले अंकगणितीय सरासरी.

केंद्रीय प्रवृत्तीचे मापन
गणना: सर्व मूल्यांची बेरीज मूल्यांच्या संख्येने भागलेली
संवेदनशीलता: प्रत्येक डेटा पॉइंटने प्रभावित
ठराविक वापर: सममितीय वितरणे
आउटलायर्सचा परिणाम: अतिशय मूल्यांना अत्यंत संवेदनशील

मध्यक काय आहे?

क्रमबद्ध डेटासेटमधील कमी आणि जास्त अर्ध्या भागांना वेगळे करणारे मध्यम मूल्य.

केंद्रीय प्रवृत्तीचे मापन
गणना: मूल्ये क्रमवारीत लावल्यावर मधले मूल्य
संवेदनशीलता: मूल्यांच्या क्रमावरच अवलंबून असते
ठराविक वापर: तिरपे किंवा असमान डेटासेट्स
आउटलायर्सचा प्रभाव: अतिरेकी मूल्यांविरुद्ध मजबूत

तुलना सारणी

वैशिष्ट्ये	मीन	मध्यक
व्याख्या	सर्व मूल्यांचे अंकगणितीय सरासरी	क्रमित यादीतील मध्यम मूल्य
गणन पद्धती	मूल्यांची बेरीज ÷ संख्या	मूल्ये क्रमवारीत करा आणि मध्यबिंदू निवडा
आउटलायर संवेदनशीलता	अत्यंत संवेदनशील	बाह्य मूल्यांना प्रतिरोधक
सममितीसाठी सर्वोत्तम	होय	कमी प्रासंगिक
सांख्यिकीय तिरपे डेटासाठी सर्वोत्तम	कमी प्रतिनिधित्व असलेले	अधिक प्रतिनिधिक
ऑर्डर करणे आवश्यक आहे	नाही	होय
ठराविक उदाहरण वापर	सरासरी चाचणी गुणांकन	मध्यम कुटुंब उत्पन्न

तपशीलवार तुलना

मूलभूत गणना

डेटासेटमधील सर्व संख्या जोडून आणि एकूण संख्येच्या प्रमाणात भागून मध्यमान काढले जाते, ज्यामुळे एक केंद्रीय संख्यात्मक सरासरी मिळते. याउलट, मध्यक ठरवण्यासाठी मूल्ये कमी ते जास्त क्रमाने लावली जातात आणि मध्यम मूल्य निवडले जाते, किंवा एकूण संख्या सम असल्यास दोन मध्यम मूल्यांची सरासरी केली जाते.

आउटलायर्सचा प्रभाव

मीन सर्व मूल्यांना समान महत्त्व देते त्यामुळे अतिशय उच्च किंवा कमी मूल्ये त्याच्या निकालावर मोठा परिणाम करतात, ज्यामुळे तिरप्या डेटामध्ये ठराविक मूल्य चुकीचे दाखवले जाऊ शकते. मध्यक मूल्ये किती मोठी किंवा लहान आहेत याकडे दुर्लक्ष करते, त्यांच्या क्रमाच्या पलीकडे, ज्यामुळे ती अतिशय मूल्यांपासून कमी प्रभावित होते आणि तिरप्या वितरणात अनेकदा अधिक माहितीपूर्ण असते.

वितरण आकाराचा प्रभाव

सममितीय डेटासेटमध्ये अत्यंत मूल्ये नसल्यास, सरासरी आणि मध्यक अनेकदा जवळजवळ जुळतात आणि दोन्ही डेटासेटच्या केंद्राचे चांगले वर्णन करतात. मात्र, एका बाजूला लांब शेपटी असलेल्या वितरणामध्ये सरासरी शेपटीकडे सरकते, तर मध्यक अर्धा डेटा वर आणि अर्धा खाली असलेल्या ठिकाणी राहतो, ज्यामुळे वेगळा दृष्टिकोन मिळतो.

संगणकीय आवश्यकता

सरासरी क्रम लावल्याशिवाय सोपी गणना करण्यास सोपी असते, जी साध्या यादी किंवा रिअल-टाइम गणनेसाठी जलद असू शकते. मध्यकासाठी प्रथम मूल्ये क्रमवारी लावणे आवश्यक असते, जे खूप मोठ्या याद्यांसाठी संगणकीय ओव्हरहेड वाढवू शकते परंतु बाह्यमूल्यांच्या मोठेपणाने प्रभावित न होणारे मध्यमूल्य देते.

गुण आणि दोष

मीन

गुणदोष

+संगणन करणे सोपे आहे
+सर्व डेटा पॉइंट्सचा वापर करते
+बर्‍याच विश्लेषणांसाठी मानक
+गणितीय पारंपारिक

संरक्षित केले

−आउटलायर्समुळे विकृत झालेले
−असंतुलित डेटाचे प्रतिनिधित्व नाही
−संख्यात्मक डेटा आवश्यक आहे
−अत्यंत प्रकरणांमध्ये दिशाभूल करू शकते

मध्यक

गुणदोष

+बाह्य मूल्यांना प्रतिरोधक
+सामान्य मूल्य दर्शवते
+विषम डेटासाठी उपयुक्त
+ऑर्डर केलेल्या डेटासेट्सना लागू

संरक्षित केले

−वर्गीकरण आवश्यक आहे
−मूल्यांच्या टोकाच्या मर्यादा दुर्लक्षित करते
−सममितीय डेटामध्ये कमी उपयुक्त
−गणनात्मक ओव्हरहेड

सामान्य गैरसमजुती

मिथ

मीन आणि मेडियन नेहमीच एकसारखे परिणाम देतात.

वास्तव

मीन आणि मेडियन फक्त तेव्हाच जुळतात जेव्हा डेटा अंदाजे सममित असतो आणि त्यात अत्यंत मूल्ये नसतात; तिरपा किंवा असमान डेटा असल्यास, ते लक्षणीयरीत्या भिन्न असू शकतात.

मिथ

मीन नेहमीच सर्वोत्तम सरासरी माप असते.

वास्तव

मीन हा पारंपारिक सरासरी आहे परंतु तिरप्या डेटा किंवा बाह्यमूल्यांसह तो दिशाभूल करणारा असू शकतो, जिथे मध्यक अनेकदा डेटासेटचे ठराविक मूल्य अधिक चांगल्या प्रकारे दर्शवतो.

मिथ

मध्यक महत्त्वाचा डेटा दुर्लक्षित करतो.

वास्तव

मेडियन डेटाकडे दुर्लक्ष करत नाही; तो मध्यवर्ती स्थानावर लक्ष केंद्रित करतो आणि बाह्य मूल्यांच्या प्रभावाला जाणीवपूर्वक कमी करून एक मजबूत मध्यवर्ती मूल्य देतो.

मिथ

मध्यक समसंख्येच्या डेटासेटसह कार्य करत नाही.

वास्तव

सम संख्येच्या डेटासेटसाठी, मधली किंमत क्रमवारी लावल्यानंतरच्या दोन मध्यवर्ती मूल्यांची सरासरी म्हणून काढली जाते, त्यामुळे ती अजूनही केंद्रबिंदू निश्चित करते.

वारंवार विचारले जाणारे प्रश्न

सांख्यिकीत नेमके मध्य म्हणजे काय?

सांख्यिकीत, मध्यमान म्हणजे संख्यांच्या संचाचा अंकगणितीय सरासरी होय. यादीतील सर्व मूल्ये एकत्र जोडून नंतर त्या मूल्यांच्या संख्येने भागले जाते, ज्यामुळे डेटासाठी एक प्रतिनिधी आकडा मिळतो.

डेटासेटचा मध्यक कसा शोधायचा?

मध्यक शोधण्यासाठी, प्रथम माहिती लहान ते मोठ्या क्रमाने लावा. जर मूल्यांची संख्या विषम असेल, तर मध्यक मध्यभागी असतो; जर सम संख्या असेल, तर क्रमवारी लावल्यानंतर दोन मध्यम मूल्यांचे सरासरी हे मध्यक असते.

मध्यक का मध्यमानापेक्षा चांगला का असू शकतो?

मध्यक हे डेटासेटमध्ये अत्यंत मूल्ये किंवा विषम वितरण असताना अधिक चांगले असू शकते कारण ते बाह्यमूल्यांपासून किती दूर आहेत यावर प्रभावित होत नाही, ज्यामुळे ठराविक मूल्य अधिक विश्वासार्हपणे दर्शविण्यास मदत होते.

माध्य आणि मध्यक समान असू शकतात का?

होय, डेटा सममित असल्यास आणि बाह्य मूल्ये कमी असल्यास मध्य आणि मध्यक समान असू शकतात, जसे की परिपूर्ण संतुलित वितरणात.

दैनंदिन वापरात कोणते अधिक सामान्य आहे?

सरासरी हे दैनंदिन संदर्भात साधारण सरासरी म्हणून अधिक वापरले जाते, परंतु मध्यक हे उत्पन्न किंवा घरांच्या किमतींसारख्या वास्तविक-जगातील आकडेवारीत वारंवार वापरले जाते जिथे बाह्य मूल्ये असतात.

मध्यक डेटा पॉइंट्स दुर्लक्षित करतो का?

मेडियन डेटा पॉइंट्सकडे दुर्लक्ष करत नाही; तो मूल्यांच्या क्रमाचा वापर करून मध्यवर्ती स्थान शोधतो आणि मध्यभागी लक्ष केंद्रित करून अतिरेकी मूल्यांचा प्रभाव कमी करतो.

मोठ्या डेटासेटसाठी मीन चांगला आहे का?

मोठ्या डेटासेटसाठी सरासरी चांगली काम करते जे संतुलित किंवा सममितीय असतात, परंतु डेटासेटमध्ये अत्यंत मूल्ये असल्यास, मध्यक अधिक योग्य चित्र देऊ शकतो.

गणिताच्या वर्गाबाहेर मीन आणि मेडियन वापरले जातात का?

दोन्ही माध्य आणि मध्यक अर्थशास्त्र, सामाजिक शास्त्र, डेटा विश्लेषण आणि संशोधन अशा क्षेत्रांमध्ये डेटासेटमधील ठराविक मूल्यांचे सारांश किंवा वर्णन करण्यासाठी मोठ्या प्रमाणावर वापरले जातात.

निकाल

डेटा साधारणतः सममित असल्यास आणि बाह्यमूल्ये कमी असल्यास सरासरी वापरा, कारण ती पारंपारिक सरासरी देते. डेटासेट तिरपा असल्यास किंवा त्यात अत्यंत मूल्ये असल्यास मध्यक निवडा, कारण ती एक मध्यवर्ती मूल्य देते जे ठराविक नोंदी अधिक चांगल्या प्रकारे दर्शवते.

मीन व मध्यक

ठळक मुद्दे

मीन काय आहे?

मध्यक काय आहे?

तुलना सारणी

तपशीलवार तुलना

मूलभूत गणना

आउटलायर्सचा प्रभाव

वितरण आकाराचा प्रभाव

संगणकीय आवश्यकता

गुण आणि दोष

मीन

गुणदोष

संरक्षित केले

मध्यक

गुणदोष

संरक्षित केले

सामान्य गैरसमजुती

वारंवार विचारले जाणारे प्रश्न

निकाल

संबंधित तुलना

अंकगणित विरुद्ध भौमितिक क्रम

अंकगणितीय सरासरी विरुद्ध भारित सरासरी

एक-ते-एक विरुद्ध ऑन्टू फंक्शन्स

कन्व्हर्जंट विरुद्ध डायव्हर्जंट मालिका

कार्टेशियन विरुद्ध ध्रुवीय निर्देशांक