मीन व मध्यक
हे तुलनात्मक विवरण मध्य आणि मध्यक या सांख्यिकीय संकल्पनांचे स्पष्टीकरण देते, प्रत्येक केंद्रीय प्रवृत्तीच्या मापाची गणना कशी केली जाते, विविध डेटासेट्समध्ये त्यांचे वर्तन कसे असते आणि डेटाच्या वितरण तसेच बाह्यमूल्यांच्या उपस्थितीनुसार एक दुसऱ्यापेक्षा अधिक माहितीपूर्ण कधी असू शकते याबद्दल तपशीलवार माहिती देते.
ठळक मुद्दे
- मीन आणि मेडियन हे डेटासेटच्या मध्यवर्ती बिंदूचे सारांश देणारे केंद्रीय प्रवृत्तीचे माप आहेत.
- प्रत्येक वैयक्तिक मूल्यामुळे मध्यमानावर परिणाम होतो, ज्यामुळे ते अतिरेकी डेटा बिंदूंना संवेदनशील असते.
- डेटासेटला मध्यमाने दोन समान भागांमध्ये विभाजित करते, ज्यामुळे ते बाह्य मूल्यांना प्रतिरोधक असते.
- संतुलित डेटासेटसाठी मीन सर्वोत्तम आहे तर तिरपे किंवा असमान डेटासेटसाठी मेडियनला प्राधान्य दिले जाते.
मीन काय आहे?
मूल्यांची बेरीज करून संख्येने भागून मिळवलेले अंकगणितीय सरासरी.
- केंद्रीय प्रवृत्तीचे मापन
- गणना: सर्व मूल्यांची बेरीज मूल्यांच्या संख्येने भागलेली
- संवेदनशीलता: प्रत्येक डेटा पॉइंटने प्रभावित
- ठराविक वापर: सममितीय वितरणे
- आउटलायर्सचा परिणाम: अतिशय मूल्यांना अत्यंत संवेदनशील
मध्यक काय आहे?
क्रमबद्ध डेटासेटमधील कमी आणि जास्त अर्ध्या भागांना वेगळे करणारे मध्यम मूल्य.
- केंद्रीय प्रवृत्तीचे मापन
- गणना: मूल्ये क्रमवारीत लावल्यावर मधले मूल्य
- संवेदनशीलता: मूल्यांच्या क्रमावरच अवलंबून असते
- ठराविक वापर: तिरपे किंवा असमान डेटासेट्स
- आउटलायर्सचा प्रभाव: अतिरेकी मूल्यांविरुद्ध मजबूत
तुलना सारणी
| वैशिष्ट्ये | मीन | मध्यक |
|---|---|---|
| व्याख्या | सर्व मूल्यांचे अंकगणितीय सरासरी | क्रमित यादीतील मध्यम मूल्य |
| गणन पद्धती | मूल्यांची बेरीज ÷ संख्या | मूल्ये क्रमवारीत करा आणि मध्यबिंदू निवडा |
| आउटलायर संवेदनशीलता | अत्यंत संवेदनशील | बाह्य मूल्यांना प्रतिरोधक |
| सममितीसाठी सर्वोत्तम | होय | कमी प्रासंगिक |
| सांख्यिकीय तिरपे डेटासाठी सर्वोत्तम | कमी प्रतिनिधित्व असलेले | अधिक प्रतिनिधिक |
| ऑर्डर करणे आवश्यक आहे | नाही | होय |
| ठराविक उदाहरण वापर | सरासरी चाचणी गुणांकन | मध्यम कुटुंब उत्पन्न |
तपशीलवार तुलना
मूलभूत गणना
डेटासेटमधील सर्व संख्या जोडून आणि एकूण संख्येच्या प्रमाणात भागून मध्यमान काढले जाते, ज्यामुळे एक केंद्रीय संख्यात्मक सरासरी मिळते. याउलट, मध्यक ठरवण्यासाठी मूल्ये कमी ते जास्त क्रमाने लावली जातात आणि मध्यम मूल्य निवडले जाते, किंवा एकूण संख्या सम असल्यास दोन मध्यम मूल्यांची सरासरी केली जाते.
आउटलायर्सचा प्रभाव
मीन सर्व मूल्यांना समान महत्त्व देते त्यामुळे अतिशय उच्च किंवा कमी मूल्ये त्याच्या निकालावर मोठा परिणाम करतात, ज्यामुळे तिरप्या डेटामध्ये ठराविक मूल्य चुकीचे दाखवले जाऊ शकते. मध्यक मूल्ये किती मोठी किंवा लहान आहेत याकडे दुर्लक्ष करते, त्यांच्या क्रमाच्या पलीकडे, ज्यामुळे ती अतिशय मूल्यांपासून कमी प्रभावित होते आणि तिरप्या वितरणात अनेकदा अधिक माहितीपूर्ण असते.
वितरण आकाराचा प्रभाव
सममितीय डेटासेटमध्ये अत्यंत मूल्ये नसल्यास, सरासरी आणि मध्यक अनेकदा जवळजवळ जुळतात आणि दोन्ही डेटासेटच्या केंद्राचे चांगले वर्णन करतात. मात्र, एका बाजूला लांब शेपटी असलेल्या वितरणामध्ये सरासरी शेपटीकडे सरकते, तर मध्यक अर्धा डेटा वर आणि अर्धा खाली असलेल्या ठिकाणी राहतो, ज्यामुळे वेगळा दृष्टिकोन मिळतो.
संगणकीय आवश्यकता
सरासरी क्रम लावल्याशिवाय सोपी गणना करण्यास सोपी असते, जी साध्या यादी किंवा रिअल-टाइम गणनेसाठी जलद असू शकते. मध्यकासाठी प्रथम मूल्ये क्रमवारी लावणे आवश्यक असते, जे खूप मोठ्या याद्यांसाठी संगणकीय ओव्हरहेड वाढवू शकते परंतु बाह्यमूल्यांच्या मोठेपणाने प्रभावित न होणारे मध्यमूल्य देते.
गुण आणि दोष
मीन
गुणदोष
- +संगणन करणे सोपे आहे
- +सर्व डेटा पॉइंट्सचा वापर करते
- +बर्याच विश्लेषणांसाठी मानक
- +गणितीय पारंपारिक
संरक्षित केले
- −आउटलायर्समुळे विकृत झालेले
- −असंतुलित डेटाचे प्रतिनिधित्व नाही
- −संख्यात्मक डेटा आवश्यक आहे
- −अत्यंत प्रकरणांमध्ये दिशाभूल करू शकते
मध्यक
गुणदोष
- +बाह्य मूल्यांना प्रतिरोधक
- +सामान्य मूल्य दर्शवते
- +विषम डेटासाठी उपयुक्त
- +ऑर्डर केलेल्या डेटासेट्सना लागू
संरक्षित केले
- −वर्गीकरण आवश्यक आहे
- −मूल्यांच्या टोकाच्या मर्यादा दुर्लक्षित करते
- −सममितीय डेटामध्ये कमी उपयुक्त
- −गणनात्मक ओव्हरहेड
सामान्य गैरसमजुती
मीन आणि मेडियन नेहमीच एकसारखे परिणाम देतात.
मीन आणि मेडियन फक्त तेव्हाच जुळतात जेव्हा डेटा अंदाजे सममित असतो आणि त्यात अत्यंत मूल्ये नसतात; तिरपा किंवा असमान डेटा असल्यास, ते लक्षणीयरीत्या भिन्न असू शकतात.
मीन नेहमीच सर्वोत्तम सरासरी माप असते.
मीन हा पारंपारिक सरासरी आहे परंतु तिरप्या डेटा किंवा बाह्यमूल्यांसह तो दिशाभूल करणारा असू शकतो, जिथे मध्यक अनेकदा डेटासेटचे ठराविक मूल्य अधिक चांगल्या प्रकारे दर्शवतो.
मध्यक महत्त्वाचा डेटा दुर्लक्षित करतो.
मेडियन डेटाकडे दुर्लक्ष करत नाही; तो मध्यवर्ती स्थानावर लक्ष केंद्रित करतो आणि बाह्य मूल्यांच्या प्रभावाला जाणीवपूर्वक कमी करून एक मजबूत मध्यवर्ती मूल्य देतो.
मध्यक समसंख्येच्या डेटासेटसह कार्य करत नाही.
सम संख्येच्या डेटासेटसाठी, मधली किंमत क्रमवारी लावल्यानंतरच्या दोन मध्यवर्ती मूल्यांची सरासरी म्हणून काढली जाते, त्यामुळे ती अजूनही केंद्रबिंदू निश्चित करते.
वारंवार विचारले जाणारे प्रश्न
सांख्यिकीत नेमके मध्य म्हणजे काय?
डेटासेटचा मध्यक कसा शोधायचा?
मध्यक का मध्यमानापेक्षा चांगला का असू शकतो?
माध्य आणि मध्यक समान असू शकतात का?
दैनंदिन वापरात कोणते अधिक सामान्य आहे?
मध्यक डेटा पॉइंट्स दुर्लक्षित करतो का?
मोठ्या डेटासेटसाठी मीन चांगला आहे का?
गणिताच्या वर्गाबाहेर मीन आणि मेडियन वापरले जातात का?
निकाल
डेटा साधारणतः सममित असल्यास आणि बाह्यमूल्ये कमी असल्यास सरासरी वापरा, कारण ती पारंपारिक सरासरी देते. डेटासेट तिरपा असल्यास किंवा त्यात अत्यंत मूल्ये असल्यास मध्यक निवडा, कारण ती एक मध्यवर्ती मूल्य देते जे ठराविक नोंदी अधिक चांगल्या प्रकारे दर्शवते.
संबंधित तुलना
अंकगणित विरुद्ध भौमितिक क्रम
त्यांच्या गाभ्यामध्ये, अंकगणित आणि भूमितीय क्रम हे संख्यांची यादी वाढवण्याचे किंवा कमी करण्याचे दोन वेगवेगळे मार्ग आहेत. अंकगणित क्रम बेरीज किंवा वजाबाकीद्वारे स्थिर, रेषीय वेगाने बदलतो, तर भौमितिक क्रम गुणाकार किंवा भागाकाराद्वारे घातांकीय गतीने वाढतो किंवा कमी होतो.
अंकगणितीय सरासरी विरुद्ध भारित सरासरी
अंकगणित सरासरी प्रत्येक डेटा पॉइंटला अंतिम सरासरीमध्ये समान योगदानकर्ता मानते, तर भारित सरासरी वेगवेगळ्या मूल्यांना विशिष्ट पातळीचे महत्त्व देते. साध्या वर्ग सरासरीची गणना करण्यापासून ते जटिल आर्थिक पोर्टफोलिओ निश्चित करण्यापर्यंत जिथे काही मालमत्ता इतरांपेक्षा अधिक महत्त्वाच्या असतात अशा प्रत्येक गोष्टीसाठी हा फरक समजून घेणे महत्त्वाचे आहे.
एक-ते-एक विरुद्ध ऑन्टू फंक्शन्स
दोन्ही संज्ञा दोन संचांमधील घटकांचे मॅपिंग कसे केले जाते याचे वर्णन करतात, परंतु ते समीकरणाच्या वेगवेगळ्या बाजूंना संबोधित करतात. एक-ते-एक (इंजेक्टिव्ह) फंक्शन्स इनपुटच्या विशिष्टतेवर लक्ष केंद्रित करतात, हे सुनिश्चित करतात की कोणतेही दोन मार्ग एकाच गंतव्यस्थानाकडे जात नाहीत, तर (सर्जेक्टिव्ह) फंक्शन्स प्रत्येक संभाव्य गंतव्यस्थान प्रत्यक्षात पोहोचले आहे याची खात्री करतात.
कन्व्हर्जंट विरुद्ध डायव्हर्जंट मालिका
अभिसरण आणि भिन्न श्रेणीतील फरक हे ठरवतो की संख्यांची अनंत बेरीज विशिष्ट, मर्यादित मूल्यात स्थिर होते की अनंताकडे जाते. एक अभिसरण श्रेणी हळूहळू त्यांच्या पदांना 'संकुचित' करते जोपर्यंत त्यांची एकूण संख्या स्थिर मर्यादेपर्यंत पोहोचत नाही, परंतु भिन्न श्रेणी स्थिर होण्यास अपयशी ठरते, एकतर बंधनाशिवाय वाढते किंवा कायमचे दोलन करते.
कार्टेशियन विरुद्ध ध्रुवीय निर्देशांक
दोन्ही प्रणाली द्विमितीय समतलातील स्थाने निश्चित करण्याचा प्राथमिक उद्देश पूर्ण करतात, परंतु त्या वेगवेगळ्या भौमितिक तत्वज्ञानातून या कार्याकडे जातात. कार्टेशियन निर्देशांक क्षैतिज आणि उभ्या अंतरांच्या कठोर ग्रिडवर अवलंबून असतात, तर ध्रुवीय निर्देशांक मध्यवर्ती स्थिर बिंदूपासून थेट अंतर आणि कोनावर लक्ष केंद्रित करतात.