Question 1

डेटा साइंस के लिए मुझे सबसे पहले कौन सा सीखना चाहिए?

Accepted Answer

प्रोबेबिलिटी से शुरू करें। यह 'लैंग्वेज' और डिस्ट्रीब्यूशन (जैसे नॉर्मल डिस्ट्रीब्यूशन) देता है जिसकी आपको यह समझने के लिए ज़रूरत होगी कि स्टैटिस्टिकल टेस्ट असल में कैसे काम करते हैं। प्रोबेबिलिटी के बिना, स्टैटिस्टिक्स बस फ़ॉर्मूला याद करने जैसा लगेगा, बिना यह जाने कि वे क्यों काम करते हैं।

Question 2

पैरामीटर और स्टैटिस्टिक में क्या अंतर है?

Accepted Answer

एक पैरामीटर पूरी आबादी से जुड़ी एक सच्ची वैल्यू होती है (जैसे धरती पर हर इंसान की औसत ऊंचाई)। एक स्टैटिस्टिक एक सैंपल से कैलकुलेट की गई वैल्यू होती है (जैसे आपने 100 लोगों की औसत ऊंचाई नापी)। हम पैरामीटर का अनुमान लगाने के लिए स्टैटिस्टिक का इस्तेमाल करते हैं।

Question 3

क्या ब्लैकजैक में कार्ड काउंटिंग प्रोबेबिलिटी है या स्टैटिस्टिक्स?

Accepted Answer

असल में यह दोनों है। आप 'डेटा' (कौन से कार्ड खेले गए हैं) का ट्रैक रखने के लिए स्टैटिस्टिक्स का इस्तेमाल करते हैं और फिर बचे हुए डेक के बदलते ऑड्स को कैलकुलेट करने के लिए प्रोबेबिलिटी का इस्तेमाल करते हैं। यह नई जानकारी के आधार पर मॉडल को अपडेट करने का एक रियल-टाइम एप्लीकेशन है।

Question 4

मौसम की भविष्यवाणी में प्रोबेबिलिटी कैसे मदद करती है?

Accepted Answer

मौसम वैज्ञानिक मौजूदा डेटा का इस्तेमाल करके हज़ारों सिमुलेशन चलाते हैं। अगर 1,000 में से 700 सिमुलेशन बारिश दिखाते हैं, तो वे 70% संभावना बताते हैं। 'स्टैटिस्टिक्स' वाले हिस्से में सबसे पहले उन सिमुलेशन मॉडल को बनाने के लिए दशकों पुराने मौसम का एनालिसिस करना शामिल था।

Question 5

स्टैटिस्टिक्स में 'इन्फरेंस' क्या है?

Accepted Answer

अनुमान एक छोटे ग्रुप के आधार पर किसी बड़े ग्रुप की खासियतों का 'अंदाज़ा' लगाना या अंदाज़ा लगाना है। यह वह पुल है जो हमें देश के हर एक व्यक्ति का टेस्ट किए बिना पब्लिक ओपिनियन या मेडिकल असर के बारे में बड़े दावे करने की इजाज़त देता है।

Question 6

0 की प्रोबेबिलिटी का क्या मतलब है?

Accepted Answer

नतीजों के एक सीमित सेट में, 0 की प्रोबेबिलिटी का मतलब है कि कोई घटना नामुमकिन है। हालांकि, कंटीन्यूअस मैथमेटिक्स में (जैसे 0 और 1 के बीच एक खास एकदम सही डेसिमल चुनना), टेक्निकली 0 की प्रोबेबिलिटी हो सकती है, लेकिन हम इसे प्रैक्टिकल तौर पर 'लगभग नामुमकिन' कहते हैं।

Question 7

क्या स्टैटिस्टिक्स का इस्तेमाल झूठ बोलने के लिए किया जा सकता है?

Accepted Answer

बिल्कुल। बायस्ड सैंपल चुनकर, डेटा को गुमराह करने वाले स्केल के साथ विज़ुअलाइज़ करके, या 'मार्जिन ऑफ़ एरर' को नज़रअंदाज़ करके, लोग स्टैटिस्टिक्स से लगभग किसी भी दावे को सपोर्ट करवा सकते हैं। इसीलिए नंबरों के पीछे के मेथड को समझना उतना ही ज़रूरी है जितना कि खुद नंबर।

Question 8

दोनों में 'नॉर्मल डिस्ट्रीब्यूशन' इतना महत्वपूर्ण क्यों है?

Accepted Answer

बेल कर्व (नॉर्मल डिस्ट्रीब्यूशन) नेचर में सबसे आम पैटर्न है। प्रोबेबिलिटी में, यह बताता है कि रैंडम वेरिएबल कैसे क्लस्टर होते हैं। स्टैटिस्टिक्स में, सेंट्रल लिमिट थ्योरम हमें बताता है कि जैसे-जैसे हम ज़्यादा सैंपल लेंगे, हमारा डेटा अपने आप यह आकार बनाएगा, जिससे बहुत मज़बूत प्रेडिक्शन किए जा सकेंगे।

विशेषता	संभावना	आंकड़े
तर्क की दिशा	निगमनात्मक (मॉडल से डेटा)	आगमनात्मक (डेटा से मॉडल)
प्राथमिक लक्ष्य	भविष्य की घटनाओं की भविष्यवाणी करना	अतीत/वर्तमान डेटा की व्याख्या
ज्ञात संस्थाएँ	जनसंख्या और उसके नियम	नमूना और उसके माप
अज्ञात संस्थाएँ	ट्रायल का खास नतीजा	जनसंख्या की वास्तविक विशेषताएँ
महत्वपूर्ण सवाल	'X' होने की क्या संभावना है?	'X' हमें दुनिया के बारे में क्या बताता है?
निर्भरता	डेटा संग्रह से स्वतंत्र	पूरी तरह से डेटा की क्वालिटी पर निर्भर
कोर टूल	यादृच्छिक चर और वितरण	नमूनाकरण और परिकल्पना परीक्षण

संभाव्यता बनाम सांख्यिकी

मुख्य बातें

संभावना क्या है?

आंकड़े क्या है?

तुलना तालिका

विस्तृत तुलना

सूचना का प्रवाह

निश्चितता बनाम अनुमान

जनसंख्या बनाम नमूना

परस्पर जुड़े संबंध

लाभ और हानि

संभावना

लाभ

सहमत

आंकड़े

लाभ

सहमत

सामान्य भ्रांतियाँ

अक्सर पूछे जाने वाले सवाल

निर्णय

संबंधित तुलनाएं

अंकगणित बनाम ज्यामितीय अनुक्रम

अंकगणितीय माध्य बनाम भारित माध्य

अभाज्य संख्या बनाम संयुक्त संख्या

अभिसारी बनाम अपसारी श्रृंखला

कर्व बनाम परिमेय संख्या