यह तुलना इस दिलचस्प अंतर को दिखाती है कि इंसान दुनिया को कैसे सहजता से अनुभव करते हैं और आर्टिफिशियल सिस्टम डेटा के ज़रिए इसे कैसे कैटेगराइज़ करते हैं। जहाँ इंसानी समझ कॉन्टेक्स्ट, इमोशन और बायोलॉजिकल इवोल्यूशन में गहराई से जुड़ी होती है, वहीं मशीन क्लासिफिकेशन मुश्किल जानकारी को प्रोसेस करने के लिए मैथमेटिकल पैटर्न और अलग-अलग लेबल पर निर्भर करती है।
मुख्य बातें
इंसान सर्वाइवल-बेस्ड इंट्यूशन के लेंस से देखते हैं।
मशीनें सख्त मैथमेटिकल बाउंड्री और फीचर मैपिंग के ज़रिए क्लासिफ़ाई करती हैं।
सब्जेक्टिविटी ऐसे 'ग्रे एरिया' की इजाज़त देती है जिन्हें कंप्यूट करना मशीनों के लिए अक्सर मुश्किल होता है।
क्लासिफिकेशन जानकारी को ऑर्गनाइज़ करने का एक स्केलेबल तरीका देता है जिसे इंसान हाथ से हैंडल नहीं कर सकते।
व्यक्तिपरक धारणा क्या है?
यह अंदरूनी, क्वालिटेटिव प्रोसेस है कि लोग अपने पर्सनल एक्सपीरियंस और बायोलॉजिकल कॉन्टेक्स्ट के आधार पर सेंसरी इनपुट को कैसे समझते हैं।
इंसान की सेंसरी प्रोसेसिंग पिछली यादों और इमोशनल हालत से प्रभावित होती है।
भाषा में अंतर के कारण अलग-अलग संस्कृतियों में रंगों की समझ काफ़ी अलग-अलग होती है।
दिमाग अक्सर उम्मीदों के आधार पर गायब सेंसरी डेटा को 'भर देता है'।
न्यूरल अडैप्टेशन इंसानों को लगातार होने वाली स्टिम्युलाई को नज़रअंदाज़ करके बदलावों पर ध्यान देने में मदद करता है।
असलियत को सीधे रिकॉर्ड करने के बजाय, समझ एक कंस्ट्रक्टिव प्रोसेस है।
मशीन वर्गीकरण क्या है?
एल्गोरिदम और स्टैटिस्टिकल मॉडल का इस्तेमाल करके इनपुट डेटा को खास कैटेगरी में बांटने का कम्प्यूटेशनल प्रोसेस।
क्लासिफिकेशन हाई-डाइमेंशनल फीचर वेक्टर और मैथमेटिकल दूरी पर निर्भर करता है।
मॉडल्स को बाउंड्री बनाने के लिए बहुत सारे लेबल्ड ट्रेनिंग डेटा की ज़रूरत होती है।
सिस्टम डेटा में ऐसे पैटर्न का पता लगा सकते हैं जो इंसानी आंखों को दिखाई नहीं देते।
मशीन लॉजिक डिटरमिनिस्टिक होता है और उसमें अंदरूनी कॉन्टेक्स्चुअल या कल्चरल अवेयरनेस की कमी होती है।
क्लासिफिकेशन एक्यूरेसी को प्रिसिजन, रिकॉल और F1-स्कोर जैसे मेट्रिक्स से मापा जाता है।
तुलना तालिका
विशेषता
व्यक्तिपरक धारणा
मशीन वर्गीकरण
प्राथमिक चालक
जैविक अंतर्ज्ञान और संदर्भ
सांख्यिकीय संभावना और डेटा
प्रसंस्करण शैली
एनालॉग और निरंतर
डिजिटल और असतत
अस्पष्टता से निपटना
बारीकियों और 'गट फीलिंग्स' को अपनाता है
साफ़ थ्रेशहोल्ड या कॉन्फिडेंस स्कोर की ज़रूरत है
सीखने की विधि
जीवन के अनुभव से कुछ ही बार सीखना
बड़े पैमाने पर पर्यवेक्षित या अप्रशिक्षित प्रशिक्षण
स्थिरता
मूड या थकान के आधार पर बहुत ज़्यादा बदलाव
समान इनपुट में पूरी तरह से सुसंगत
वर्गीकरण की गति
मिलीसेकंड अवचेतन प्रतिक्रिया
नैनोसेकंड से सेकंड-रेंज गणना
डेटा आवश्यकताएँ
कम से कम (एक अनुभव सबक सिखा सकता है)
बहुत ज़्यादा (अक्सर हज़ारों उदाहरणों की ज़रूरत होती है)
परिणाम लक्ष्य
उत्तरजीविता और सामाजिक नेविगेशन
सटीकता और पैटर्न पहचान
विस्तृत तुलना
संदर्भ की भूमिका
इंसान अपने आप माहौल के हिसाब से अपनी समझ बदल लेते हैं; जैसे, अंधेरी गली में परछाई, तेज़ रोशनी वाले पार्क में परछाई से ज़्यादा खतरनाक लगती है। लेकिन, मशीन क्लासिफिकेशन, पिक्सल या डेटा पॉइंट को वैक्यूम में देखती है, जब तक कि उसे खास तौर पर माहौल के मेटाडेटा के साथ ट्रेन न किया गया हो। इसका मतलब है कि कंप्यूटर किसी चीज़ को सही पहचान सकता है, लेकिन उस 'वाइब' या हालात के खतरे को पूरी तरह से नज़रअंदाज़ कर सकता है जिसे इंसान तुरंत महसूस कर लेता है।
परिशुद्धता बनाम सूक्ष्मता
मशीनें हेक्स कोड या वेवलेंथ का एनालिसिस करके नीले रंग के दो लगभग एक जैसे शेड्स में फर्क करने में माहिर होती हैं, जो हमें एक जैसे दिखते हैं। इसके उलट, सब्जेक्टिव परसेप्शन किसी व्यक्ति को किसी फीलिंग को 'बिटरस्वीट' के तौर पर बताने की इजाज़त देता है, यह एक कॉम्प्लेक्स इमोशनल मिक्सचर है जिसे क्लासिफिकेशन एल्गोरिदम बिना किसी अलग-अलग बाइनरी लेबल के सेट में बदले मैप करने में मुश्किल महसूस करते हैं। एक एक्यूरेसी को प्रायोरिटी देता है, जबकि दूसरा मीनिंग को प्रायोरिटी देता है।
सीखना और अनुकूलन
एक बच्चे को हर दूसरे कुत्ते को पहचानने के लिए, चाहे वह किसी भी नस्ल या साइज़ का हो, उसे सिर्फ़ एक बार कुत्ते को देखने की ज़रूरत होती है। मशीन लर्निंग को आम तौर पर उसी लेवल के जनरलाइज़ेशन तक पहुँचने के लिए हज़ारों लेबल वाली इमेज की ज़रूरत होती है। इंसान सभी पाँच सेंस के सिंथेसिस से सीखते हैं, जबकि क्लासिफ़िकेशन सिस्टम आमतौर पर टेक्स्ट, इमेज या ऑडियो जैसे खास तरीकों में बँटे होते हैं।
पूर्वाग्रह और त्रुटि प्रोफाइल
इंसानी बायस अक्सर पर्सनल सोच या सोचने-समझने के शॉर्टकट से पैदा होता है, जिससे ऐसे पैटर्न का 'हैलुसिनेशन' होता है जो होते ही नहीं। मशीन बायस उसके ट्रेनिंग डेटा की ही तरह होता है; अगर कोई डेटासेट टेढ़ा-मेढ़ा है, तो क्लासिफिकेशन में सिस्टमैटिकली गलती होगी। जब कोई इंसान गलती करता है, तो यह अक्सर फैसले में कमी होती है, जबकि मशीन की गलती आमतौर पर मैथमेटिकल कोरिलेशन की नाकामी होती है।
लाभ और हानि
व्यक्तिपरक धारणा
लाभ
+उच्च भावनात्मक बुद्धिमत्ता
+गहन प्रासंगिक समझ
+अविश्वसनीय सीखने की दक्षता
+नई उत्तेजनाओं के अनुकूल ढल जाता है
सहमत
−थकान की संभावना
−अत्यधिक असंगत
−व्यक्तिगत पूर्वाग्रह से प्रभावित
−सीमित डेटा थ्रूपुट
मशीन वर्गीकरण
लाभ
+पूर्ण स्थिरता
+बड़े पैमाने पर क्षमताएँ
+वस्तुनिष्ठ गणितीय तर्क
+अदृश्य पैटर्न का पता लगाता है
सहमत
−सामान्य ज्ञान का अभाव
−विशाल डेटासेट की आवश्यकता है
−अस्पष्ट निर्णय लेना
−डेटा शोर के प्रति संवेदनशील
सामान्य भ्रांतियाँ
मिथ
कंप्यूटर क्लासिफिकेशन इंसानी नज़रिए से ज़्यादा 'सही' है।
वास्तविकता
मशीनें ज़्यादा सटीक होती हैं, लेकिन वे अक्सर बेसिक विज़ुअल लॉजिक में फेल हो जाती हैं, जिसे इंसान मामूली समझते हैं। एक कंप्यूटर किचन के कॉन्टेक्स्ट को नज़रअंदाज़ करते हुए, सिर्फ़ उसके आकार और रंग की वजह से टोस्टर को सूटकेस बता सकता है।
मिथ
इंसानी सोच दुनिया का सीधा वीडियो फ़ीड है।
वास्तविकता
असल में हमारा दिमाग जो हम देखते हैं, उसका लगभग 90% हिस्सा हटा देता है, और असलियत का एक आसान 'मॉडल' बना देता है। हम वही देखते हैं जिसकी हम उम्मीद करते हैं, ज़रूरी नहीं कि वही हो जो असल में है।
मिथ
AI उन कैटेगरी को समझता है जो वह बनाता है।
वास्तविकता
एक क्लासिफिकेशन मॉडल को यह नहीं पता होता कि 'कैट' क्या है; उसे सिर्फ़ यह पता होता है कि पिक्सल वैल्यू का एक खास सेट 'कैट' लेबल से जुड़ा होता है। इस मैथ के पीछे कोई कॉन्सेप्चुअल समझ नहीं होती।
मिथ
बायस सिर्फ़ इंसानी सोच में होता है।
वास्तविकता
मशीन क्लासिफिकेशन अक्सर डेटा में पाए जाने वाले मौजूदा सोशल बायस को बढ़ा देता है। अगर ट्रेनिंग डेटा गलत है, तो मशीन का 'ऑब्जेक्टिव' क्लासिफिकेशन भी गलत होगा।
अक्सर पूछे जाने वाले सवाल
क्या कोई मशीन कभी किसी कमरे की 'वाइब' को इंसान की तरह महसूस कर सकती है?
बायोलॉजिकल तरीके से नहीं। हालांकि हम सेंसर को टेम्परेचर, नॉइज़ लेवल और यहां तक कि बोलने में 'सेंटिमेंट' का पता लगाने के लिए ट्रेन कर सकते हैं, लेकिन ये सिर्फ़ डेटा पॉइंट हैं। इंसान मिरर न्यूरॉन्स, पर्सनल हिस्ट्री और छोटे-मोटे सोशल इशारों को मिलाकर 'वाइब' महसूस करता है, जिन्हें अभी तक किसी एल्गोरिदम में पूरी तरह से मैप नहीं किया गया है।
मशीनों को हमसे ज़्यादा डेटा की ज़रूरत क्यों होती है?
इंसानों को लाखों सालों की एवोल्यूशनरी 'प्री-ट्रेनिंग' का फ़ायदा मिला है। हम फ़िज़िक्स और सोशल स्ट्रक्चर को समझने के लिए एक बायोलॉजिकल फ्रेमवर्क के साथ पैदा होते हैं। मशीनें रैंडम वेट की एक खाली स्लेट के रूप में शुरू होती हैं और उन्हें हर एक नियम को शुरू से दोहराकर सीखना पड़ता है।
मेडिकल समस्याओं की पहचान के लिए कौन सा बेहतर है?
सबसे अच्छे नतीजे आमतौर पर हाइब्रिड तरीके से मिलते हैं। मशीनें X-ray में छोटी-छोटी गड़बड़ियों को पहचानने में कमाल की होती हैं, जिन्हें थका हुआ डॉक्टर भी नहीं देख पाता, लेकिन मरीज़ की पूरी लाइफस्टाइल और मेडिकल हिस्ट्री के हिसाब से उन नतीजों को समझना डॉक्टर के लिए ज़रूरी होता है।
क्या सब्जेक्टिव परसेप्शन क्लासिफिकेशन का ही एक और रूप है?
एक तरह से, हाँ। न्यूरोसाइंटिस्ट अक्सर दिमाग को एक 'प्रेडिक्शन इंजन' बताते हैं जो आने वाले सिग्नल को क्लासिफ़ाई करता है। फ़र्क यह है कि इंसानी 'लेबल' फ़्लूइड और मल्टी-डाइमेंशनल होते हैं, जबकि मशीन लेबल आमतौर पर एक खास सॉफ़्टवेयर आर्किटेक्चर में फ़िक्स्ड मार्कर होते हैं।
'एज केस' इन दोनों सिस्टम को कैसे प्रभावित करते हैं?
एज केस अक्सर मशीन क्लासिफिकेशन को तोड़ देते हैं क्योंकि वे ट्रेनिंग डेटा जैसे नहीं दिखते। हालांकि, इंसान एज केस पर ज़्यादा कामयाब होते हैं; हम अपनी रीज़निंग का इस्तेमाल करके यह पता लगाते हैं कि कोई नई चीज़ उसकी प्रॉपर्टीज़ के आधार पर क्या हो सकती है, भले ही हमने उसे पहले कभी न देखा हो।
क्या मशीन क्लासिफिकेशन सच में ऑब्जेक्टिव हो सकता है?
कोई भी क्लासिफिकेशन पूरी तरह से ऑब्जेक्टिव नहीं होता क्योंकि क्या मापना है और कैसे लेबल करना है, यह चुनाव इंसान ही करते हैं। मैथ ऑब्जेक्टिव होता है, लेकिन मैथ के आस-पास का फ्रेमवर्क डिज़ाइनरों की अपनी सब्जेक्टिव सोच से प्रभावित होता है।
रंगों की समझ को सब्जेक्टिव क्यों माना जाता है?
अलग-अलग भाषाओं में रंगों के लिए अलग-अलग बेसिक शब्द होते हैं। कुछ कल्चर में नीले और हरे रंग के लिए अलग-अलग शब्द नहीं होते हैं, और रिसर्च से पता चलता है कि इससे असल में उन लोगों के सेंसरी लेवल पर उन रंगों के बीच की सीमाओं को समझने का तरीका बदल जाता है।
क्या मशीनें कभी इंसानी लेवल की समझ तक पहुंच पाएंगी?
हम मल्टीमॉडल मॉडल के करीब आ रहे हैं जो टेक्स्ट, इमेज और साउंड को एक साथ प्रोसेस करते हैं। हालांकि, जब तक मशीनों के पास कॉन्टेक्स्ट देने के लिए कोई 'बॉडी' या कोई जीता-जागता अनुभव नहीं होगा, तब तक उनकी समझ शायद सच्ची समझ के बजाय स्टैटिस्टिकल अंदाज़े का एक बहुत ही सोफिस्टिकेटेड रूप ही रहेगी।
निर्णय
जब आपको क्रिएटिव इनसाइट, इमोशनल इंटेलिजेंस, या एकदम नई सिचुएशन में तेज़ी से ढलने की ज़रूरत हो, तो सब्जेक्टिव परसेप्शन चुनें। जब आपको बिना थके कंसिस्टेंसी, बड़े डेटासेट की हाई-स्पीड प्रोसेसिंग, या इंसानी सेंसरी लिमिट से ज़्यादा एक्यूरेसी चाहिए हो, तो मशीन क्लासिफिकेशन चुनें।