यह पूरा एनालिसिस इंसानी दिमाग के ऑर्गेनिक, मल्टी-लेयर्ड मेमोरी स्ट्रक्चर की तुलना मशीन लर्निंग आर्किटेक्चर में इस्तेमाल होने वाले मैथमेटिकल, वेट-बेस्ड रिप्रेजेंटेशन से करता है। जहाँ इंसानी मेमोरी आपस में जुड़े बायोलॉजिकल नेटवर्क के ज़रिए अनुभवों को डायनामिक रूप से फ़िल्टर और रीकंस्ट्रक्ट करती है, वहीं मशीन लर्निंग स्टैटिस्टिकल पैटर्न को बनाए रखने के लिए फिक्स्ड वेक्टर एम्बेडिंग, ग्रेडिएंट और सिलिकॉन स्टोरेज पर निर्भर करती है।
मुख्य बातें
इंसानी मेमोरी खास स्ट्रक्चरल टियर पर निर्भर करती है, जबकि मशीन लर्निंग ज्ञान को यूनिफाइड वेट मैट्रिक्स में मिला देती है।
बायोलॉजिकल नेटवर्क कंस्ट्रक्टिव रिट्रीवल का इस्तेमाल करते हैं, जबकि कंप्यूटर सटीक मैथमेटिकल कोऑर्डिनेट क्वेरीज़ को एग्जीक्यूट करते हैं।
इंसान ब्रेन हेल्थ को बेहतर बनाने के लिए बेकार जानकारी को अपने आप हटा देते हैं, लेकिन मशीनों को डेटा करप्शन को रोकने के लिए इंजीनियर्ड फिक्स की ज़रूरत होती है।
ऑर्गेनिक दिमाग, मॉडर्न सिलिकॉन डेटा सेंटर्स को जानकारी स्टोर करने के लिए जितनी पावर चाहिए, उसके बहुत कम पावर पर काम करते हैं।
मानव स्मृति प्रणालियाँ क्या है?
सेंसरी, शॉर्ट-टर्म और लॉन्ग-टर्म स्ट्रक्चर का बायोलॉजिकल नेटवर्क जो अनुभवों को एनकोड, स्टोर और रीकंस्ट्रक्ट करता है।
कॉग्निटिव स्टोरेज को अलग-अलग ऑपरेशनल लेयर्स में बांटता है: सेंसरी मेमोरी, वर्किंग मेमोरी, और परमानेंट लॉन्ग-टर्म सिस्टम।
मेमोरी पाथ बनाते समय सेलुलर कनेक्शन को फिजिकली बदलने के लिए सिनैप्टिक प्लास्टिसिटी और लॉन्ग-टर्म पोटेंशिएशन का इस्तेमाल करता है।
यह सिमेंटिक नेटवर्क पर बहुत ज़्यादा निर्भर करता है, जिसका मतलब है कि नया डेटा अपने आप कॉन्सेप्चुअल मतलब के आधार पर मौजूदा ज्ञान से जुड़ जाता है।
आस-पास के संकेतों, इमोशनल हालत, या दिमाग में अचानक केमिकल बदलावों के ज़रिए अनजाने में वापस लाने की प्रक्रिया शुरू होती है।
यह बहुत कम मेटाबोलिक एनर्जी प्रोफ़ाइल बनाए रखता है, और लगभग 20 watts की पावर पर कॉम्प्लेक्स कॉग्निटिव रिकॉल चलाता है।
मशीन लर्निंग मेमोरी रिप्रेजेंटेशन क्या है?
मैथमेटिकल फ्रेमवर्क, जिसमें वेट मैट्रिक्स, हिडन स्टेट्स और वेक्टर स्पेस शामिल हैं, जो डेटा में पैटर्न कैप्चर करते हैं।
सीखी हुई जानकारी को हज़ारों गहरी लेयर वाले आर्टिफिशियल न्यूरल कनेक्शन में स्टैटिक न्यूमेरिकल पैरामीटर के तौर पर स्टोर करता है।
ज्योमेट्रिक दूरी के ज़रिए अलग-अलग डेटा पॉइंट्स के बीच रिश्तों को मैप करने के लिए हाई-डाइमेंशनल वेक्टर स्पेस का इस्तेमाल करता है।
लर्निंग फेज़ को एग्ज़िक्यूशन फेज़ से अलग करता है, ट्रेनिंग के बाद सिस्टम वेट को फ़्रीज़ कर देता है, जब तक कि साफ़ फ़ाइन-ट्यूनिंग न हो जाए।
इसके लिए खास सिलिकॉन हार्डवेयर की ज़रूरत होती है, जो इंटेंसिव मॉडल ट्रेनिंग साइकिल के दौरान हज़ारों watts बिजली खर्च करता है।
सेल्फ-अटेंशन लेयर्स या एक्सटर्नल वेक्टर डेटाबेस जैसे खास तरीकों से लंबे समय के कॉन्टेक्स्ट को एड्रेस करता है।
मोनोलिथिक पैरामीटर, अटेंशन विंडो, या वेक्टर स्टोर ऐड-ऑन
सूचना निष्कर्षण
सहयोगी, संकेत-निर्भर, और अत्यधिक पुनर्निर्माणात्मक
एल्गोरिदमिक मैट्रिक्स डॉट प्रोडक्ट्स और मैथमेटिकल लुकअप्स
सीखने की लागत
बहुत कम मेटाबोलिक पावर; लगातार बैकग्राउंड लर्निंग
GPU क्लस्टर की ज़रूरत वाले बहुत ज़्यादा कम्प्यूटेशनल ओवरहेड
डेटा परिवर्तन
बहुत ज़्यादा फ़्लूइड; हर एक रिकॉल के साथ थोड़ा बदलता है
जब तक बैकप्रोपेगेशन कमांड वज़न में बदलाव न करें, तब तक यह बदलता नहीं है
नए इनपुट को संभालना
मौजूदा एसोसिएटिव वेब में आसानी से इंटीग्रेट हो जाता है
अलग से फाइन-ट्यूनिंग के बिना बहुत ज़्यादा भूलने का खतरा
संदर्भ सीमाएँ
अनंत लेकिन धुंधला; फोकस और ध्यान से बंधा हुआ
हार्ड-कोडेड टोकन कॉन्टेक्स्ट विंडो से पूरी तरह घिरा हुआ
विस्तृत तुलना
वास्तुशिल्प डिजाइन और लेयरिंग
इंसानी समझ डेटा को कई खास वॉल्ट में बांटती है, जिसकी शुरुआत एक पल के सेंसरी बफर से होती है जो आस-पास के व्हाइट नॉइज़ को फिल्टर करता है। कीमती डेटा एक्टिव मैनिपुलेशन के लिए वर्किंग मेमोरी में चला जाता है, इससे पहले कि हिप्पोकैंपस इसे लंबे समय तक स्टोर करने के लिए जमा करे। मशीन लर्निंग मॉडल में यह स्ट्रक्चरल बंटवारा शायद ही कभी नैचुरली होता है। इसके बजाय, पारंपरिक न्यूरल नेटवर्क सभी ट्रेनिंग डेटा को सीधे वेट्स के एक बड़े मैट्रिक्स में कम्प्रेस करते हैं, जिसका मतलब है कि मॉडल को ठीक उसी कम्प्यूटेशनल लेयर के अंदर बड़े कॉन्सेप्ट और छोटे फॉर्मेटिंग नियमों को दिखाना चाहिए।
एनकोडिंग और ज्ञान की ज्यामिति
जब इंसान किसी नए कॉन्सेप्ट से मिलता है, तो दिमाग उसे एक एसोसिएटिव वेब में जोड़ देता है, जो चीज़ को उसके नाम, आवाज़ और इमोशनल मतलब से जोड़ता है। मशीन लर्निंग मॉडल कॉन्सेप्ट के तौर पर इसकी नकल करते हैं लेकिन इसे हाई-डाइमेंशनल वेक्टर एम्बेडिंग के ज़रिए करते हैं। शब्दों या इमेज को ज्योमेट्रिक स्पेस में कोऑर्डिनेट के तौर पर प्लॉट करके, मॉडल एक ऐसा लैंडस्केप बनाता है जहाँ मैथमेटिकली जुड़े हुए आइडिया एक-दूसरे के करीब होते हैं। हालाँकि, जहाँ इंसानी जुड़ाव असलियत और सब्जेक्टिव कॉन्टेक्स्ट में गहराई से जुड़े होते हैं, वहीं मशीन एम्बेडिंग कोल्ड, स्टैटिस्टिकल दूरियों को दिखाते हैं जो पूरी तरह से टेक्स्ट को-ऑकरेंस या पिक्सेल लेआउट से मिलती हैं।
भूलने और ऑप्टिमाइज़ेशन का विकास
भूलना इंसान के दिमाग के लिए एक ज़रूरी ऑप्टिमाइज़ेशन टूल है, जिससे यह तीन हफ़्ते पहले आपने लंच में क्या खाया था, जैसे मामूली डेटा को हटा सकता है ताकि यह सर्वाइवल पैटर्न को प्रायोरिटी दे सके। यह ऑर्गेनिक प्रूनिंग लगातार और बिना रुकावट होती है। मशीन लर्निंग इस बैलेंस को आसानी से खोजने में मुश्किल महसूस करती है। जब कोई मॉडल एकदम नए डेटासेट पर ट्रेनिंग लेता है, तो आने वाले ग्रेडिएंट अपडेट अक्सर पिछले वेट वैल्यू को पूरी तरह से ओवरराइट कर देते हैं। इससे बहुत ज़्यादा भूलने की चुनौती पैदा होती है, जिसके लिए इंजीनियरों को मुश्किल अलाइनमेंट टेक्नीक लागू करने की ज़रूरत होती है ताकि यह पक्का हो सके कि नई स्किल्स हासिल करने की कोशिश में सिस्टम अपनी पुरानी इंटेलिजेंस को खत्म न कर दे।
ऊर्जा खपत और मापनीयता
बायोलॉजिकल दिमाग कुशलता का एक मास्टरपीस है, जो घर के आम बल्ब से भी कम बिजली इस्तेमाल करते हुए मेमोरी और अमूर्त विचारों के बड़े भंडार को मैनेज करता है। यह बिना किसी स्ट्रक्चरल अपग्रेड के पूरी ज़िंदगी अपने ज्ञान के आधार को बढ़ाता है। मशीन लर्निंग रिप्रेजेंटेशन के लिए बहुत ज़्यादा इंडस्ट्रियल रिसोर्स की ज़रूरत होती है। दुनिया के ज्ञान का बड़ा रिप्रेजेंटेशन रखने के लिए एक मॉडल को ट्रेन करने के लिए बड़े डेटा सेंटर, मुश्किल वॉटर-कूलिंग सेटअप और लाखों डॉलर की बिजली की ज़रूरत होती है, जिससे कार्बन-बेस्ड विकल्पों की तुलना में डिजिटल मेमोरी रिप्रेजेंटेशन बहुत ज़्यादा रिसोर्स वाला काम बन जाता है।
लाभ और हानि
मानव स्मृति प्रणालियाँ
लाभ
+अविश्वसनीय ऊर्जा दक्षता
+निर्बाध क्रॉस-मोडल एसोसिएशन
+गतिशील वैचारिक अमूर्तता
+स्वचालित पृष्ठभूमि अनुकूलन
सहमत
−कथा विकृति की संभावना
−सख्त भौतिक पुनर्प्राप्ति अड़चनें
−अपक्षयी रोग के प्रति संवेदनशील
−सीमित कच्ची कम्प्यूटेशनल गति
मशीन लर्निंग मेमोरी रिप्रेजेंटेशन
लाभ
+दोषरहित गणितीय प्रतिकृति
+भावनात्मक विकृति से प्रतिरक्षित
+बिजली की गति से पैरामीटर खोज
+हार्डवेयर में आसानी से डुप्लिकेट किया जा सकता है
सहमत
−भयावह भूलने की प्रवृत्ति
−भारी बिजली की मांग
−उच्च हार्डवेयर अवसंरचना लागत
−आउट-ऑफ-डिस्ट्रीब्यूशन डेटा से जूझना
सामान्य भ्रांतियाँ
मिथ
आर्टिफिशियल न्यूरल नेटवर्क, इंसानी दिमाग में बायोलॉजिकल न्यूरॉन वेब की तरह ही मेमोरी स्टोर करते हैं।
वास्तविकता
बायोलॉजिकल स्ट्रक्चर से थोड़ा प्रेरित होने के बावजूद, मशीन लर्निंग नोड्स आसान मैथमेटिकल फ़ंक्शन हैं जो इनपुट को न्यूमेरिक वेट से गुणा करते हैं। उनमें जीवित ब्रेन टिशू में पाई जाने वाली बायोकेमिकल कॉम्प्लेक्सिटी, न्यूरोट्रांसमीटर वैरायटी और आर्किटेक्चरल वैरायटी की कमी होती है।
मिथ
बड़े लैंग्वेज मॉडल आपके कोर नेटवर्क में आपकी बातचीत को हमेशा याद रख सकते हैं।
वास्तविकता
एक AI मॉडल आम बातचीत के दौरान अपने कोर वेट को अपडेट नहीं करता है। इसका शॉर्ट-टर्म रिटेंशन पूरी तरह से इसकी कॉन्टेक्स्ट विंडो पर निर्भर करता है, जो एक एक्टिव क्लिपबोर्ड की तरह काम करता है। एक बार जब वह चैट सेशन बंद हो जाता है या अपनी टोकन लिमिट तक पहुँच जाता है, तो मॉडल उन डिटेल्स को पूरी तरह से भूल जाता है, जब तक कि उन्हें किसी बाहरी डेटाबेस में सेव न किया जाए।
मिथ
इंसानी याददाश्त पिछली घटनाओं को अलग, न बदलने वाली डिजिटल मूवी क्लिप के रूप में फाइल कर लेती है।
वास्तविकता
बायोलॉजिकल मेमोरी पूरी तरह से रिकंस्ट्रक्टिव होती है, न कि स्टोरेज-बेस्ड। हर बार जब कोई व्यक्ति किसी घटना को याद करता है, तो उसका दिमाग मौजूदा भावनाओं और विश्वासों के साथ टुकड़ों को जोड़ता है, जिसका मतलब है कि हर बार जब कोई मेमोरी एक्सेस की जाती है तो वह थोड़ी बदल जाती है।
मिथ
अरबों पैरामीटर वाले AI मॉडल में एक बड़े इंसान की तुलना में ज़्यादा मेमोरी कैपेसिटी होती है।
वास्तविकता
डिजिटल शब्दों का इस्तेमाल करके इंसानी दिमाग में जमा जानकारी का अंदाज़ा लगाना असल में गलत है। जबकि AI बहुत सारा कच्चा टेक्स्ट शब्दशः रख सकता है, इंसानी दिमाग खरबों सिनैप्टिक लिंक बनाता है, जो आसानी से एब्स्ट्रैक्ट मेटाफ़र, मोटर स्किल और सेंसरी डेटा को मैनेज करता है जिसे कंप्यूटर आसानी से कंप्यूट नहीं कर सकते।
अक्सर पूछे जाने वाले सवाल
इंसानों में वर्किंग मेमोरी और AI में कॉन्टेक्स्ट विंडो के बीच मुख्य अंतर क्या है?
इंसान की वर्किंग मेमोरी बहुत डायनामिक होती है लेकिन बायोलॉजिकली लिमिटेड होती है, यह एक बार में सिर्फ़ चार से सात चीज़ों को एक्टिव फ़ोकस में रख सकती है, हालाँकि यह गहरे सिमेंटिक कनेक्शन को आसानी से हैंडल कर लेती है। AI की कॉन्टेक्स्ट विंडो एक फिक्स्ड मैथमेटिकल स्पेस होती है जिसे टोकन में मापा जाता है, जो एक साथ सैकड़ों पेज के टेक्स्ट को प्रोसेस कर सकती है। हालाँकि, AI इस जानकारी को पूरी तरह से स्टैटिस्टिकल अटेंशन वेट के ज़रिए प्रोसेस करती है, जिसमें वह कॉन्शस फ़ोकस, इमोशनल इवैल्यूएशन और मेंटल मैनिपुलेशन नहीं होता जो इंसान अपने विचारों पर अप्लाई करते हैं।
मशीन लर्निंग में बहुत ज़्यादा भूलने की समस्या कैसे होती है, लेकिन स्वस्थ इंसानी दिमाग में नहीं?
बहुत ज़्यादा भूलने की समस्या इसलिए होती है क्योंकि मशीन लर्निंग अपडेट में दुनिया भर में शेयर किए गए वेट मैट्रिक्स को बदलना शामिल होता है। जब नया डेटा बैकप्रोपेगेशन को उन वेट को फिर से कैलकुलेट करने के लिए मजबूर करता है, तो पुराने कॉन्फ़िगरेशन पूरी तरह से ओवरराइट हो सकते हैं। इंसानी दिमाग इससे बचता है क्योंकि वे डुअल-मेमोरी सिस्टम का इस्तेमाल करते हैं। हिप्पोकैम्पस नियोकॉर्टेक्स को परेशान किए बिना नई डिटेल्स को तेज़ी से एब्ज़ॉर्ब करता है, और नींद के दौरान समय के साथ कंसोलिडेशन नाम के प्रोसेस से उन सबकों को धीरे-धीरे इंटीग्रेट करता है।
क्या किसी बाहरी वेक्टर डेटाबेस को इंसानी लॉन्ग-टर्म मेमोरी के बराबर माना जा सकता है?
नहीं, एक वेक्टर डेटाबेस एक एडवांस्ड, बहुत कुशल सर्च इंडेक्स के तौर पर काम करता है। यह डेटा को स्टैटिक न्यूमेरिकल कोऑर्डिनेट्स में बदल देता है और जब AI प्रॉम्प्ट करता है तो मैचिंग एंट्रीज़ लाने के लिए मैथ का इस्तेमाल करता है। हालांकि यह एक मॉडल की ऑपरेशनल पहुंच को बढ़ाता है, लेकिन इसमें इंसानी लॉन्ग-टर्म मेमोरी की जीवंत, आपस में जुड़ी हुई प्रकृति की कमी होती है, जो लगातार खुद को बदलती रहती है, सेंसरी ट्रिगर्स से जुड़ती है, और पर्सनल आइडेंटिटी के आधार पर अपडेट होती रहती है।
मशीन लर्निंग मॉडल को ट्रेनिंग देने के लिए इंसानी बच्चे को सिखाने के मुकाबले इतना ज़्यादा डेटा क्यों चाहिए?
इंसानी बच्चों में लाखों साल की एवोल्यूशनरी प्रोग्रामिंग होती है जो सीधे उनके बायोलॉजिकल आर्किटेक्चर से जुड़ी होती है, जिससे वे फ्यू-शॉट लर्निंग नाम के प्रोसेस से एक-एक उदाहरण से सीख सकते हैं। वे एक साथ कई सेंस का इस्तेमाल करके फिजिकल दुनिया के साथ इंटरैक्ट भी करते हैं। मशीन लर्निंग मॉडल पूरी तरह से खाली मैथमेटिकल कैनवस के तौर पर शुरू होते हैं, जिन्हें शुरू से बेसिक स्टैटिस्टिकल रिलेशनशिप खोजने के लिए लाखों बार-बार डेटा इनपुट की ज़रूरत होती है।
AI के लॉस फंक्शन की तुलना में इंसानी मेमोरी रिटेंशन में इमोशंस की क्या भूमिका होती है?
इंसानों में इमोशन एक अंदरूनी प्रायोरिटी इंजन की तरह काम करते हैं। जब कोई घटना एक मज़बूत इमोशनल रिस्पॉन्स को ट्रिगर करती है, तो स्ट्रेस हार्मोन उस एपिसोडिक मेमोरी को लंबे समय तक सर्वाइवल के लिए दिमाग में गहराई से सील कर देते हैं। AI का लॉस फंक्शन एक मैथमेटिकल कैलकुलेशन है जो मॉडल के आउटपुट और टारगेट डेटा के बीच एरर रेट को मापता है। यह ट्रेनिंग के दौरान वेट को एडजस्ट करने के लिए इस कोल्ड न्यूमेरिकल वेरिएंस का इस्तेमाल करता है, जो किसी भी सब्जेक्टिव वैल्यू या सर्वाइवल इंस्टिंक्ट से पूरी तरह अलग होता है।
इंसानी दिमाग और आर्टिफिशियल न्यूरल नेटवर्क के बीच सिमेंटिक मेमोरी कैसे अलग होती है?
इंसानी सिमेंटिक मेमोरी दुनिया के फैक्ट्स, कल्चरल कॉन्सेप्ट्स और पर्सनल समझ का एक स्ट्रक्चर्ड वेब है जो जीते हुए अनुभवों और सोशल इंटरैक्शन से बनता है। एक AI का सिमेंटिक रिप्रेजेंटेशन एक एम्बेडिंग स्पेस के अंदर स्पेशल डिस्टेंस को कैलकुलेट करके बनाया जाता है। मॉडल जानता है कि कुछ कॉन्सेप्ट्स उसके ट्रेनिंग टेक्स्ट में पैटर्न के आधार पर कोरिलेट करते हैं, लेकिन उसके पास उन कॉन्सेप्ट्स का मतलब सही मायने में समझने के लिए ज़रूरी रियल-वर्ल्ड एक्सपीरियंस की कमी है।
क्या नींद मशीन लर्निंग मेमोरी रिप्रेजेंटेशन को उसी तरह बेहतर बना सकती है जिस तरह यह इंसानी मेमोरी को मज़बूत करती है?
कंप्यूटर साइंटिस्ट ने स्लीप-रिप्ले एल्गोरिदम नाम की ट्रेनिंग टेक्नीक बनाई हैं, जो सीधे बायोलॉजिकल नींद से प्रेरित हैं। इन साइकिल के दौरान, एक न्यूरल नेटवर्क अपनी पिछली ट्रेनिंग से सिम्युलेटेड डेटा को प्रोसेस करता है ताकि पुराने कनेक्शन को मज़बूत किया जा सके और नए इनपुट के हिसाब से खुद को ढाला जा सके। हालांकि इससे बहुत ज़्यादा भूलने की समस्या कम करने में मदद मिलती है, लेकिन यह एक प्रोग्राम्ड यूटिलिटी स्क्रिप्ट ही रहती है, न कि वह मुश्किल, ठीक करने वाला बायोलॉजिकल प्रोसेस जिससे इंसानी दिमाग हर रात गुज़रता है।
क्या मशीन लर्निंग आर्किटेक्चर कभी पूरी तरह से इंसानी मेमोरी सिस्टम को कॉपी कर पाएगा?
हालांकि इंजीनियर मुश्किल, मॉड्यूलर AI सिस्टम डिज़ाइन कर रहे हैं जो शॉर्ट-टर्म अटेंशन रैपर, लॉन्ग-टर्म वेक्टर स्टोर और एपिसोडिक लॉगिंग बफ़र को मिलाते हैं, फिर भी वे इंसानी बायोलॉजी से असल में अलग हैं। असली कन्वर्जेंस के लिए स्टैटिक सिलिकॉन आर्किटेक्चर से हटकर अडैप्टिव न्यूरोमॉर्फिक हार्डवेयर की ओर बढ़ना होगा जो रियल-टाइम में अपने कनेक्शन को फिजिकली रीवायर कर सके, और यह सब एक यूनिफाइड कॉन्शस अवेयरनेस के तहत काम करते हुए।
निर्णय
जब बहुत ज़्यादा डायनामिक, अनस्ट्रक्चर्ड माहौल में काम करना हो, जिसमें बहुत ज़्यादा पावर खर्च किए बिना कम डेटा पॉइंट से अडैप्टिव लर्निंग की ज़रूरत हो, तो ह्यूमन कॉग्निटिव फ्रेमवर्क चुनें। जब आपके काम में पूरी तरह से मैथमेटिकल सटीकता, लाखों डॉक्यूमेंट की तेज़ी से प्रोसेसिंग, और ऑर्गेनिक मेमोरी के खराब होने से बचाने वाला सिस्टम चाहिए, तो मशीन लर्निंग मेमोरी रिप्रेजेंटेशन का इस्तेमाल करें।