सेल्फ-RAG पूरी तरह से रिट्रीवर कम्पोनेंट की जगह ले लेता है।
Self-RAG अभी भी एक रिट्रीवर का इस्तेमाल करता है, लेकिन ऊपर एक डिसीजन लेयर जोड़ता है। मॉडल यह चुनता है कि रिट्रीवल को कब इनवोक करना है, न कि रिट्रीवल को पाइपलाइन से पूरी तरह से हटा देता है।
Self-RAG एक सेल्फ-रिफ्लेक्टिव रिट्रीवल लेयर पेश करता है जो लैंग्वेज मॉडल्स को अपने आउटपुट को क्रिटिक और अडैप्ट करने देता है, जबकि स्टैंडर्ड RAG पाइपलाइन एक फिक्स्ड रिट्रीव-फिर-रीड वर्कफ़्लो पर निर्भर करती हैं। मुख्य अंतर अडैप्टिव कंट्रोल बनाम प्रेडिक्टेबल, लीनियर एग्जीक्यूशन में है।
एक रिट्रीवल-ऑगमेंटेड फ्रेमवर्क जहां मॉडल खुद ही इवैल्यूएट करता है और तय करता है कि जानकारी कब रिट्रीव करनी है।
एक पारंपरिक रिट्रीवल-ऑगमेंटेड जेनरेशन तरीका जो पहले डॉक्यूमेंट्स को रिट्रीव करता है, फिर उन्हें एक लैंग्वेज मॉडल में फीड करता है।
| विशेषता | स्व-आरएजी | मानक आरएजी पाइपलाइनें |
|---|---|---|
| पुनर्प्राप्ति रणनीति | अडैप्टिव, मॉडल तय करता है कि कब रिट्रीव करना है | उत्तर देने से पहले हमेशा पुनर्प्राप्त करें |
| स्वमूल्यांकन | क्वालिटी कंट्रोल के लिए बिल्ट-इन रिफ्लेक्शन टोकन | कोई आंतरिक आलोचना तंत्र नहीं |
| कम्प्यूटेशनल लागत | जब रिट्रीवल छोड़ा जाता है तो कम करें | प्रति क्वेरी सुसंगत लागत |
| उत्तर सटीकता | मुश्किल रीज़निंग टास्क में बेहतर | मज़बूत लेकिन इसमें अप्रासंगिक संदर्भ शामिल हो सकते हैं |
| कार्यान्वयन जटिलता | अधिक जटिल प्रशिक्षण पाइपलाइन | डिप्लॉय और मेंटेन करना आसान |
| FLEXIBILITY | हर क्वेरी के हिसाब से डायनामिकली एडजस्ट होता है | क्वेरी टाइप की परवाह किए बिना फिक्स्ड वर्कफ़्लो |
| प्रशिक्षण आवश्यकताएं | रिफ्लेक्शन-लेबल वाले डेटा की ज़रूरत है | मानक फ़ाइन-ट्यूनिंग पर्याप्त है |
| विलंब | रिट्रीवल फैसलों के आधार पर वेरिएबल | पूर्वानुमानित दो-चरणीय विलंबता |
स्टैंडर्ड RAG एक सीधे-सादे दो-स्टेज पाइपलाइन पर काम करता है, जहाँ एक रिट्रीवर ज़रूरी डॉक्यूमेंट्स लाता है और एक जनरेटर उस कॉन्टेक्स्ट के आधार पर जवाब देता है। सेल्फ-RAG ऊपर एक डिसीजन-मेकिंग प्रोसेस लेयर करता है, जिससे मॉडल रिफ्लेक्शन टोकन निकालता है जो यह तय करते हैं कि रिट्रीवल की ज़रूरत है या नहीं और आउटपुट ग्राउंडेड है या नहीं। यह सेल्फ-RAG को सोचने में ज़्यादा मॉड्यूलर बनाता है, जबकि स्टैंडर्ड RAG ज़्यादा आसान और सोचने में आसान बना रहता है।
स्टैंडर्ड RAG में, हर क्वेरी एक रिट्रीवल स्टेप को ट्रिगर करती है, भले ही मॉडल के पास पहले से जानकारी हो या न हो। Self-RAG इसे पलट देता है, मॉडल को यह तय करने के लिए ट्रेन करके कि बाहरी जानकारी असल में कब ज़रूरी है। असल सवालों के लिए जिनका जवाब मॉडल अपने वेट से दे सकता है, Self-RAG रिट्रीवल को पूरी तरह से छोड़ देता है, जिससे नॉइज़ कम होता है और जवाबों की स्पीड बढ़ जाती है।
सेल्फ़-RAG चार रिफ़्लेक्शन टोकन लाता है जो पूरे जेनरेशन प्रोसेस में चेकपॉइंट का काम करते हैं। ये टोकन मॉडल को बिना सपोर्ट वाले दावों को फ़्लैग करने और सबूत कमज़ोर होने पर दोबारा कोशिश करने देते हैं। स्टैंडर्ड RAG में ऐसा कोई इंटरनल फ़ीडबैक लूप नहीं होता है, इसलिए जब तक बाहरी गार्डरेल नहीं जोड़े जाते, तब तक वहम या ऑफ़-टॉपिक जवाब निकल सकते हैं।
PopQA, ARC-Challenge, और PubHealth जैसे बेंचमार्क पर, Self-RAG ने स्टैंडर्ड RAG बेसलाइन के मुकाबले काफी अच्छा फायदा दिखाया है, खासकर उन सवालों के लिए जिनमें मल्टी-हॉप रीज़निंग की ज़रूरत होती है। स्टैंडर्ड RAG अभी भी सीधे फैक्ट्स वाले लुकअप पर अच्छा परफॉर्म करता है, जहाँ रिट्रीवल भरोसेमंद तरीके से सही पैसेज दिखाता है। जैसे-जैसे सवाल मुश्किल होता जाता है, परफॉर्मेंस का अंतर बढ़ता जाता है।
ज़्यादातर प्रोडक्शन सिस्टम के लिए स्टैंडर्ड RAG डिफ़ॉल्ट चॉइस बना हुआ है क्योंकि यह मौजूदा वेक्टर डेटाबेस के साथ अच्छे से इंटीग्रेट हो जाता है और इसके लिए किसी खास ट्रेनिंग डेटा की ज़रूरत नहीं होती। सेल्फ-RAG के लिए ज़्यादा इंजीनियरिंग मेहनत की ज़रूरत होती है, जिसमें रिफ्लेक्शन-लेबल वाले डेटासेट बनाना और सही टोकन निकालने के लिए मॉडल को फाइन-ट्यून करना शामिल है। सीमित ML रिसोर्स वाली टीमों के लिए, स्टैंडर्ड RAG प्रैक्टिकल ऑप्शन है।
सेल्फ-RAG पूरी तरह से रिट्रीवर कम्पोनेंट की जगह ले लेता है।
Self-RAG अभी भी एक रिट्रीवर का इस्तेमाल करता है, लेकिन ऊपर एक डिसीजन लेयर जोड़ता है। मॉडल यह चुनता है कि रिट्रीवल को कब इनवोक करना है, न कि रिट्रीवल को पाइपलाइन से पूरी तरह से हटा देता है।
स्टैंडर्ड RAG पुराना हो चुका है और अब काम का नहीं है।
स्टैंडर्ड RAG ज़्यादातर प्रोडक्शन AI सिस्टम की नींव बना हुआ है। सेल्फ-RAG इसे बदलने के बजाय इस पर बनाता है, और कई टीमें अभी भी क्लासिक तरीके से बेहतरीन नतीजे पाती हैं।
सेल्फ-RAG हमेशा स्टैंडर्ड RAG से ज़्यादा डॉक्यूमेंट्स निकालता है।
Self-RAG अक्सर कम डॉक्यूमेंट्स रिट्रीव करता है क्योंकि यह ज़रूरत न होने पर रिट्रीवल को स्किप कर सकता है। अडैप्टिव नेचर का मतलब है कि यह कॉन्टेक्स्ट तभी खींचता है जब मॉडल इसे मददगार समझता है।
Self-RAG चलाने के लिए आपको GPT-4 की ज़रूरत है।
Self-RAG को अलग-अलग ओपन-सोर्स मॉडल के साथ इम्प्लीमेंट किया जा सकता है। ओरिजिनल पेपर में रिफ्लेक्शन टोकन के साथ Llama 2 को फाइन-ट्यून किया गया था, जिससे यह साबित होता है कि यह तरीका प्रोप्राइटरी सिस्टम से आगे भी काम करता है।
स्टैंडर्ड RAG मुश्किल रीज़निंग को हैंडल नहीं कर सकता।
स्टैंडर्ड RAG मुश्किल रीज़निंग को अच्छे से हैंडल करता है जब इसे मज़बूत जनरेटर और अच्छी चंकिंग स्ट्रेटेजी के साथ जोड़ा जाता है। सेल्फ़-RAG एज केस को बेहतर बनाता है लेकिन स्टैंडर्ड RAG सिर्फ़ आसान क्वेरी तक ही सीमित नहीं है।
जब जवाब की क्वालिटी, वहम कम करना, और अडैप्टिव एफिशिएंसी, लागू करने में आसानी से ज़्यादा मायने रखती है, खासकर मुश्किल रीजनिंग कामों के लिए, तो Self-RAG चुनें। स्टैंडर्ड RAG पाइपलाइन सीधे-सादे डिप्लॉयमेंट के लिए बेहतर फिट रहती हैं, जहाँ पहले से पता चलने वाली लेटेंसी और मौजूदा इंफ्रास्ट्रक्चर के साथ आसान इंटीग्रेशन सबसे ज़रूरी हैं।
AI आइडिया वैलिडेशन एल्गोरिदम और डेटा का इस्तेमाल करके जल्दी से टेस्ट करता है कि किसी कॉन्सेप्ट में मार्केट पोटेंशियल है या नहीं, जबकि इंसानी प्रॉब्लम स्पॉटिंग असल दुनिया की दिक्कतों को पहचानने के लिए अपने अनुभव और इंट्यूशन पर निर्भर करती है। दोनों तरीकों में खास खूबियां हैं, और कई सफल फाउंडर किसी एक को चुनने के बजाय उन्हें मिलाते हैं।
यह डिटेल्ड ब्रेकडाउन आर्टिफिशियल इंटेलिजेंस सिस्टम के प्रोबेबिलिस्टिक नेचर की तुलना ट्रेडिशनल रूल-बेस्ड सॉफ्टवेयर में पाए जाने वाले प्रेडिक्टेबल एग्जीक्यूशन से करता है। जानें कि ये अलग-अलग पैराडाइम अलग-अलग ऑपरेशनल एनवायरनमेंट में सॉफ्टवेयर इंजीनियरिंग आर्किटेक्चर, रिस्क असेसमेंट और सिस्टम डिज़ाइन चॉइस पर कैसे असर डालते हैं।
AI एजेंट ऑटोनॉमी सॉफ्टवेयर सिस्टम को लक्ष्यों के लिए खुद से प्लान बनाने और काम करने देती है, जबकि ह्यूमन-गाइडेड डेवलपमेंट लोगों को हर कदम पर गाइड करता रहता है। दोनों तरीके यह तय करते हैं कि AI प्रोडक्ट कैसे बनते हैं, और उनमें से किसी एक को चुनने से असल दुनिया में डिप्लॉयमेंट में रिलायबिलिटी, क्रिएटिविटी और कंट्रोल पर असर पड़ता है।
AI एजेंट ऑटोनॉमस, गोल-ड्रिवन सिस्टम होते हैं जो अलग-अलग टूल्स पर काम की प्लानिंग, रीज़न और एग्जीक्यूट कर सकते हैं, जबकि ट्रेडिशनल वेब एप्लिकेशन फिक्स्ड यूज़र-ड्रिवन वर्कफ़्लो को फॉलो करते हैं। यह तुलना स्टैटिक इंटरफ़ेस से अडैप्टिव, कॉन्टेक्स्ट-अवेयर सिस्टम में बदलाव को हाईलाइट करती है जो यूज़र्स की प्रोएक्टिवली मदद कर सकते हैं, फैसलों को ऑटोमेट कर सकते हैं, और कई सर्विसेज़ के साथ डायनामिकली इंटरैक्ट कर सकते हैं।
AI एजेंट्स में सेल्फ-रिफ्लेक्शन, इटरेटिव रीज़निंग, एरर करेक्शन और अडैप्टिव बिहेवियर को मुमकिन बनाता है, जबकि स्टैटिक आउटपुट जेनरेशन बिना इंटरनल रिव्यू के फिक्स्ड रिस्पॉन्स देता है। रिफ्लेक्टिव अप्रोच मुश्किल कामों में ज़्यादा एक्यूरेसी और कॉन्टेक्स्चुअल अवेयरनेस के लिए स्पीड और कम्प्यूटेशनल कॉस्ट को ट्रेड करता है।