الذكاء الاصطناعيالتعلم الآليجيل معزز بالاسترجاعنماذج اللغة الكبيرةهندسة الذكاء الاصطناعي

زيادة الذاكرة الخارجية مقابل ذاكرة النموذج الداخلية

يُتيح تعزيز الذاكرة الخارجية لأنظمة الذكاء الاصطناعي مخزنًا معرفيًا منفصلاً وقابلاً للبحث، يمكنها الاستعانة به أثناء الاستدلال، بينما تُدمج ذاكرة النموذج الداخلية المعرفة مباشرةً في أوزان الشبكة العصبية أثناء التدريب. ويُوازن كل نهج بين المرونة وسرعة الاستجابة وعمق الاستدلال بطرق مختلفة.

المميزات البارزة

يمكن تحديث الذاكرة الخارجية في دقائق؛ أما الذاكرة الداخلية فتتطلب إعادة تدريب مكلفة.
توفر الذاكرة الداخلية استدلالًا أسرع نظرًا لعدم الحاجة إلى خطوة استرجاع.
تقلل الذاكرة الخارجية من الهلوسة عن طريق ربط الاستجابات بالمصادر المسترجعة.
أصبحت البنى الهجينة التي تجمع بين كلا النهجين هي المعيار الإنتاجي.

ما هو زيادة الذاكرة الخارجية؟

نهج قائم على الاسترجاع حيث تصل نماذج الذكاء الاصطناعي إلى المعلومات المخزنة من مصادر خارجية أثناء الاستدلال بدلاً من الاعتماد فقط على المعلمات المتعلمة.

يُعدّ توليد البيانات المعزز بالاسترجاع (RAG) الشكل الأكثر انتشارًا، والذي قدمته شركة أبحاث الذكاء الاصطناعي في فيسبوك في عام 2020.
تتخذ الذاكرة الخارجية عادةً شكل قواعد بيانات متجهة مثل FAISS أو Pinecone أو Weaviate التي تخزن تضمينات المستندات.
يمكن تحديث المعرفة في الوقت الفعلي ببساطة عن طريق إضافة أو تعديل الإدخالات في المخزن الخارجي، دون إعادة تدريب النموذج.
تعتمد أنظمة مثل وضع التصفح في ChatGPT وميزة الواقعية المعززة بالبحث من Google على الاسترجاع الخارجي لتأسيس الاستجابات على المعلومات الحالية.
يقلل هذا النهج بشكل كبير من الهلوسة عندما يكون السياق المسترجع ذا صلة ومنظمًا بشكل جيد.

ما هو ذاكرة النموذج الداخلية؟

المعرفة المشفرة مباشرة داخل معلمات الشبكة العصبية من خلال التدريب، مما يسمح للنموذج باسترجاع المعلومات دون الحاجة إلى عمليات بحث خارجية.

تقوم نماذج اللغة الكبيرة مثل GPT-4 و Claude و Llama بتخزين الجزء الأكبر من معرفتها الواقعية في مليارات الأوزان المتعلمة.
يتم اكتساب الذاكرة الداخلية أثناء التدريب المسبق على مجموعات النصوص الضخمة، ويتم تحسينها من خلال الضبط الدقيق والتعلم المعزز.
بمجرد اكتمال التدريب، تصبح المعرفة ثابتة ما لم يخضع النموذج لتدريب إضافي أو ضبط دقيق.
يتم استرجاع المعلومات من الذاكرة الداخلية من خلال عمليات تمرير أمامية تنشط المسارات العصبية ذات الصلة، مما ينتج عنه مخرجات في خطوة واحدة.
تشير الأبحاث التي أجريت من قبل معهد ماساتشوستس للتكنولوجيا وشركة أنثروبيك إلى أن استرجاع الحقائق من الأوزان غالباً ما يكون ترابطياً ويمكن أن يكون غير متسق عبر الصياغات.

جدول المقارنة

الميزة	زيادة الذاكرة الخارجية	ذاكرة النموذج الداخلية
موقع تخزين المعرفة	قاعدة بيانات متجهة منفصلة أو مخزن مستندات	مُشفّرة ضمن معلمات النموذج (الأوزان)
طريقة التحديث	إضافة أو تعديل المستندات في المخزن الخارجي	أعد تدريب النموذج أو اضبطه بدقة
زمن استدلال البيانات	أعلى بسبب خطوة الاسترجاع	تمريرة أمامية واحدة منخفضة
قابلية توسيع المعرفة	غير محدود عمليًا، ويتوسع مع سعة التخزين	محدود بحجم النموذج وبيانات التدريب
خطر الهلوسة	انخفاض عندما تكون عملية الاسترجاع دقيقة	أعلى، خاصة بالنسبة للحقائق الغامضة أو الحديثة
التكلفة الحسابية	انخفاض تكلفة التدريب، وارتفاع تكلفة الاستعلام الواحد	تكلفة تدريب عالية، تكلفة منخفضة لكل استعلام
الشفافية	يمكن الاستشهاد بالمصادر مباشرة	المعرفة مبهمة، وتتوزع على أوزان مختلفة
الأنسب لـ	المعرفة الديناميكية، البحث المؤسسي، أسئلة وأجوبة واقعية	التفكير المنطقي العام، والمهام الإبداعية، وطلاقة المحادثة

مقارنة مفصلة

كيفية اكتساب المعرفة وتخزينها

تعتمد تقنية تعزيز الذاكرة الخارجية على بناء المعرفة خارج النموذج، وذلك عادةً عن طريق تضمين المستندات في متجهات وتخزينها في قاعدة بيانات يستعلم عنها النموذج عند الحاجة. أما ذاكرة النموذج الداخلية فتعمل بطريقة معاكسة: حيث تُدمج الحقائق في مليارات الأوزان الرقمية أثناء التدريب، لتصبح جزءًا من النسيج العصبي للنموذج. يتعامل النهج الأول مع الذاكرة كمكتبة يزورها النموذج، بينما يتعامل معها النهج الثاني كخبرة عملية يحملها النموذج معه.

تحديث المعرفة والحفاظ عليها

عند ظهور معلومات جديدة، يمكن تحديث أنظمة الذاكرة الخارجية في غضون دقائق بتحديث قاعدة البيانات. أما نماذج الذاكرة الداخلية فتتطلب عمليات إعادة تدريب أو ضبط دقيقة مكلفة قد تستغرق أسابيع وتكلف ملايين الدولارات. وهذا يجعل التوسع الخارجي أكثر جدوى في المجالات التي تتغير فيها المعلومات بسرعة، مثل قواعد البيانات القانونية، والإرشادات الطبية، وقوائم المنتجات.

الدقة وسلوك الهلوسة

تميل الذاكرة الخارجية إلى ربط الإجابات بمصادر موثوقة، مما يقلل بشكل كبير من الإجابات الملفقة عندما تُعيد خطوة الاسترجاع مقاطع ذات صلة. أما نماذج الذاكرة الداخلية، فتستطيع إنتاج حقائق تبدو معقولة ولكنها غير صحيحة، خاصةً في المواضيع المتخصصة أو أي شيء ظهر بعد انتهاء فترة تدريبها. غالبًا ما تتفوق الأنظمة الهجينة التي تجمع بين كلا النهجين على أي منهما على حدة في المعايير الواقعية.

المفاضلة بين الأداء والتكلفة

تتفوق الذاكرة الداخلية من حيث سرعة الاستدلال الخام لعدم حاجتها إلى خطوة استرجاع، مما يجعلها مثالية للتطبيقات الحساسة للتأخير مثل روبوتات المحادثة ومساعدي البرمجة. تضيف الذاكرة الخارجية خطوة استرجاع قد تزيد من وقت الاستعلام من 100 إلى 500 مللي ثانية، لكنها تقلل بشكل كبير من عدد المعلمات اللازمة لنطاق معرفي محدد. تستخدم العديد من أنظمة الإنتاج حاليًا نماذج أصغر حجمًا مع ذاكرة خارجية غنية بدلًا من النماذج الضخمة التي تحتوي على كل شيء مدمجًا.

الاستدلال والتعميم

تتفوق الذاكرة الداخلية في الاستدلال المجرد والقياس والتركيب الإبداعي، لأن المعرفة فيها مُدمجة بعمق مع دوائر الاستدلال في النموذج. أما الذاكرة الخارجية، فهي أشبه بأداة بحث، ممتازة للحقائق، لكنها أقل فعالية في دمج الأفكار بطرق مبتكرة. ويركز البحث العلمي في مجال الذكاء الاصطناعي بشكل متزايد على الأنظمة التي تجمع بين النوعين، مستخدمةً الذاكرة الداخلية للاستدلال والذاكرة الخارجية للربط بين المعلومات.

الإيجابيات والسلبيات

زيادة الذاكرة الخارجية

المزايا

+ تحديثات فورية
+ اقتباس المصدر
+ انخفاض تكلفة التدريب
+ نطاق معرفي غير محدود

تم

− زيادة زمن استجابة الاستعلام
− جودة الاسترجاع تعتمد
− تكاليف البنية التحتية
− استدلال أقل فعالية

ذاكرة النموذج الداخلية

المزايا

+ الاستدلال السريع
+ قدرة على التفكير العميق
+ لا توجد تبعيات خارجية
+ نشر مضغوط

تم

− تحديثه مكلف
− حدود المعرفة
− زيادة خطر الهلوسة
− تخزين المعرفة المبهمة

الأفكار الخاطئة الشائعة

أسطورة

يؤدي تعزيز الذاكرة الخارجية إلى القضاء التام على الهلوسة في أنظمة الذكاء الاصطناعي.

الواقع

على الرغم من أن ترسيخ الاسترجاع يقلل بشكل ملحوظ من الهلوسات، إلا أنه لا يقضي عليها تمامًا. فإذا أسفرت خطوة الاسترجاع عن مستندات غير ذات صلة أو ذات جودة منخفضة، فقد يُنتج النموذج إجابات خاطئة. وتعتمد فعالية النموذج بشكل كبير على جودة التضمينات، واستراتيجية التجزئة، وترتيب الصلة في أداة الاسترجاع.

أسطورة

تتذكر النماذج الأكبر حجماً حقائق أكثر بشكل موثوق من النماذج الأصغر حجماً.

الواقع

يُحسّن التوسع متوسط الاستدعاء، لكنه لا يضمن الاتساق. وقد أظهرت الأبحاث أن حتى النماذج الكبيرة قد تفشل في استرجاع الحقائق التي صادفتها بوضوح أثناء التدريب، خاصةً عندما تُصاغ الأسئلة بشكل مختلف عن السياق الأصلي. يُعدّ الحفظ في الشبكات العصبية ترابطيًا وهشًا مقارنةً بالتخزين الصريح في قواعد البيانات.

أسطورة

لا تحتاج أنظمة RAG إلى أي تدريب أو ضبط دقيق.

الواقع

مع أن قاعدة المعرفة نفسها لا تتطلب تدريبًا، إلا أن أنظمة RAG الإنتاجية تستفيد بشكل كبير من ضبط مُسترجع البيانات، ونموذج التضمين، وأحيانًا المُولِّد. غالبًا ما تكون أداء مسارات RAG الجاهزة أقل بكثير من أداء المسارات المُخصصة في المهام الخاصة بمجالات محددة.

أسطورة

يتم تثبيت ذاكرة النموذج الداخلية بشكل دائم بمجرد انتهاء التدريب.

الواقع

تتيح التقنيات الحديثة، مثل التعلم المستمر، والضبط الدقيق لـ LoRA، وتعديل النموذج، إجراء تحديثات مُستهدفة للمعرفة الداخلية للنموذج دون الحاجة إلى إعادة تدريبه بالكامل. ويمكن لأساليب مثل ROME وMEMIT تعديل حقائق مُحددة في أوزان النموذج مباشرةً، إلا أن هذه الأساليب لا تزال أقل موثوقية من مجرد تحديث قاعدة بيانات خارجية.

أسطورة

الذاكرة الخارجية والذاكرة الداخلية هما نهجان متنافيان.

الواقع

تستخدم معظم أنظمة الذكاء الاصطناعي الحديثة كلا الأسلوبين معًا. قد يعتمد النموذج على أوزان داخلية للاستدلال العام وطلاقة اللغة، بينما يستخلص حقائق محددة من قاعدة بيانات خارجية. صُممت أطر عمل مثل LangChain وLlamaIndex خصيصًا لتنسيق هذا السلوك الهجين.

الأسئلة المتداولة

ما هو الفرق الرئيسي بين تعزيز الذاكرة الخارجية وذاكرة النموذج الداخلية؟

تُخزّن تقنية توسيع الذاكرة الخارجية المعرفة في قاعدة بيانات منفصلة يستعلم عنها النموذج أثناء التشغيل، بينما تُشفّر ذاكرة النموذج الداخلية المعرفة مباشرةً في أوزان الشبكة العصبية أثناء التدريب. يُشبه الأول منح النموذج إمكانية الوصول إلى مكتبة، بينما يُشبه الثاني جعل النموذج يحفظ كل ما قرأه.

أي نهج يقلل من الهلوسة الناتجة عن الذكاء الاصطناعي بشكل أكثر فعالية؟

يُقلل تعزيز الذاكرة الخارجية عمومًا من الهلوسات بشكل أكثر فعالية لأن الاستجابات تستند إلى وثائق مُسترجعة يُمكن الاستشهاد بها والتحقق منها. مع ذلك، لا تزال نماذج الذاكرة الداخلية قادرة على الهلوسة بثقة، خاصةً فيما يتعلق بالحقائق الغامضة أو المواضيع الخارجة عن نطاق تدريبها. ومع ذلك، تُعد جودة الاسترجاع بالغة الأهمية، وقد يُؤدي الاسترجاع الضعيف إلى إدخال أخطاء خاصة به.

هل يمكنك الجمع بين زيادة الذاكرة الخارجية وذاكرة النموذج الداخلية؟

نعم، ومعظم أنظمة الذكاء الاصطناعي المستخدمة في الإنتاج تفعل ذلك بالضبط. يستخدم النموذج أوزانه الداخلية للاستدلال وتوليد اللغة والتعرف على الأنماط، بينما يستخلص حقائق محددة من قاعدة بيانات خارجية. هذا النهج الهجين هو أساس المساعدين الحديثين الذين يعتمدون على تقنية RAG، وتدعمه أطر عمل مثل LangChain وLlamaIndex وHaystack.

كم تبلغ تكلفة تحديث المعرفة في كل نظام؟

يُعدّ تحديث الذاكرة الخارجية مجانيًا تقريبًا من حيث تكلفة الحوسبة، إذ يكفي إضافة المستندات أو تعديلها في قاعدة البيانات. أما تحديث الذاكرة الداخلية من خلال إعادة التدريب، فقد يُكلّف ما بين آلاف إلى ملايين الدولارات، وذلك بحسب حجم النموذج، وحتى التقنيات الأخفّ وزنًا، مثل ضبط LoRA الدقيق، لا تزال تتطلب ساعات من وحدة معالجة الرسومات (GPU) وتقييمًا دقيقًا.

هل RAG هو نفسه توسيع الذاكرة الخارجية؟

يُعدّ RAG التطبيق الأكثر شيوعًا لتوسيع الذاكرة الخارجية، لكن المفهوم أوسع من ذلك. تشمل الذاكرة الخارجية أيضًا استخدام الأدوات، واستدعاءات واجهة برمجة التطبيقات (API)، ومساحات العمل المؤقتة، ومخازن الذاكرة المؤقتة. يشير RAG تحديدًا إلى استرجاع مقاطع نصية من قاعدة بيانات متجهة لتكييف استجابة النموذج.

أي من الطريقتين أسرع في مرحلة الاستدلال؟

تُعدّ ذاكرة النموذج الداخلية أسرع لأنها تتطلب تمريرة واحدة فقط عبر الشبكة العصبية. أما توسيع الذاكرة الخارجية فيضيف خطوة استرجاع تستغرق عادةً من 100 إلى 500 مللي ثانية، وذلك بحسب حجم قاعدة البيانات وطريقة البحث عن البيانات المضمنة. بالنسبة للتطبيقات التي تعمل في الوقت الفعلي، قد يكون هذا الفرق في زمن الاستجابة كبيرًا.

هل تستخدم نماذج اللغة الكبيرة الذاكرة الخارجية على الإطلاق؟

نعم، بل وأكثر من ذلك. يستخدم ChatGPT خاصية الاسترجاع لتصفحه وميزات GPT المخصصة، ويستطيع Claude البحث في المستندات والأدوات، بينما يدمج Gemini نتائج بحث جوجل مباشرةً. حتى النماذج ذات الذاكرة الداخلية الضخمة تستفيد من الاسترجاع الخارجي للأحداث الجارية والمعلومات الخاصة.

ماذا يحدث عندما تفشل عملية استرجاع البيانات من الذاكرة الخارجية؟

عندما لا تُسفر عملية الاسترجاع عن أي نتائج ذات صلة، يلجأ النموذج عادةً إلى ذاكرته الداخلية، مما يعني استمرار إمكانية حدوث أخطاء غير متوقعة. تتعامل أنظمة RAG القوية مع هذا الأمر من خلال الاعتراف بعدم اليقين، وطرح أسئلة توضيحية، أو رفض الإجابة عند انخفاض مستوى الثقة. ولذلك، تُعد جودة أداة الاسترجاع أهم عنصر في مسار RAG.

هل يمكن تعديل ذاكرة النموذج الداخلية دون إعادة التدريب؟

نعم، من خلال تقنيات تحرير النماذج مثل ROME وMEMIT وأساليب تقطير المعرفة التي تستهدف حقائق محددة في الأوزان. يمكن لهذه الأساليب إدراج أو تعديل أو حذف حقائق فردية، لكنها أقل موثوقية من تحديث قاعدة بيانات خارجية، وقد تؤدي أحيانًا إلى تدهور أداء النموذج بشكل عام.

أي نهج هو الأفضل لتطبيقات الذكاء الاصطناعي في المؤسسات؟

يُعدّ توسيع الذاكرة الخارجية الخيار الأمثل عادةً لتطبيقات المؤسسات، إذ يسمح للشركات بالاحتفاظ ببياناتها الخاصة في قواعد بياناتها الآمنة دون الحاجة إلى إعادة تدريب النماذج. كما يوفر إمكانية التدقيق من خلال توثيق المصادر، وهو أمر بالغ الأهمية للقطاعات الخاضعة للتنظيم، مثل القطاع المالي والرعاية الصحية والقانوني.

الحكم

اختر توسيع الذاكرة الخارجية عندما يتطلب تطبيقك معلومات محدّثة، وتحديد المصدر، والقدرة على تحديث المعرفة دون إعادة التدريب. اختر ذاكرة النموذج الداخلية عندما تحتاج إلى استدلال سريع، وقدرة استدلالية قوية، ونظام مكتفٍ ذاتيًا لا يعتمد على بنية تحتية خارجية. عمليًا، تجمع أنظمة الذكاء الاصطناعي الأكثر كفاءة اليوم بين الاثنين، حيث تستخدم الاسترجاع لتحديد الحقائق والأوزان الداخلية للاستدلال عليها.

المقارنات ذات الصلة

RAG (التوليد المعزز بالاسترجاع) مقابل نماذج LLM المُحسَّنة

يُحسّن كلٌّ من RAG ونماذج LLM المُحسّنة جودة مخرجات الذكاء الاصطناعي، لكنهما يعملان بطرق مختلفة تمامًا. يستخلص RAG المعلومات الخارجية عند الاستعلام، بينما يُدمج التحسين المعرفة الجديدة مباشرةً في أوزان النموذج. ويعتمد الاختيار بينهما على مدى تكرار تغيّر البيانات ومستوى الدقة المطلوب.

آليات الانتباه الذاتي مقابل نماذج فضاء الحالة

تُعد آليات الانتباه الذاتي ونماذج فضاء الحالة من المناهج الأساسية لنمذجة التسلسلات في الذكاء الاصطناعي الحديث. يتفوق الانتباه الذاتي في التقاط العلاقات الغنية بين الرموز، ولكنه يصبح مكلفًا مع التسلسلات الطويلة، بينما تعالج نماذج فضاء الحالة التسلسلات بكفاءة أكبر مع التوسع الخطي، مما يجعلها جذابة للتطبيقات ذات السياق الطويل والتطبيقات الآنية.

آليات الانتباه في الرؤية مقابل الانتباه في معالجة اللغة الطبيعية

تُعدّ آليات الانتباه أساسية في الذكاء الاصطناعي الحديث، سواءً في مجال رؤية الحاسوب أو معالجة اللغة الطبيعية، إلا أنها تخدم أغراضًا مختلفة وتطورت عبر مسارات متباينة. يساعد الانتباه في مجال الرؤية النماذج على التركيز على مناطق الصورة ذات الصلة، بينما يُمكّن الانتباه في معالجة اللغة الطبيعية من فهم العلاقات بين الكلمات في النصوص.

أساليب الممثل-الناقد مقابل أساليب تدرج السياسة البحتة

تجمع أساليب الممثل-الناقد بين تدرجات السياسة ودالة القيمة المُتعلمة لتقليل التباين وتسريع عملية التعلم، بينما تعتمد أساليب تدرج السياسة البحتة كليًا على السياسة وعوائد مونت كارلو. ويعتمد الاختيار بينهما على ما إذا كنت بحاجة إلى الاستقرار وكفاءة العينة أم إلى البساطة والتقديرات غير المتحيزة.

أساليب تعلم الرسم البياني الزمني مقابل أساليب نمذجة التسلسل

تُفصّل هذه المقارنة الاختلافات الهيكلية الأساسية، وحالات الاستخدام العملية، والمفاضلات في الأداء بين تعلّم الرسم البياني الزمني ونمذجة التسلسل التقليدية. فبينما تُجسّد نمذجة التسلسل التطورات الخطية كالنصوص أو بيانات السلاسل الزمنية، يُعالج تعلّم الرسم البياني الزمني تفاعلات الشبكة والعلاقات المتغيرة مع الزمن في آنٍ واحد، مما يُوفر لك مخططًا شاملاً لاختيار البنية المناسبة.