الذكاء الاصطناعيجيل معزز بالاسترجاعخرقةأنظمة البحثمعالجة اللغة الطبيعية
الاسترجاع المُراعي للسياق مقابل الاسترجاع غير المُراعي للسياق
يستخدم الاسترجاع المُراعي للسياق معلوماتٍ محيطة، مثل سجل الاستعلامات، ونية المستخدم، وعلاقات المستندات، لتقديم نتائج أكثر صلة، بينما يتعامل الاسترجاع غير المُراعي للسياق مع كل استعلام على حدة. يُشغّل النوع الأول الذكاء الاصطناعي التفاعلي الحديث والبحث المُخصّص، بينما يظل النوع الثاني مفيدًا لعمليات البحث البسيطة والعابرة.
المميزات البارزة
يحافظ الاسترجاع الواعي بالسياق على تماسك المحادثة من خلال تذكر الاستعلامات السابقة وإشارات المستخدم.
يُعد الاسترجاع غير المعتمد على السياق أسرع وأرخص وأسهل في النشر لعمليات البحث الواقعية لمرة واحدة.
تعتمد معظم مساعدي الذكاء الاصطناعي في الإنتاج الآن على الاسترجاع الواعي بالسياق للتعامل مع أسئلة المتابعة بدقة.
تُظهر المعايير الأكاديمية أن الأساليب الواعية بالسياق تتفوق على الأساليب الأساسية غير الواعية بالسياق بنسبة 10-20% في المهام متعددة الأدوار.
ما هو الاسترجاع الواعي بالسياق؟
نهج استرجاع يأخذ في الاعتبار سجل الاستعلام وسلوك المستخدم وسياق المستند لإرجاع نتائج أكثر صلة.
وهي تتضمن إشارات مثل أدوار المحادثة السابقة، وتفضيلات المستخدم، والبيانات الوصفية على مستوى الجلسة لتحسين نتائج البحث.
تعتمد أنظمة RAG الحديثة على الاسترجاع الواعي بالسياق للحفاظ على محادثات متماسكة متعددة الأدوار مع نماذج لغوية كبيرة.
تندرج تقنيات مثل إعادة كتابة الاستعلامات، وHyDE، والتضمينات السياقية تحت هذه الفئة.
تدعم قواعد البيانات المتجهة مثل Pinecone وWeaviate وChroma الاسترجاع الواعي بالسياق من خلال تصفية البيانات الوصفية والبحث الهجين.
يحقق هذا الأسلوب عموماً دقة أعلى في المعايير الحوارية والشخصية مقارنة بالأساليب التي لا تأخذ السياق في الاعتبار.
ما هو الاسترجاع الأعمى للسياق؟
نهج استرجاع يعالج كل استعلام بشكل مستقل دون مراعاة التفاعلات السابقة أو الإشارات الخاصة بالمستخدم.
يتعامل مع كل استعلام بحث كطلب مستقل، متجاهلاً سجل المحادثة أو سياق الجلسة.
تعمل محركات البحث الكلاسيكية عن الكلمات الرئيسية مثل تطبيقات Lucene و BM25 المبكرة بهذه الطريقة.
إنها أرخص وأسرع من الناحية الحسابية حيث لا يلزم معالجة أو تخزين سياق إضافي.
إنه يعمل بشكل جيد في عمليات البحث عن الحقائق حيث يحتوي الاستعلام وحده على معلومات كافية للعثور على الإجابة.
وهو بمثابة الأساس الذي تُقاس عليه الأساليب الواعية بالسياق عادةً في المعايير الأكاديمية.
جدول المقارنة
الميزة
الاسترجاع الواعي بالسياق
الاسترجاع الأعمى للسياق
معالجة الاستعلامات
يستخدم سجل الجلسة وإشارات المستخدم
يعالج كل استعلام بشكل مستقل
أهمية ذلك في المحادثات
مستوى عالٍ - يحافظ على تماسك الحوار
منخفض - يواجه صعوبة في المتابعة
التكلفة الحسابية
أعلى بسبب معالجة السياق
أقل وأسرع لكل استعلام
التخصيص
يدعم التخصيص على مستوى المستخدم
لا توجد تخصيصات افتراضياً
تعقيد التنفيذ
يتطلب ذلك ذاكرة، وإعادة كتابة، وبيانات وصفية
فهرس معكوس بسيط أو بحث متجهي
أفضل حالات الاستخدام
روبوتات الدردشة، والمساعدون، والبحث المخصص
استفسارات واقعية لمرة واحدة، البحث عن المستندات
تقنيات نموذجية
HyDE، إعادة كتابة الاستعلام، التضمينات السياقية
BM25، استرجاع كثيف أساسي، بحث بالكلمات المفتاحية
متطلبات التخزين
يحتاج إلى تخزين الجلسة والبيانات الوصفية
الحد الأدنى - مجرد الفهرس
مقارنة مفصلة
كيف يفهم كل نهج الاستعلامات
يُفسّر الاسترجاع المُراعي للسياق الاستعلام كجزء من تفاعل مستمر، معتمدًا على المحادثات السابقة وملفات تعريف المستخدمين، وحتى البيانات الوصفية المحيطة بالمستند، لفهم المقصود الحقيقي. في المقابل، ينظر الاسترجاع غير المُراعي للسياق إلى الاستعلام بمعزل عن السياق، حيث تُعدّ الكلمات التي تكتبها الإشارة الوحيدة التي يستخدمها. هذا يجعل الأنظمة غير المُراعية للسياق قابلة للتنبؤ وسهلة التصحيح، لكنها غالبًا ما تُخطئ الهدف عندما يعتمد السؤال على ما سبقه.
الأداء في سياقات المحادثة
عندما يتحدث المستخدمون مع مساعد ذكاء اصطناعي، نادرًا ما تكون أسئلة المتابعة مستقلة. عبارات مثل "ماذا عن الثاني؟" أو "كيف يقارن هذا؟" لا معنى لها إلا في سياق سابق. تعالج خاصية الاسترجاع المُراعي للسياق هذه الحالات تلقائيًا عن طريق إعادة صياغة الاستفسارات الغامضة إلى استفسارات مكتملة قبل البحث. أما الاسترجاع غير المُراعي للسياق، فيميل إلى إرجاع نتائج غير ذات صلة في مثل هذه الحالات، ولهذا السبب تستخدم معظم روبوتات الدردشة المستخدمة حاليًا نوعًا من آلية الاسترجاع المُراعية للسياق.
السرعة والتكلفة والبنية التحتية
لأن الاسترجاع غير المعتمد على السياق يتجاوز الجهد الإضافي المطلوب لإدارة الذاكرة وإعادة كتابة الاستعلامات، فإنه يعمل بشكل أسرع وبتكلفة أقل عند التشغيل على نطاق واسع. أما الاسترجاع المعتمد على السياق فيضيف عبئًا إضافيًا، إذ يتطلب تخزين حالة الجلسة، وتشغيل نماذج إعادة كتابة الاستعلامات، وغالبًا تصفية نتائج المتجهات بناءً على البيانات الوصفية. بالنسبة لأحمال العمل ذات الحجم الكبير والتعقيد المنخفض، مثل فهرسة ملايين المستندات الثابتة، لا تزال الطرق غير المعتمدة على السياق فعّالة.
دقة النتائج ومعاييرها
تُظهر الأبحاث المتعلقة باسترجاع النصوص الكثيفة في المحادثات، بما في ذلك أعمال Meta AI ومايكروسوفت على مجموعات بيانات مثل QReCC وTopiOCQA، باستمرار أن الأساليب المُراعية للسياق تتفوق على الأساليب غير المُراعية للسياق بنسبة 10-20% في نتائج MRR وnDCG. وتتسع الفجوة في الاستفسارات متعددة الأدوار حيث تهيمن الضمائر والإحالات. ومع ذلك، بالنسبة للأسئلة الواقعية أحادية الدور، يتقلص الفارق بشكل ملحوظ.
عندما تنتصر البساطة
لا تحتاج جميع التطبيقات إلى مراعاة السياق. فغالباً ما تعمل قواعد المعرفة الداخلية، والبحث في المستندات القانونية، والبحث عن منتجات التجارة الإلكترونية بكفاءة مع استرجاع المعلومات دون مراعاة السياق، لأن الاستعلامات عادةً ما تكون محددة ومكتفية ذاتياً. في هذه الحالات، تجعل بساطة وسرعة وانخفاض تكلفة البنية التحتية لاسترجاع المعلومات دون مراعاة السياق منه الخيار الأمثل.
الإيجابيات والسلبيات
الاسترجاع الواعي بالسياق
المزايا
+يتولى إدارة المحادثات متعددة الأدوار
+يدعم التخصيص
+درجات ملاءمة أعلى
+أفضل للاستفسارات الغامضة
تم
−ارتفاع تكلفة الحساب
−أكثر تعقيداً في التنفيذ
−يتطلب تخزين الجلسة
−يصعب تصحيح الأخطاء
الاسترجاع الأعمى للسياق
المزايا
+سريع وخفيف الوزن
+سهل التنفيذ
+انخفاض تكلفة البنية التحتية
+سلوك يمكن التنبؤ به
تم
−ضعف في متابعة الاستفسارات
−لا تخصيص
−انخفاض دقة المحادثة
−يفوته الإشارات الحوارية
الأفكار الخاطئة الشائعة
أسطورة
يتفوق الاسترجاع الواعي بالسياق دائمًا على الاسترجاع غير الواعي بالسياق.
الواقع
ليس بالضرورة. بالنسبة للاستعلامات المحددة بدقة والتي تتطلب خطوة واحدة، يمكن للأساليب غير المعتمدة على السياق أن تضاهي أو حتى تتفوق على الأساليب المعتمدة على السياق، لأنها تتجنب التشويش الذي قد يُدخله السياق الإضافي أحيانًا. وتبرز ميزة الاسترجاع المعتمد على السياق بشكل أوضح في السيناريوهات متعددة الخطوات أو المُخصصة.
أسطورة
إن استرجاع المعلومات دون مراعاة السياق أصبح قديماً ولم يعد مستخدماً.
الواقع
على العكس تماماً. لا تزال خوارزمية BM25 وتقنية الاسترجاع الكثيف الأساسية تشكلان العمود الفقري للعديد من أنظمة البحث الإنتاجية، بما في ذلك البحث عن المستندات المؤسسية ومنصات التجارة الإلكترونية. وهما بمثابة أساس متين، وغالباً ما يتم دمجهما مع طبقات واعية بالسياق في البنى الهجينة.
أسطورة
يعني الاسترجاع الواعي بالسياق أن النموذج "يتذكر" كل شيء.
الواقع
عملياً، تستخدم هذه الأنظمة نافذة محدودة من المحادثات الأخيرة، أو بيانات وصفية مُلخصة، أو استعلامات مُعاد صياغتها. ولا تزال الذاكرة طويلة الأمد الحقيقية مشكلة بحثية مفتوحة، وتنسى معظم الأنظمة المحادثات القديمة بمجرد خروجها من نافذة السياق.
أسطورة
البحث المتجهي يكون دائماً مدركاً للسياق.
الواقع
يمكن أن يكون استرجاع المتجهات الكثيفة إما هذا أو ذاك. فالبحث البسيط عن متجه دون تصفية البيانات الوصفية أو إعادة كتابة الاستعلام يكون في جوهره غير مدرك للسياق. أما إضافة سجل الجلسة أو عوامل التصفية أو توسيع الاستعلام فهو ما يجعله مدركًا للسياق.
أسطورة
يؤدي الاسترجاع الواعي بالسياق إلى القضاء على الهلوسة في أنظمة RAG.
الواقع
يقلل ذلك من هذه المشكلات، لكنه لا يقضي عليها تمامًا. فحتى مع جودة الاسترجاع، قد تُسيء نماذج اللغة تفسير النصوص أو تُدمج المعلومات بشكل خاطئ. جودة الاسترجاع جزءٌ من الحل، وسلوك التوليد لا يقل أهمية.
الأسئلة المتداولة
ما هو الاسترجاع المراعي للسياق في RAG؟
يشير مصطلح "الاسترجاع المُراعي للسياق" في لغة RAG إلى جلب المستندات مع مراعاة سجل المحادثة، ونية المستخدم، والبيانات الوصفية، بدلاً من الاعتماد على الاستعلام الخام فقط. ويتضمن ذلك عادةً إعادة صياغة الاستعلام، أو تضمينات سياقية، أو تصفية قائمة على الجلسة، لضمان أن تُجيب المقاطع المسترجعة فعلاً على ما قصده المستخدم في سياقها.
كيف يعمل الاسترجاع غير المعتمد على السياق؟
تعتمد تقنية الاسترجاع غير السياقي على مطابقة استعلام المستخدم مع فهرس دون الرجوع إلى أي تفاعلات سابقة. يندرج البحث الكلاسيكي بالكلمات المفتاحية BM25 وعمليات البحث الأساسية في المتجهات الكثيفة ضمن هذه الفئة. يُعامل كل استعلام كطلب جديد ومستقل، مما يحافظ على سرعة النظام وقابليته للتنبؤ.
أيهما أفضل بالنسبة لبرامج الدردشة الآلية، الاسترجاع المراعي للسياق أم الاسترجاع غير المراعي للسياق؟
يُعدّ الاسترجاع المُراعي للسياق أفضل في أغلب الأحيان لروبوتات المحادثة، لأن المستخدمين غالبًا ما يطرحون أسئلة متابعة تعتمد على إجابات سابقة. فبدون السياق، لا يستطيع النظام تحديد الضمائر أو الإشارات مثل "ذلك" أو "الخيار السابق"، مما يؤدي إلى إجابات غير ذات صلة.
هل يمكنك الجمع بين أسلوبي الاسترجاع؟
نعم، تجمع أنظمة الاسترجاع الهجينة بين البحث بالكلمات المفتاحية (غير المعتمد على السياق) والبحث الدلالي (الذي غالبًا ما يكون معتمدًا على السياق) لتحقيق التوازن بين السرعة والملاءمة. تستخدم العديد من أنظمة الإنتاج خوارزمية BM25 جنبًا إلى جنب مع التضمينات الكثيفة، ثم تدمج النتائج باستخدام دمج الترتيب المتبادل قبل تطبيق المرشحات السياقية.
هل تكلفة تشغيل عملية الاسترجاع الواعي بالسياق أعلى؟
نعم، هذا صحيح عمومًا، لأنك تحتاج إلى تخزين حالة الجلسة، وتشغيل نماذج إعادة كتابة الاستعلام، وتطبيق عوامل تصفية البيانات الوصفية. يختلف العبء الإضافي، ولكن توقع زيادة في زمن الاستجابة والحساب بنسبة تتراوح بين 20 و50% تقريبًا مقارنةً بالبحث المتجهي البسيط، وذلك اعتمادًا على مدى تعقيد معالجة السياق.
ما المقصود بإعادة كتابة الاستعلام في استرجاع المعلومات الواعي بالسياق؟
إعادة صياغة الاستعلام هي عملية تحويل سؤال غامض يعتمد على السياق إلى استعلام مستقل بذاته قبل البحث. على سبيل المثال، يمكن إعادة صياغة السؤال "ماذا عن سعره؟" إلى "ما هو سعر آيفون 15؟" بناءً على سجل المحادثة. تُعد هذه إحدى أكثر التقنيات شيوعًا في الأنظمة المُدركة للسياق.
هل BM25 غير مدرك للسياق؟
نعم، خوارزمية BM25 التقليدية لا تأخذ السياق بعين الاعتبار. فهي تُقيّم المستندات بناءً على تردد المصطلحات وتردد المستند العكسي بالنسبة للاستعلام الحالي. مع ذلك، يُمكنك دمج BM25 في مسار مُراعي للسياق عن طريق إعادة كتابة الاستعلام أولاً أو تصفية النتائج باستخدام بيانات تعريف الجلسة.
ما هي المعايير التي تقيس الاسترجاع الواعي بالسياق؟
تشمل المعايير الشائعة QReCC (إعادة صياغة الأسئلة في سياق المحادثة)، وTopiOCQA (الإجابة على الأسئلة في سياق المحادثة الموجهة نحو الموضوع)، وCAsT (مسار المساعدة في المحادثة). تقيّم مجموعات البيانات هذه مدى كفاءة الأنظمة في التعامل مع الاستفسارات متعددة المراحل حيث يكون السياق أساسيًا لإيجاد الإجابة الصحيحة.
هل تدعم جميع قواعد بيانات المتجهات الاسترجاع المراعي للسياق؟
تدعم معظم قواعد البيانات المتجهة الحديثة، مثل Pinecone وWeaviate وChroma وQdrant، تصفية البيانات الوصفية والبحث الهجين، وهما عنصران أساسيان لاسترجاع المعلومات المراعي للسياق. مع ذلك، فإن معالجة السياق الفعلية - إعادة كتابة الاستعلام، وذاكرة الجلسة - تُنفذ عادةً على مستوى التطبيق فوق قاعدة البيانات.
متى يجب عليّ استخدام الاسترجاع غير المعتمد على السياق بدلاً من ذلك؟
يُعدّ الاسترجاع غير المتأثر بالسياق خيارًا مناسبًا عندما تكون الاستعلامات مكتفية بذاتها، ولا حاجة للتخصيص، ويُعتبر زمن الاستجابة أو التكلفة من الأولويات. ومن الأمثلة على ذلك البحث الداخلي عن المستندات، والبحث القانوني، والبحث عن المنتجات على مواقع التجارة الإلكترونية، وأي سيناريو يكتب فيه المستخدمون عادةً أسئلة كاملة ومحددة.
الحكم
اختر الاسترجاع المُراعي للسياق عندما يتضمن تطبيقك محادثات متعددة المراحل، أو تخصيصًا، أو استفسارات متابعة غامضة - فهو المعيار لمساعدي الذكاء الاصطناعي ومساعدي RAG الحديثين. التزم بالاسترجاع غير المُراعي للسياق في عمليات البحث البسيطة ذات المرحلة الواحدة حيث تكون السرعة والتكلفة المنخفضة أهم من عمق المحادثة.