بسط پرسوجو به صورت پویا پرسوجوهای جستجو را با اصطلاحات اضافی در زمان اجرا غنی میکند، در حالی که جاسازیهای پرسوجوی ثابت به نمایشهای برداری از پیش محاسبهشدهای متکی هستند که ثابت میمانند. هر دو رویکرد مشکل عدم تطابق واژگان را در بازیابی اطلاعات برطرف میکنند، اما از نظر انعطافپذیری، هزینه محاسباتی و سازگاری با محتوای جدید تفاوتهای چشمگیری دارند.
برجستهها
بسط پرسوجو، خود متن پرسوجو را تغییر میدهد، در حالی که جاسازیهای پرسوجوی ثابت، آن را یک بار در یک بردار کدگذاری میکنند.
بسط در زمان اجرا با محتوای جدید سازگار میشود؛ تعبیههای ثابت پس از آموزش ثابت میمانند.
جاسازیهای ثابت در سرعت استنتاج و بسط در مدیریت واژگان نادر برتری دارند.
سیستمهای ترکیبی که هر دو را با هم ترکیب میکنند، به طور مداوم از هر یک از این رویکردها به تنهایی بهتر عمل میکنند.
بسط پرسوجو چیست؟
یک تکنیک بازیابی که عبارت جستجوی اصلی را با اصطلاحات مرتبط، مترادفها یا زمینههای مرتبط تکمیل میکند تا بازیابی جستجو را بهبود بخشد.
بسط جستجو، خود عبارت جستجو را با اضافه کردن کلمات مرتبط، مترادفها یا اصطلاحات بازخورد شبهارتباط قبل از تطبیق با اسناد، اصلاح میکند.
روشهای کلاسیک شامل بازخورد مرتبط Rocchio است که وزنهای پرسوجو را بر اساس اسناد مرتبط ارزیابیشده تنظیم میکند.
رویکردهای عصبی مدرن از مدلهای زبانی بزرگ برای تولید انواع پرسوجوی گسترشیافته در لحظه استفاده میکنند.
این تکنیک در دهه ۱۹۷۰ توسط محققانی مانند روچیو و سالتون به عنوان بخشی از سیستم بازیابی اطلاعات SMART رسمیت یافت.
بسط پرسوجو معمولاً فراخوانی را به طور قابل توجهی بهبود میبخشد، اما اگر عبارات بسط باعث ایجاد نویز شوند، میتواند به دقت آسیب برساند.
جاسازیهای پرسوجوی ثابت چیست؟
نمایشهای برداری متراکم از پیش محاسبهشده از پرسوجوها که ثابت میمانند و بدون تغییر در زمان اجرا، در جستجوهای مختلف دوباره استفاده میشوند.
جاسازیهای پرسوجوی ثابت، پرسوجو را با استفاده از یک مدل رمزگذار آموزشدیده مانند BERT یا یک تبدیلکننده جمله، در یک بردار متراکم واحد رمزگذاری میکنند.
پس از محاسبه، جاسازی بر اساس مجموعه یا جلسه جستجو تغییر نمیکند.
بازیابی از طریق جستجوی تقریبی نزدیکترین همسایه بر روی اسناد از پیش نمایه شده انجام میشود.
مدلهایی مانند DPR (بازیابی انبوه گذرگاه) و Contriever این رویکرد را برای پاسخ به سوالات در حوزه باز رواج دادند.
تعبیههای ثابت استنتاج سریعی ارائه میدهند، اما با اصطلاحات نادر یا خارج از واژگان که رمزگذار در طول آموزش ندیده است، مشکل دارند.
جدول مقایسه
ویژگی
بسط پرسوجو
جاسازیهای پرسوجوی ثابت
مکانیسم اصلی
عبارات را در زمان اجرا به پرس و جو اضافه میکند
پرسوجو را در بردار استاتیک کدگذاری میکند
سازگاری با محتوای جدید
بالا - میتواند سیگنالهای جدید را در خود جای دهد
پایین - در زمان تمرین یخ زده
هزینه محاسباتی به ازای هر پرس و جو
متوسط تا زیاد (تماسهای LLM امکانپذیر است)
پایین - رمزگذار تک گذر
مدیریت اصطلاحات نادر
قوی - تطبیق صریح اصطلاحات
ضعیف - بستگی به پوشش توکنساز دارد
موازنه دقت در مقابل فراخوانی
یادآوری را افزایش میدهد، ممکن است به دقت آسیب برساند
متعادل اما وابسته به جسم
الزامات نمایهسازی
شاخص معکوس استاندارد کار میکند
نیازمند شاخص برداری (FAISS، ScaNN) است
موارد استفاده معمول
جستجوی واژگانی، بازیابی ترکیبی
جستجوی معنایی، خطوط لوله RAG
تفسیرپذیری
بالا - شرایط قابل مشاهده هستند
فضای برداری کم - مات
مقایسه دقیق
چگونه آنها در زیر کاپوت کار میکنند
بسط پرسوجو بر اساس نمایش متنی پرسوجو عمل میکند و مترادفها، مفاهیم مرتبط یا اصطلاحات استخراجشده از اسناد برتر را اضافه میکند. جاسازیهای پرسوجوی ثابت، مسیری اساساً متفاوت را طی میکنند: یک رمزگذار عصبی، پرسوجو را به یک بردار پیوسته نگاشت میکند و شباهت در آن فضای جاسازی اندازهگیری میشود. مورد اول در دنیای توکنهای گسسته باقی میماند، در حالی که مورد دوم معنا را به هندسه فرو میریزد.
انعطافپذیری و سازگاری
از آنجا که بسط پرسوجو (Query Expansion) در زمان جستجو، اصطلاحات جدیدی تولید میکند، میتواند به مجموعه واقعی اسناد، رفتار کاربر یا روندهای اخیر واکنش نشان دهد. در مقابل، جاسازیهای پرسوجوی ثابت (Fixed Query Embeddings) در زمان آموزش تعبیه میشوند و نمیتوانند بدون آموزش مجدد، خود را با تغییر واژگان یا محتوای تازه فهرستبندی شده وفق دهند. این امر بسط را پاسخگوتر اما در عین حال متغیرتر در طول اجراها میکند.
ملاحظات عملکرد و هزینه
تعبیههای ثابت در برنامههای حساس به تأخیر میدرخشند، زیرا یک عبور رو به جلو از طریق یک رمزگذار ارزان است و بردار حاصل را میتوان ذخیره کرد. گسترش پرسوجو، بهویژه هنگامی که توسط مدلهای زبانی بزرگ پشتیبانی میشود، سربار به ازای هر پرسوجو اضافه میکند. با این حال، گسترش از هزینه سنگین زیرساخت برای نگهداری یک شاخص برداری جلوگیری میکند، که میتواند در مقیاس میلیارد سند بار واقعی باشد.
کیفیت در انواع مختلف پرس و جو
پرسوجوهای کوتاه و مبهم اغلب از بسط دادن سود میبرند زیرا زمینه اضافی، منظور را از ابهام خارج میکند. پرسوجوهای طولانی و خوشفرم گاهی اوقات از بسط دادن رنج میبرند زیرا عبارات اضافه شده، سیگنال اصلی را رقیق میکنند. تعبیههای ثابت، سوالات زبان طبیعی را به زیبایی مدیریت میکنند اما در اسمهای خاص نادر، اصطلاحات فنی یا اصطلاحات تازه ابداع شدهای که رمزگذار هرگز یاد نگرفته است، دچار مشکل میشوند.
رویکردهای ترکیبی و مدرن
امروزه اکثر سیستمهای بازیابی تولید، هر دو ایده را با هم ترکیب میکنند. یک الگوی رایج از جاسازیهای پرسوجوی ثابت برای یادآوری معنایی و بسط پرسوجو برای دقت واژگانی استفاده میکند، سپس دو لیست نتیجه را با هم ترکیب میکند. تحقیقات اخیر در مورد تکنیکهایی مانند HyDE (جاسازیهای سند فرضی) با استفاده از یک LLM برای تولید یک سند کاذب که جاسازی میشود، مرز را بیش از پیش محو میکند و به طور مؤثر بسط و جاسازی را در یک مرحله ادغام میکند.
مزایا و معایب
بسط پرسوجو
مزایا
+فراخوان بالا
+اصطلاحات قابل تفسیر
+کلمات نادر را مدیریت میکند
+نیازی به شاخص برداری نیست
مصرف شده
−میتواند به دقت آسیب برساند
−تأخیر بالاتر
−خطر نویز ناشی از انبساط
−تنظیم وزنها دشوار است
جاسازیهای پرسوجوی ثابت
مزایا
+استنتاج سریع
+تطبیق معنایی
+ذخیره سازی آسان
+قوی در نمایش سوالات طبیعی
مصرف شده
−استاتیک بعد از آموزش
−رفتار مبهم
−به شاخص برداری نیاز دارد
−در شرایط نادر ضعیف است
تصورات نادرست رایج
افسانه
گسترش پرسوجو همیشه نتایج جستجو را بهبود میبخشد.
واقعیت
بسط دادن، یادآوری را افزایش میدهد اما اغلب وقتی اصطلاحات اضافه شده نامربوط به موضوع باشند، به دقت آسیب میرساند. بسط کورکورانه میتواند نتایج مرتبط را در نویز غرق کند، به همین دلیل است که سیستمهای مدرن از استراتژیهای بسط انتخابی یا آموختهشده استفاده میکنند.
افسانه
جاسازیهای کوئری ثابت هر کلمهای را که به آنها میدهید، میفهمند.
واقعیت
رمزگذارها توسط توکنساز و دادههای آموزشی خود محدود میشوند. غلطهای املایی، نامهای جدید محصولات یا اصطلاحات تخصصی دامنه اغلب به زیرکلماتی تقسیم میشوند که مدل هرگز ندیده است و منجر به نمایش ضعیف میشوند.
افسانه
جستجوی برداری، بازیابی اطلاعات سنتی را منسوخ میکند.
واقعیت
روشهای لغوی مانند BM25 هنوز هم در بسیاری از معیارها، به ویژه برای پرسوجوهای پر از کلمات کلیدی، بازیابی متراکم را شکست میدهند. قویترین سیستمها ترکیبی هستند، نه برداری خالص.
افسانه
بسط پرسوجو یک تکنیک قدیمی است که دیگر اهمیتی ندارد.
واقعیت
روشهای بسط مبتنی بر LLM مانند query2doc و HyDE این حوزه را احیا کردهاند و نشان میدهند که بسط مدرن با اختلاف زیادی از رویکردهای سادهی کیسهی کلمات (bag of words) بهتر عمل میکند.
افسانه
مدلهای جاسازی بزرگتر همیشه به معنای بازیابی بهتر هستند.
واقعیت
بازده نزولی به سرعت وارد عمل میشود و یک انکودر کوچک تنظیمشده با استخراج منفی سخت، اغلب با کسری از هزینه، با یک مدل عظیم برابری میکند.
سوالات متداول
تفاوت اصلی بین بسط پرسوجو و جاسازی پرسوجوی ثابت چیست؟
بسط پرسوجو، عبارات اضافی را در زمان اجرا به پرسوجوی جستجو اضافه میکند تا تطابق را گسترش دهد، در حالی که جاسازیهای پرسوجوی ثابت، پرسوجو را یک بار به یک بردار متراکم تبدیل کرده و دوباره از آن استفاده میکنند. اولی متن را دستکاری میکند، دومی هندسه را دستکاری میکند.
کدام رویکرد در زمان پرس و جو سریعتر است؟
جاسازیهای پرسوجوی ثابت معمولاً سریعتر هستند زیرا فقط به یک گذر رمزگذار و جستجوی نزدیکترین همسایه نیاز دارند. بسط پرسوجو میتواند شامل چندین فراخوانی LLM یا حلقههای بازخورد شبهربط باشد که باعث افزایش تأخیر میشود.
آیا میتوان Query Expansion و Fixed Query Embeddings را با هم ترکیب کرد؟
بله، و این به طور فزایندهای به پیشفرض در تولید تبدیل میشود. خطوط لوله ترکیبی، هم بازیابیکنندهها را اجرا میکنند و هم نتایج را با استفاده از ترکیب رتبه متقابل یا یک رتبهبندیکننده آموختهشده ادغام میکنند و نقاط قوت هر یک را به دست میآورند.
چرا جاسازیهای کوئری ثابت با عبارات نادر مشکل دارند؟
رمزگذارها کلمات ناآشنا را به قطعات زیرکلمه تقسیم میکنند که ممکن است معنای مورد نظر را نداشته باشند. بدون قرار گرفتن در معرض در طول آموزش، بردار حاصل اساساً یک حدس است که به دقت بازیابی در واژگان فنی یا کاملاً جدید آسیب میرساند.
آیا هنوز هم از بسط پرسوجو در سیستمهای هوش مصنوعی مدرن استفاده میشود؟
کاملاً. تکنیکهایی مانند HyDE، query2doc و step-back prompting همگی بر اصول بسط متکی هستند و اغلب از مدلهای زبانی بزرگ برای تولید پاسخهای فرضی یا مفاهیم مرتبط استفاده میکنند که بازیابی پاییندستی را بهبود میبخشند.
آیا Fixed Query Embeddings برای دامنههای جدید نیاز به آموزش مجدد دارد؟
اغلب بله. انکودرهای عمومی به طور معقولی در حوزههای مختلف کار میکنند، اما حوزههای تخصصی مانند پزشکی یا حقوق از مدلهای سازگار با حوزه سود میبرند. تنظیم دقیق جفتهای پرسوجو-سند درونحوزهای معمولاً دستاوردهای معناداری را به همراه دارد.
بازخورد شبهارتباط در بسط پرسوجو چیست؟
این تکنیکی است که در آن سیستم فرض میکند اسناد برتر از جستجوی اولیه مرتبط هستند، سپس عبارات پرتکرار را از آنها استخراج میکند تا پرسوجو را گسترش دهد. این روش خودکار است اما اگر رتبهبندی اولیه ضعیف باشد، میتواند خطاها را تشدید کند.
کدام روش غلطهای املایی و تایپی را بهتر مدیریت میکند؟
جاسازیهای پرسوجوی ثابت معمولاً در برابر غلطهای املایی مقاومتر هستند زیرا رمزگذارها تطبیق معنایی فازی را یاد میگیرند. بسط پرسوجو مبتنی بر تطبیق دقیق توکن، در مورد اصطلاحات غلط املایی کاملاً ناموفق خواهد بود، مگر اینکه تصحیح املایی در بالادست اضافه شود.
چگونه شاخصهای برداری مانند FAISS در Fixed Query Embeddings قرار میگیرند؟
کتابخانههای FAISS، ScaNN و مشابه آن، جستجوی سریع نزدیکترین همسایه تقریبی را در میلیونها یا میلیاردها بردار جاسازیشده امکانپذیر میکنند. بدون آنها، جستجوی دقیق شباهت در مقیاس بزرگ، بسیار کند خواهد بود.
آیا Query Expansion با کوئریهای کوتاه به خوبی کار میکند؟
بله، جستجوهای کوتاه اغلب بیشترین سود را دارند زیرا سیگنال کمی برای شروع وجود دارد. اضافه کردن عبارات مرتبط، به جستجوگر اطلاعات بیشتری برای کار میدهد، هرچند برای جلوگیری از انحراف از هدف کاربر، باید دقت کرد.
حکم
وقتی مجموعه دادههای شما بزرگ است، پرسوجوهای شما شامل اصطلاحات نادر یا فنی هستند و به بازیابی قابل تفسیر و تطبیقپذیر نیاز دارید، Query Expansion را انتخاب کنید. وقتی تأخیر مهم است، پرسوجوهای شما سوالات زبان طبیعی هستند و میتوانید از زیرساخت نمایهسازی برداری استفاده کنید، Fixed Query Embeddings را انتخاب کنید. در عمل، قویترین سیستمها به جای انتخاب یکی از طرفین، از هر دو با هم استفاده میکنند.