Ekspansi Kueri secara dinamis memperkaya kueri pencarian dengan istilah tambahan pada saat runtime, sementara Penyematan Kueri Tetap mengandalkan representasi vektor yang telah dihitung sebelumnya yang tetap konstan. Kedua pendekatan ini mengatasi masalah ketidaksesuaian kosakata dalam pengambilan informasi, tetapi keduanya sangat berbeda dalam hal fleksibilitas, biaya komputasi, dan kemampuan beradaptasi terhadap konten baru.
Sorotan
Ekspansi Kueri memodifikasi teks kueri itu sendiri, sementara Penyematan Kueri Tetap mengkodekannya sekali ke dalam vektor.
Ekspansi beradaptasi dengan konten baru saat runtime; embedding tetap dipertahankan setelah pelatihan.
Penyematan tetap unggul dalam kecepatan inferensi; perluasan unggul dalam menangani kosakata langka.
Sistem hibrida yang menggabungkan keduanya secara konsisten mengungguli masing-masing pendekatan secara terpisah.
Apa itu Ekspansi Kueri?
Teknik pencarian yang melengkapi kueri asli dengan istilah terkait, sinonim, atau konteks untuk meningkatkan daya ingat hasil pencarian.
Ekspansi Kueri memodifikasi kueri pencarian itu sendiri dengan menambahkan kata-kata terkait, sinonim, atau istilah umpan balik pseudo-relevansi sebelum mencocokkannya dengan dokumen.
Metode klasik mencakup umpan balik relevansi Rocchio, yang menyesuaikan bobot kueri berdasarkan dokumen yang dinilai relevan.
Pendekatan neural modern menggunakan model bahasa besar untuk menghasilkan varian kueri yang diperluas secara langsung.
Teknik ini diformalkan pada tahun 1970-an oleh para peneliti seperti Rocchio dan Salton sebagai bagian dari sistem penelusuran informasi SMART.
Ekspansi kueri biasanya meningkatkan recall secara signifikan tetapi dapat menurunkan presisi jika istilah ekspansi menimbulkan noise.
Apa itu Penyematan Kueri Tetap?
Representasi vektor padat yang telah dihitung sebelumnya dari kueri yang tetap statis dan digunakan kembali di berbagai pencarian tanpa modifikasi saat runtime.
Penyematan Kueri Tetap (Fixed Query Embeddings) mengkodekan kueri ke dalam vektor padat tunggal menggunakan model pengkodean terlatih seperti BERT atau transformer kalimat.
Setelah dihitung, embedding tidak akan berubah berdasarkan korpus atau sesi pencarian.
Pengambilan data dilakukan melalui pencarian tetangga terdekat secara perkiraan pada embedding dokumen yang telah diindeks sebelumnya.
Model-model seperti DPR (Dense Passage Retrieval) dan Contriever mempopulerkan pendekatan ini untuk menjawab pertanyaan di domain terbuka.
Embedding tetap menawarkan inferensi yang cepat tetapi kesulitan menangani istilah langka atau di luar kosakata yang belum pernah dilihat oleh encoder selama pelatihan.
Tabel Perbandingan
Fitur
Ekspansi Kueri
Penyematan Kueri Tetap
Mekanisme Inti
Menambahkan istilah ke kueri saat runtime
Mengenkode kueri ke dalam vektor statis
Kemampuan Beradaptasi dengan Konten Baru
Tinggi — dapat menggabungkan sinyal baru
Rendah — dibekukan pada waktu pelatihan
Biaya Komputasi Per Kueri
Sedang hingga tinggi (kemungkinan panggilan LLM)
Rendah — lintasan encoder tunggal
Penanganan Istilah Langka
Pencocokan istilah yang kuat dan eksplisit
Lemah — bergantung pada cakupan tokenizer
Pertukaran antara Presisi dan Recall
Meningkatkan daya ingat, tetapi dapat mengurangi ketepatan.
Seimbang tetapi bergantung pada korpus.
Persyaratan Pengindeksan
Indeks terbalik standar berfungsi
Membutuhkan indeks vektor (FAISS, ScaNN)
Kasus Penggunaan Umum
Pencarian leksikal, penelusuran hibrida
Pencarian semantik, pipeline RAG
Interpretasi
Tinggi — istilah terlihat
Ruang vektor buram rendah
Perbandingan Detail
Bagaimana Cara Kerjanya di Balik Layar
Ekspansi Kueri beroperasi pada representasi tekstual kueri, menambahkan sinonim, konsep terkait, atau istilah yang diambil dari dokumen berperingkat teratas. Penyematan Kueri Tetap mengambil jalur yang pada dasarnya berbeda: sebuah encoder neural memetakan kueri ke dalam vektor kontinu, dan kesamaan diukur dalam ruang penyematan tersebut. Yang pertama tetap berada di dunia token diskrit, sedangkan yang kedua mereduksi makna menjadi geometri.
Fleksibilitas dan Kemampuan Beradaptasi
Karena Ekspansi Kueri menghasilkan istilah baru pada saat pencarian, ia dapat bereaksi terhadap koleksi dokumen aktual, perilaku pengguna, atau tren terkini. Sebaliknya, Penyematan Kueri Tetap (Fixed Query Embeddings) sudah ada sejak tahap pelatihan dan tidak dapat menyesuaikan diri dengan pergeseran kosakata atau konten yang baru diindeks tanpa pelatihan ulang. Hal ini membuat ekspansi lebih responsif tetapi juga lebih bervariasi di setiap proses.
Pertimbangan Kinerja dan Biaya
Penyematan tetap (fixed embeddings) unggul dalam aplikasi yang sensitif terhadap latensi karena satu kali proses penerusan (forward pass) melalui encoder relatif murah dan vektor yang dihasilkan dapat di-cache. Ekspansi kueri (Query Expansion), terutama ketika didukung oleh model bahasa yang besar, menambah overhead per kueri. Namun, ekspansi menghindari biaya infrastruktur yang besar untuk memelihara indeks vektor, yang dapat menjadi beban nyata pada skala miliaran dokumen.
Kualitas pada Berbagai Jenis Kueri
Kueri pendek dan ambigu seringkali mendapat manfaat dari perluasan karena konteks tambahan memperjelas maksud. Kueri panjang dan terstruktur dengan baik terkadang mengalami masalah akibat perluasan karena istilah tambahan melemahkan sinyal aslinya. Embedding tetap menangani pertanyaan bahasa alami dengan baik tetapi tersandung pada kata benda khusus yang jarang, jargon teknis, atau istilah baru yang belum pernah dipelajari oleh encoder.
Pendekatan Hibrida dan Modern
Sebagian besar sistem pencarian produksi saat ini menggabungkan kedua ide tersebut. Pola umum menggunakan Penyematan Kueri Tetap untuk pemanggilan semantik dan Ekspansi Kueri untuk ketelitian leksikal, kemudian menggabungkan kedua daftar hasil tersebut. Penelitian terbaru tentang teknik seperti HyDE (Penyematan Dokumen Hipotetis) semakin mengaburkan batasan dengan menggunakan LLM untuk menghasilkan dokumen semu yang kemudian disematkan, secara efektif menggabungkan ekspansi dan penyematan menjadi satu langkah.
Kelebihan & Kekurangan
Ekspansi Kueri
Keuntungan
+Tingkat pengingatan yang tinggi
+Istilah yang dapat diinterpretasikan
+Menangani kata-kata langka
+Tidak diperlukan indeks vektor.
Tersisa
−Dapat mengurangi ketepatan.
−Latensi lebih tinggi
−Risiko kebisingan akibat perluasan
−Sulit untuk menyetel bobot
Penyematan Kueri Tetap
Keuntungan
+Inferensi cepat
+Pencocokan semantik
+Mudah untuk di-cache
+Unggul dalam pencarian organik
Tersisa
−Kondisi statis setelah latihan
−Perilaku buram
−Membutuhkan indeks vektor
−Lemah dalam hal-hal langka
Kesalahpahaman Umum
Mitologi
Ekspansi kueri selalu meningkatkan hasil pencarian.
Realitas
Ekspansi meningkatkan daya ingat (recall) tetapi seringkali mengurangi ketepatan (precision) ketika istilah yang ditambahkan tidak relevan. Ekspansi buta dapat menenggelamkan hasil yang relevan dalam kebisingan, itulah sebabnya sistem modern menggunakan strategi ekspansi selektif atau yang dipelajari.
Mitologi
Penyematan Kueri Tetap (Fixed Query Embeddings) memahami kata apa pun yang Anda berikan kepadanya.
Realitas
Encoder dibatasi oleh tokenizer dan data pelatihannya. Kesalahan ejaan, nama produk baru, atau jargon khusus bidang tertentu sering kali dipecah menjadi subkata yang belum pernah dilihat model, sehingga menghasilkan representasi yang buruk.
Mitologi
Pencarian vektor membuat IR tradisional menjadi usang.
Realitas
Metode leksikal seperti BM25 masih mengungguli pencarian padat pada banyak tolok ukur, terutama untuk kueri yang banyak mengandung kata kunci. Sistem yang paling kuat adalah sistem hibrida, bukan vektor murni.
Mitologi
Ekspansi kueri adalah teknik lama yang sudah tidak relevan lagi.
Realitas
Metode ekspansi berbasis LLM seperti query2doc dan HyDE telah menghidupkan kembali bidang ini, menunjukkan bahwa ekspansi modern mengungguli pendekatan bag-of-words yang sederhana dengan selisih yang besar.
Mitologi
Model embedding yang lebih besar selalu berarti pengambilan data yang lebih baik.
Realitas
Efek pengembalian yang semakin berkurang (diminishing returns) akan terjadi dengan cepat, dan encoder kecil yang disetel dengan baik dengan penambangan negatif yang kuat (hard negative mining) seringkali menyamai model besar dengan biaya yang jauh lebih rendah.
Pertanyaan yang Sering Diajukan
Apa perbedaan utama antara Query Expansion dan Fixed Query Embeddings?
Ekspansi Kueri menambahkan istilah tambahan ke kueri pencarian saat runtime untuk memperluas kecocokan, sementara Penyematan Kueri Tetap mengubah kueri menjadi vektor padat tunggal sekali dan menggunakannya kembali. Yang pertama memanipulasi teks, yang kedua memanipulasi geometri.
Pendekatan mana yang lebih cepat pada saat kueri dilakukan?
Penyematan Kueri Tetap (Fixed Query Embeddings) biasanya lebih cepat karena hanya memerlukan satu kali proses pengkodean (encoder pass) dan pencarian tetangga terdekat (nearest-neighbor lookup). Ekspansi Kueri (Query Expansion) dapat melibatkan beberapa panggilan LLM atau loop umpan balik pseudo-relevansi, yang menambah latensi.
Bisakah perluasan kueri dan penyematan kueri tetap digabungkan?
Ya, dan ini semakin menjadi standar dalam produksi. Pipeline hibrida menjalankan retriever dan menggabungkan hasil menggunakan reciprocal rank fusion atau reranker yang dipelajari, yang menangkap kekuatan masing-masing.
Mengapa Fixed Query Embeddings mengalami kesulitan dengan istilah-istilah yang jarang digunakan?
Encoder memecah kata-kata yang tidak dikenal menjadi bagian-bagian subkata yang mungkin tidak membawa makna yang dimaksud. Tanpa paparan selama pelatihan, vektor yang dihasilkan pada dasarnya adalah tebakan, yang mengurangi akurasi pengambilan pada kosakata teknis atau yang benar-benar baru.
Apakah perluasan kueri masih digunakan dalam sistem AI modern?
Tentu saja. Teknik-teknik seperti HyDE, query2doc, dan step-back prompting semuanya bergantung pada prinsip ekspansi, seringkali menggunakan model bahasa yang besar untuk menghasilkan jawaban hipotetis atau konsep terkait yang meningkatkan pengambilan informasi selanjutnya.
Apakah Fixed Query Embeddings memerlukan pelatihan ulang untuk domain baru?
Seringkali ya. Encoder serbaguna bekerja cukup baik di berbagai domain, tetapi bidang khusus seperti kedokteran atau hukum akan lebih diuntungkan dengan model yang disesuaikan dengan domain tersebut. Penyesuaian pada pasangan kueri-dokumen dalam domain biasanya menghasilkan peningkatan yang signifikan.
Apa itu umpan balik pseudo-relevansi dalam Perluasan Kueri?
Ini adalah teknik di mana sistem menganggap dokumen-dokumen peringkat teratas dari pencarian awal relevan, kemudian mengekstrak istilah-istilah yang sering muncul dari dokumen-dokumen tersebut untuk memperluas kueri. Proses ini otomatis tetapi dapat memperbesar kesalahan jika peringkat awal buruk.
Metode mana yang lebih baik dalam menangani kesalahan ketik dan salah ejaan?
Penyematan Kueri Tetap cenderung lebih tahan terhadap kesalahan ketik karena encoder mempelajari pencocokan semantik fuzzy. Ekspansi Kueri berdasarkan pencocokan token yang tepat akan gagal total pada istilah yang salah eja kecuali koreksi ejaan ditambahkan di hulu.
Bagaimana indeks vektor seperti FAISS cocok dengan Fixed Query Embeddings?
FAISS, ScaNN, dan pustaka serupa memungkinkan pencarian tetangga terdekat secara cepat dan akurat terhadap jutaan atau miliaran vektor embedding. Tanpa pustaka-pustaka ini, pencarian kemiripan yang tepat akan sangat lambat dalam skala besar.
Apakah perluasan kueri berfungsi dengan baik untuk kueri pendek?
Ya, kueri singkat seringkali paling diuntungkan karena sinyal awalnya sedikit. Menambahkan istilah terkait memberi mesin pencari lebih banyak informasi untuk diolah, meskipun perlu hati-hati agar tidak menyimpang dari maksud pengguna.
Putusan
Pilih Ekspansi Kueri ketika korpus Anda besar, kueri Anda berisi istilah langka atau teknis, dan Anda membutuhkan pengambilan yang dapat diinterpretasikan dan disesuaikan. Pilih Penyematan Kueri Tetap ketika latensi penting, kueri Anda adalah pertanyaan bahasa alami, dan Anda mampu membiayai infrastruktur pengindeksan vektor. Dalam praktiknya, sistem terkuat menggunakan keduanya bersama-sama daripada memilih salah satu.