Bağlamdan Haberdar Arama vs. Bağlamdan Habersiz Arama
Bağlam duyarlı arama, sorgu geçmişi, kullanıcı amacı ve belge ilişkileri gibi çevresel bilgileri kullanarak daha alakalı sonuçlar sunarken, bağlamdan bağımsız arama her sorguyu ayrı ayrı ele alır. İlki modern konuşma yapay zekasını ve kişiselleştirilmiş aramayı desteklerken, ikincisi basit, tek seferlik aramalar için kullanışlı olmaya devam etmektedir.
Öne Çıkanlar
Bağlam duyarlı geri çağırma, önceki sorguları ve kullanıcı sinyallerini hatırlayarak konuşma tutarlılığını korur.
Bağlamdan bağımsız arama, tek seferlik olgusal aramalar için daha hızlı, daha ucuz ve uygulanması daha basittir.
Günümüzde çoğu üretim aşamasındaki yapay zeka asistanı, takip sorularını doğru bir şekilde yanıtlamak için bağlam duyarlı bilgiye dayalı arama yöntemine güvenmektedir.
Akademik karşılaştırmalar, bağlamı dikkate alan yöntemlerin, çok turlu görevlerde bağlamdan bağımsız yöntemlere göre %10-20 daha iyi performans gösterdiğini ortaya koymaktadır.
Bağlam Duyarlı Geri Alma nedir?
Sorgu geçmişini, kullanıcı davranışını ve belge bağlamını dikkate alarak daha alakalı sonuçlar döndüren bir arama yaklaşımı.
Arama sonuçlarını iyileştirmek için önceki konuşma sıraları, kullanıcı tercihleri ve oturum düzeyindeki meta veriler gibi sinyalleri kullanır.
Modern RAG sistemleri, büyük dil modelleriyle tutarlı çok turlu konuşmaları sürdürmek için bağlam duyarlı bilgiye dayalı erişime güvenir.
Sorgu yeniden yazma, HyDE ve bağlamsal gömme gibi teknikler bu kategoriye girer.
Pinecone, Weaviate ve Chroma gibi vektör tabanlı veritabanları, meta veri filtreleme ve hibrit arama yoluyla bağlam duyarlı veri alımını destekler.
Genel olarak, bağlamdan bağımsız yöntemlere kıyasla, konuşmaya dayalı ve kişiselleştirilmiş kıyaslamalarda daha yüksek hassasiyet elde eder.
Bağlamdan Bağımsız Geri Çağırma nedir?
Önceki etkileşimleri veya kullanıcıya özgü sinyalleri dikkate almadan her sorguyu bağımsız olarak işleyen bir arama yaklaşımı.
Arama sorgularının her birini, konuşma geçmişini veya oturum bağlamını dikkate almadan, bağımsız bir istek olarak ele alır.
Lucene ve BM25'in ilk uygulamaları gibi klasik anahtar kelime arama motorları bu şekilde çalışır.
Ek bağlamın işlenmesine veya saklanmasına gerek olmadığı için hesaplama açısından daha ucuz ve daha hızlıdır.
Sorgunun tek başına cevabı bulmak için yeterli bilgiyi içerdiği olgusal aramalarda iyi sonuç verir.
Bu, bağlam duyarlı yöntemlerin akademik kıyaslamalarda genellikle ölçüldüğü temel ölçüt görevi görür.
Karşılaştırma Tablosu
Özellik
Bağlam Duyarlı Geri Alma
Bağlamdan Bağımsız Geri Çağırma
Sorgu İşleme
Oturum geçmişini ve kullanıcı sinyallerini kullanır.
Bağlam duyarlı arama, bir sorguyu devam eden bir etkileşimin parçası olarak yorumlar ve birinin gerçekten ne demek istediğini anlamak için önceki konuşmalardan, kullanıcı profillerinden ve hatta belgenin etrafındaki meta verilerden yararlanır. Bağlamdan bağımsız arama ise, sorguyu tek başına ele alır; yazdığınız kelimeler kullandığı tek sinyaldir. Bu, bağlamdan bağımsız sistemleri tahmin edilebilir ve hata ayıklaması kolay hale getirir, ancak bir soru daha önce gelenlere bağlı olduğunda genellikle hedefi tutturamazlar.
Konuşma Ortamlarında Performans
İnsanlar yapay zekâ asistanlarıyla sohbet ederken, takip soruları nadiren tek başına anlam ifade eder. 'Peki ya ikincisi?' veya 'Bu nasıl karşılaştırılır?' gibi ifadeler ancak önceden var olan bağlamla anlam kazanır. Bağlam duyarlı arama, belirsiz sorguları aramadan önce kendi içinde bütünlük arz eden sorgulara dönüştürerek bunları doğal olarak ele alır. Bağlamdan bağımsız arama, bu gibi durumlarda alakasız sonuçlar döndürme eğilimindedir; bu nedenle çoğu üretim aşamasındaki sohbet botu artık bir tür bağlam duyarlı işlem hattı kullanmaktadır.
Hız, Maliyet ve Altyapı
Bağlamdan bağımsız arama, bellek yönetimi ve sorguların yeniden yazılması gibi ek işlerden kaçındığı için daha hızlı çalışır ve büyük ölçekte işletme maliyeti daha düşüktür. Bağlamdan haberdar arama ise ek yük getirir; oturum durumunu saklamanız, sorgu yeniden yazma modellerini çalıştırmanız ve genellikle vektör sonuçlarını meta verilerle filtrelemeniz gerekir. Milyonlarca statik belgeyi indeksleme gibi yüksek hacimli, düşük karmaşıklıkta iş yükleri için bağlamdan bağımsız yöntemler hala geçerliliğini korumaktadır.
Doğruluk ve Kıyaslama Sonuçları
Meta AI ve Microsoft'un QReCC ve TopiOCQA gibi veri kümeleri üzerinde yaptığı çalışmalar da dahil olmak üzere, konuşma tabanlı yoğun bilgiye erişim üzerine yapılan araştırmalar, bağlamı dikkate alan yöntemlerin, bağlamdan bağımsız temel yöntemlere kıyasla MRR ve nDCG puanlarında %10-20 daha iyi performans gösterdiğini tutarlı bir şekilde ortaya koymaktadır. Zamirlerin ve referansların baskın olduğu çok turlu sorgularda bu fark daha da artmaktadır. Bununla birlikte, tek turlu olgusal sorular için fark önemli ölçüde azalmaktadır.
Sadeliğin Kazandığı Zamanlar
Her uygulamanın bağlam farkındalığına ihtiyacı yoktur. Dahili bilgi tabanları, yasal belge aramaları ve e-ticaret ürün aramaları genellikle bağlamdan bağımsız arama ile sorunsuz çalışır çünkü sorgular genellikle spesifik ve kendi içinde yeterlidir. Bu senaryolarda, bağlamdan bağımsız aramanın basitliği, hızı ve daha düşük altyapı maliyeti onu daha pratik bir seçenek haline getirir.
Artılar ve Eksiler
Bağlam Duyarlı Geri Alma
Artılar
+Çok turlu konuşmaları yönetir.
+Kişiselleştirmeyi destekler
+Daha yüksek alaka düzeyi puanları
+Belirsiz sorgular için daha iyi
Devam
−Daha yüksek hesaplama maliyeti
−Uygulaması daha karmaşık
−Oturum depolaması gerektirir.
−Hata ayıklaması daha zor
Bağlamdan Bağımsız Geri Çağırma
Artılar
+Hızlı ve hafif
+Uygulaması basit
+Daha düşük altyapı maliyeti
+Öngörülebilir davranış
Devam
−Takip sorularında yetersiz.
−Kişiselleştirme yok
−Sohbetlerde doğruluk oranının düşmesi
−Konuşma ipuçlarını kaçırıyor
Yaygın Yanlış Anlamalar
Efsane
Bağlamdan haberdar arama, bağlamdan bağımsız aramadan her zaman daha iyi performans gösterir.
Gerçeklik
Mutlaka öyle değil. Tek turlu, iyi tanımlanmış sorgular için, bağlamdan bağımsız yöntemler, ek bağlamın bazen getirdiği gürültüyü önledikleri için bağlamdan haberdar olan yöntemlerle eşleşebilir, hatta onları geride bırakabilir. Bağlamdan haberdar olan aramanın avantajı en belirgin şekilde çok turlu veya kişiselleştirilmiş senaryolarda ortaya çıkar.
Efsane
Bağlamdan bağımsız bilgi alma yöntemi eskidir ve artık kullanılmamaktadır.
Gerçeklik
Tam tersine. BM25 ve temel yoğun arama, kurumsal belge arama ve e-ticaret platformları da dahil olmak üzere birçok üretim arama sisteminin omurgasını oluşturmaya devam ediyor. Güçlü temeller olarak hizmet veriyorlar ve genellikle hibrit mimarilerde bağlam duyarlı katmanlarla birleştiriliyorlar.
Efsane
Bağlam duyarlı erişim, modelin her şeyi 'hatırlaması' anlamına gelir.
Gerçeklik
Pratikte, bu sistemler yakın zamanki konuşmaların sınırlı bir bölümünü, özetlenmiş meta verileri veya yeniden yazılmış sorguları kullanır. Gerçek uzun vadeli hafıza hala açık bir araştırma problemidir ve çoğu sistem, bağlam penceresinden çıktıktan sonra eski konuşmaları unutur.
Efsane
Vektör arama her zaman bağlamı dikkate alır.
Gerçeklik
Yoğun vektör tabanlı arama iki şekilde olabilir. Meta veri filtreleme veya sorgu yeniden yazma olmadan yapılan basit bir vektör araması esasen bağlamdan bağımsızdır. Oturum geçmişi, filtreler veya sorgu genişletme eklemek, onu bağlam duyarlı hale getirir.
Efsane
Bağlamdan haberdar geri çağırma, RAG sistemlerindeki yanılsamaları ortadan kaldırır.
Gerçeklik
Bu hataları azaltır ancak tamamen ortadan kaldırmaz. İyi bir geri çağırma oranına sahip olsa bile, dil modelleri yine de pasajları yanlış yorumlayabilir veya bilgileri yanlış bir şekilde birleştirebilir. Geri çağırma kalitesi bulmacanın bir parçasıdır; üretim davranışı da aynı derecede önemlidir.
Sıkça Sorulan Sorular
RAG'de bağlam duyarlı erişim nedir?
RAG'de bağlam duyarlı arama, yalnızca ham sorguyu değil, konuşma geçmişini, kullanıcı amacını ve meta verileri de dikkate alarak belgeleri getirmeyi ifade eder. Genellikle, getirilen metinlerin kullanıcının bağlam içinde ne demek istediğini gerçekten yanıtladığından emin olmak için sorgu yeniden yazma, bağlamsal yerleştirmeler veya oturum tabanlı filtreleme içerir.
Bağlamdan bağımsız bilgi erişimi nasıl çalışır?
Bağlamdan bağımsız arama, kullanıcının sorgusunu önceki etkileşimlere hiç bakmadan bir dizinle eşleştirerek çalışır. Klasik BM25 anahtar kelime araması ve temel yoğun vektör aramaları bu kategoriye girer. Her sorgu yeni, bağımsız bir istek olarak ele alınır, bu da sistemi hızlı ve tahmin edilebilir kılar.
Sohbet botları için bağlam duyarlı mı yoksa bağlamdan bağımsız mı bilgi alma yöntemi daha iyidir?
Bağlamdan haberdar arama, sohbet botları için neredeyse her zaman daha iyidir çünkü kullanıcılar sıklıkla önceki konuşmalara bağlı takip soruları sorarlar. Bağlam olmadan, sistem zamirleri veya 'şu' veya 'önceki seçenek' gibi referansları çözümleyemez ve bu da alakasız yanıtlara yol açar.
İki arama yaklaşımını birleştirebilir misiniz?
Evet, hibrit arama sistemleri, hız ve alaka düzeyini dengelemek için anahtar kelime (bağlamdan bağımsız) ve anlamsal (çoğunlukla bağlamı dikkate alan) aramayı birleştirir. Birçok üretim sistemi, yoğun gömme yöntemleriyle birlikte BM25'i kullanır, ardından bağlamsal filtreler uygulamadan önce sonuçları karşılıklı sıralama birleştirme yöntemiyle birleştirir.
Bağlam duyarlı arama daha pahalıya mı mal oluyor?
Genellikle evet, çünkü oturum durumunu saklamanız, sorgu yeniden yazma modellerini çalıştırmanız ve meta veri filtrelerini uygulamanız gerekiyor. Ek yük değişmekle birlikte, bağlam işlemenin ne kadar karmaşık olduğuna bağlı olarak, düz bir vektör aramasına kıyasla yaklaşık %20-50 daha fazla gecikme ve işlem gücü bekleyin.
Bağlam duyarlı bilgi erişiminde sorgu yeniden yazımı nedir?
Sorgu yeniden yazma, belirsiz, bağlama bağlı bir soruyu aramadan önce bağımsız, kendi kendine yeten bir sorguya dönüştürme işlemidir. Örneğin, 'fiyatı ne durumda?' sorusu, konuşma geçmişine dayanarak 'iPhone 15'in fiyatı nedir?' şeklinde yeniden yazılabilir. Bu, bağlam duyarlı sistemlerde kullanılan en yaygın tekniklerden biridir.
BM25 bağlamdan bağımsız mı?
Evet, geleneksel BM25 bağlamdan bağımsızdır. Belgeleri yalnızca terim sıklığına ve mevcut sorguya göre ters belge sıklığına göre puanlar. Bununla birlikte, sorguyu önce yeniden yazarak veya sonuçları oturum meta verilerine göre filtreleyerek BM25'i bağlam duyarlı bir işlem hattına dahil edebilirsiniz.
Bağlam duyarlı bilgi erişimini ölçen kıyaslama ölçütleri nelerdir?
Yaygın kullanılan kıyaslama ölçütleri arasında QReCC (Konuşma Bağlamında Soru Yeniden Yazma), TopiOCQA (Konu Odaklı Konuşma Tabanlı Soru-Cevap) ve CAsT (Konuşma Destek İzleme) yer almaktadır. Bu veri kümeleri, sistemlerin bağlamın doğru cevabı bulmak için gerekli olduğu çok aşamalı sorguları ne kadar iyi ele aldığını değerlendirir.
Tüm vektör tabanlı veritabanları bağlam duyarlı veri alımını destekliyor mu?
Pinecone, Weaviate, Chroma ve Qdrant gibi modern vektör veritabanlarının çoğu, bağlam duyarlı erişim için temel yapı taşları olan meta veri filtreleme ve hibrit aramayı destekler. Bununla birlikte, gerçek bağlam yönetimi (sorgu yeniden yazma, oturum belleği) genellikle veritabanının üzerinde, uygulama katmanında uygulanır.
Bağlamdan bağımsız arama yöntemini ne zaman kullanmalıyım?
Bağlamdan bağımsız arama, sorguların kendi içinde yeterli olduğu, kişiselleştirmenin gerekli olmadığı ve gecikme süresinin veya maliyetin öncelikli olduğu durumlarda iyi bir çözümdür. Örnekler arasında dahili belge araması, yasal bilgi araması, e-ticaret sitelerinde ürün araması ve kullanıcıların genellikle eksiksiz ve spesifik sorular yazdığı her türlü senaryo yer alır.
Karar
Uygulamanız çok aşamalı konuşmalar, kişiselleştirme veya belirsiz takip sorguları içeriyorsa, bağlam duyarlı arama yöntemini seçin; bu, modern RAG ve yapay zeka asistanları için standarttır. Konuşma derinliğinden ziyade hız ve düşük maliyetin önemli olduğu basit, tek aşamalı aramalar için bağlamdan bağımsız arama yöntemini kullanın.