Konteksta apzinīga izguve pret konteksta aklu izguvi
Konteksta apzinīga izguve izmanto apkārtējo informāciju, piemēram, vaicājumu vēsturi, lietotāja nolūku un dokumentu attiecības, lai sniegtu atbilstošākus rezultātus, savukārt konteksta neapzinīga izguve apstrādā katru vaicājumu atsevišķi. Pirmā nodrošina mūsdienīgu sarunvalodas mākslīgo intelektu un personalizētu meklēšanu, savukārt otrā joprojām ir noderīga vienkāršām, vienreizējām meklēšanām.
Iezīmes
Konteksta apzinīga izguve uztur sarunas saskaņotību, atceroties iepriekšējos vaicājumus un lietotāja signālus.
Konteksta aklā izguve ir ātrāka, lētāka un vienkāršāka vienreizējai faktu meklēšanai.
Lielākā daļa ražošanas mākslīgā intelekta asistentu tagad paļaujas uz kontekstu apzinošu izgūšanu, lai precīzi apstrādātu papildu jautājumus.
Akadēmiskie etaloni rāda, ka kontekstatkarīgas metodes vairāku apgriezienu uzdevumos par 10–20 % pārspēj kontekstatkarīgas bāzes līnijas.
Kas ir Konteksta apzinīga izguve?
Izguves pieeja, kas ņem vērā vaicājumu vēsturi, lietotāja uzvedību un dokumenta kontekstu, lai iegūtu atbilstošākus rezultātus.
Tas ietver tādus signālus kā iepriekšējās sarunas pavērsieni, lietotāja preferences un sesijas līmeņa metadati, lai precizētu meklēšanas rezultātus.
Mūsdienu RAG sistēmas paļaujas uz kontekstatkarīgu izguvi, lai uzturētu saskaņotas daudzpakāpju sarunas ar lieliem valodu modeļiem.
Šajā kategorijā ietilpst tādas metodes kā vaicājumu pārrakstīšana, HyDE un kontekstuālā iegulšana.
Vektoru datubāzes, piemēram, Pinecone, Weaviate un Chroma, atbalsta kontekstatkarīgu izgūšanu, izmantojot metadatu filtrēšanu un hibrīdmeklēšanu.
Salīdzinot ar kontekstu neņemot vērā metodes, tā parasti sasniedz lielāku precizitāti sarunu un personalizētos etalonos.
Kas ir Konteksta aklā atgūšana?
Izguves pieeja, kas apstrādā katru vaicājumu neatkarīgi, neņemot vērā iepriekšēju mijiedarbību vai lietotājam raksturīgus signālus.
Tas apstrādā katru meklēšanas vaicājumu kā atsevišķu pieprasījumu, ignorējot sarunas vēsturi vai sesijas kontekstu.
Klasiskās atslēgvārdu meklētājprogrammas, piemēram, agrīnās Lucene un BM25 implementācijas, darbojas šādā veidā.
Tas ir skaitļošanas ziņā lētāks un ātrāks, jo nav jāapstrādā vai jāuzglabā papildu konteksts.
Tas labi darbojas faktu meklēšanā, kur vaicājums vien satur pietiekami daudz informācijas, lai atrastu atbildi.
Tas kalpo kā atskaites punkts, pret kuru akadēmiskajos etalonos parasti tiek mērītas kontekstuālās metodes.
BM25, pamata blīvā meklēšana, atslēgvārdu meklēšana
Uzglabāšanas prasības
Nepieciešama sesijas un metadatu krātuve
Minimāls — tikai indekss
Detalizēts salīdzinājums
Kā katra pieeja saprot vaicājumus
Konteksta apzinīga izguve interpretē vaicājumu kā daļu no notiekošas mijiedarbības, izmantojot iepriekšējos pieprasījumus, lietotāju profilus un pat dokumenta apkārtējos metadatus, lai noskaidrotu, ko kāds patiesībā domā. Turpretī konteksta neapzinīga izguve aplūko vaicājumu atsevišķi — jūsu ierakstītie vārdi ir vienīgais signāls, ko tā izmanto. Tas padara konteksta neapzinīgas sistēmas paredzamas un viegli atkļūdojamas, taču tās bieži vien kļūdās, ja jautājums ir atkarīgs no tā, kas bija pirms tā.
Izrāde sarunu vidē
Kad cilvēki sarunājas ar mākslīgā intelekta asistentu, papildu jautājumi reti kad ir paši par sevi saprotami. Frāzes, piemēram, "kā ar otro?" vai "kā tas salīdzināms?", ir jēgpilnas tikai ar iepriekšējo kontekstu. Kontekstorientēta izguve šos jautājumus apstrādā dabiski, pirms meklēšanas pārrakstot neskaidrus vaicājumus par patstāvīgiem. Kontekstorientēta izguve šādos gadījumos parasti atgriež neatbilstošus rezultātus, tāpēc lielākā daļa ražošanas tērzēšanas robotu tagad izmanto kādu kontekstorientētu cauruļvadu.
Ātrums, izmaksas un infrastruktūra
Tā kā kontekstatkarīgā izguve izlaiž papildu darbu, kas saistīts ar atmiņas uzturēšanu un vaicājumu pārrakstīšanu, tā darbojas ātrāk un izmaksā mazāk, lai darbotos lielā mērogā. Kontekstatkarīga izguve palielina papildu slodzi — ir jāuzglabā sesijas stāvoklis, jāpalaiž vaicājumu pārrakstīšanas modeļi un bieži vien jāfiltrē vektoru rezultāti pēc metadatiem. Liela apjoma, zemas sarežģītības darba slodzēm, piemēram, miljonu statisku dokumentu indeksēšanai, kontekstatkarīgās metodes joprojām ir labas.
Precizitāte un etalonrādītāji
Pētījumi par blīvu sarunvalodas informācijas izgūšanu, tostarp Meta AI un Microsoft darbs ar tādiem datu kopumiem kā QReCC un TopiOCQA, konsekventi liecina, ka kontekstatkarīgas metodes MRR un nDCG rādītājos par 10–20 % pārspēj kontekstatkarīgas bāzes līnijas. Atšķirība palielinās vairāku apgriezienu vaicājumos, kuros dominē vietniekvārdi un atsauces. Tomēr viena apgrieziena faktu jautājumos atšķirība ievērojami samazinās.
Kad vienkāršība uzvar
Ne katrai lietojumprogrammai ir nepieciešama konteksta izpratne. Iekšējās zināšanu bāzes, juridisko dokumentu meklēšana un e-komercijas produktu meklēšana bieži vien labi darbojas ar konteksta neievērojošu izgūšanu, jo vaicājumi parasti ir specifiski un pašpietiekami. Šādos gadījumos konteksta neievērojošas izgūšanas vienkāršība, ātrums un zemākas infrastruktūras izmaksas padara to par praktiskāku izvēli.
Priekšrocības un trūkumi
Konteksta apzinīga izguve
Iepriekšējumi
+Apstrādā vairāku pagriezienu sarunas
+Atbalsta personalizāciju
+Augstāki atbilstības rādītāji
+Labāk neskaidriem vaicājumiem
Ievietots
−Augstākas skaitļošanas izmaksas
−Sarežģītāk ieviest
−Nepieciešama sesijas krātuve
−Grūtāk atkļūdot
Konteksta aklā atgūšana
Iepriekšējumi
+Ātrs un viegls
+Vienkārši ieviest
+Zemākas infrastruktūras izmaksas
+Paredzama uzvedība
Ievietots
−Vāji atbild uz papildu jautājumiem
−Nav personalizācijas
−Zemāka precizitāte tērzēšanā
−Nepamana sarunas norādes
Biežas maldības
Mīts
Konteksta apzinīga atgūšana vienmēr pārspēj konteksta neievērojošu atgūšanu.
Realitāte
Ne obligāti. Vienreizējiem, precīzi definētiem vaicājumiem kontekstuālās aklās metodes var sakrist vai pat pārspēt kontekstuālās metodes, jo tās izvairās no trokšņa, ko dažkārt rada papildu konteksts. Kontekstuālās izguves priekšrocība visspilgtāk izpaužas vairākkārtu vai personalizētos scenārijos.
Mīts
Konteksta aklā atgūšana ir novecojusi un vairs netiek izmantota.
Realitāte
Tālu no tā. BM25 un pamata blīvā izguve joprojām ir daudzu ražošanas meklēšanas sistēmu, tostarp uzņēmumu dokumentu meklēšanas un e-komercijas platformu, mugurkauls. Tās kalpo kā spēcīgas bāzes līnijas un bieži tiek apvienotas ar kontekstatkarīgiem slāņiem hibrīdajās arhitektūrās.
Mīts
Konteksta apzinīga atgūšana nozīmē, ka modelis "atceras" visu.
Realitāte
Praksē šīs sistēmas izmanto ierobežotu nesenās sarunas logu, apkopotus metadatus vai pārrakstītus vaicājumus. Patiesa ilgtermiņa atmiņa joprojām ir atklāta pētniecības problēma, un lielākā daļa sistēmu aizmirst vecākus pagriezienus, tiklīdz tie atstāj konteksta logu.
Mīts
Vektoru meklēšana vienmēr ir kontekstatkarīga.
Realitāte
Blīvu vektoru izguvi var veikt jebkurā veidā. Vienkārša vektoru meklēšana bez metadatu filtrēšanas vai vaicājumu pārrakstīšanas būtībā ir kontekstatkarīga. Sesijas vēstures, filtru vai vaicājumu paplašināšanas pievienošana padara to kontekstatkarīgu.
Tas tos samazina, bet neizslēdz. Pat ar labu izguvi valodas modeļi joprojām var nepareizi interpretēt fragmentus vai nepareizi apvienot informāciju. Izguves kvalitāte ir viena no puzles daļām — tikpat svarīga ir ģenerēšanas uzvedība.
Bieži uzdotie jautājumi
Kas ir kontekstatkarīga izguve RAG?
Kontekstorientēta izguve RAG valodā attiecas uz dokumentu izgūšanu, ņemot vērā sarunas vēsturi, lietotāja nolūku un metadatus, nevis tikai neapstrādātu vaicājumu. Tā parasti ietver vaicājuma pārrakstīšanu, kontekstuālu iegulšanu vai uz sesiju balstītu filtrēšanu, lai nodrošinātu, ka izgūtās teksta daļas faktiski atbild uz to, ko lietotājs domāja kontekstā.
Kā darbojas kontekstatkarīga atgūšana?
Konteksta aklā izguve darbojas, saskaņojot lietotāja vaicājumu ar indeksu bez jebkādas atsauces uz iepriekšējām mijiedarbībām. Šajā kategorijā ietilpst klasiskā BM25 atslēgvārdu meklēšana un pamata blīvo vektoru meklēšana. Katrs vaicājums tiek apstrādāts kā jauns, neatkarīgs pieprasījums, kas nodrošina sistēmas ātrumu un paredzamību.
Kas ir labāks tērzēšanas robotiem — kontekstatkarīga vai kontekstneievērojoša izguve?
Kontekstorientēta izguve gandrīz vienmēr ir labāka tērzēšanas robotiem, jo lietotāji bieži uzdod papildu jautājumus, kas ir atkarīgi no iepriekšējām kārtām. Bez konteksta sistēma nevar atrisināt vietniekvārdus vai atsauces, piemēram, "tas viens" vai "iepriekšējā opcija", kā rezultātā atbildes nav atbilstošas.
Vai var apvienot abas atgūšanas metodes?
Jā, hibrīdās izguves sistēmas apvieno atslēgvārdu (konteksta aklo) un semantisko (bieži vien konteksta apzinošo) meklēšanu, lai līdzsvarotu ātrumu un atbilstību. Daudzas ražošanas sistēmas izmanto BM25 līdzās blīviem iegulšanas veidiem, pēc tam apvienojot rezultātus ar reciprokās ranga sapludināšanu, pirms piemērojot kontekstuālos filtrus.
Vai kontekstatkarīga izguve izmaksā vairāk?
Parasti tā ir, jo ir jāuzglabā sesijas stāvoklis, jāpalaiž vaicājumu pārrakstīšanas modeļi un jālieto metadatu filtri. Papildu slodze atšķiras, taču sagaidāma aptuveni par 20–50 % lielāka latentuma un skaitļošanas slodze salīdzinājumā ar vienkāršu vektoru meklēšanu atkarībā no konteksta apstrādes sarežģītības.
Kas ir vaicājumu pārrakstīšana kontekstatkarīgā izguvē?
Vaicājuma pārrakstīšana ir process, kurā neskaidrs, no konteksta atkarīgs jautājums pirms meklēšanas tiek pārveidots par atsevišķu, pilnīgu vaicājumu. Piemēram, jautājums “kā ar tā cenu?” var tikt pārrakstīts uz “kāda ir iPhone 15 cena?”, pamatojoties uz sarunas vēsturi. Šī ir viena no visizplatītākajām metodēm, ko izmanto kontekstatkarīgās sistēmās.
Vai BM25 ir kontekstatkarīgs?
Jā, tradicionālais BM25 neņem vērā kontekstu. Tas vērtē dokumentus, pamatojoties tikai uz terminu biežumu un apgriezto dokumentu biežumu attiecībā pret pašreizējo vaicājumu. Tomēr jūs varat ietvert BM25 kontekstatkarīgā cauruļvadā, vispirms pārrakstot vaicājumu vai filtrējot rezultātus pēc sesijas metadatiem.
Kādi kritēriji mēra kontekstatkarīgu izguvi?
Bieži sastopamie etaloni ir QReCC (jautājumu pārrakstīšana sarunas kontekstā), TopiOCQA (uz tēmu orientēta sarunu kvalitātes nodrošināšana) un CAsT (sarunas palīdzības izsekošanas programma). Šie datu kopumi novērtē, cik labi sistēmas apstrādā vairāku pagriezienu vaicājumus, kuros konteksts ir būtisks pareizās atbildes atrašanai.
Vai visas vektoru datubāzes atbalsta kontekstatkarīgu izgūšanu?
Lielākā daļa mūsdienu vektoru datubāzu, piemēram, Pinecone, Weaviate, Chroma un Qdrant, atbalsta metadatu filtrēšanu un hibrīdmeklēšanu, kas ir pamatelementi kontekstatkarīgai izguvei. Tomēr faktiskā konteksta apstrāde — vaicājumu pārrakstīšana, sesijas atmiņa — parasti tiek ieviesta lietojumprogrammu līmenī datubāzes augšpusē.
Kad man vajadzētu izmantot kontekstatkarīgu izgūšanu?
Konteksta aklā izguve ir piemērota, ja vaicājumi ir patstāvīgi, personalizācija nav nepieciešama un prioritāte ir latentums vai izmaksas. Piemēri ietver iekšējo dokumentu meklēšanu, juridisko meklēšanu, produktu meklēšanu e-komercijas vietnēs un jebkuru scenāriju, kurā lietotāji parasti ieraksta pilnīgus, specifiskus jautājumus.
Spriedums
Izvēlieties kontekstatkarīgu izgūšanu, ja jūsu lietojumprogramma ietver vairāku kārtu sarunas, personalizāciju vai neskaidrus papildu vaicājumus — tas ir mūsdienu RAG un AI asistentu standarts. Vienkāršām, vienas kārtas meklēšanām, kur ātrums un zemas izmaksas ir svarīgākas par sarunas dziļumu, pieturieties pie kontekstatkarīgas izgūšanas.