Kontekstiteadlik otsing kasutab asjakohasemate tulemuste saamiseks ümbritsevat teavet, nagu päringute ajalugu, kasutaja kavatsus ja dokumentide seosed, samas kui kontekstipõhine otsing käsitleb iga päringut eraldi. Esimene toetab tänapäevast vestluspõhist tehisintellekti ja isikupärastatud otsingut, samas kui viimane on kasulik lihtsate ühekordsete otsingute jaoks.
Esiletused
Kontekstiteadlik päring säilitab vestluse sidususe, pidades meeles varasemaid päringuid ja kasutaja signaale.
Kontekstipõhine otsing on ühekordsete faktiotsingute jaoks kiirem, odavam ja lihtsam rakendada.
Enamik tootmise tehisintellekti assistente tugineb nüüd kontekstipõhisele otsingule, et järelküsimustele täpselt vastata.
Akadeemilised võrdlusnäitajad näitavad, et kontekstipõhised meetodid ületavad mitme pöördega ülesannete puhul kontekstipõhiste baasväärtuste tulemusi 10–20%.
Mis on Kontekstiteadlik otsing?
Otsingumeetod, mis arvestab päringuajalugu, kasutajakäitumist ja dokumendi konteksti, et tagastada asjakohasemaid tulemusi.
See kaasab otsingutulemuste täpsustamiseks signaale, nagu varasemad vestluskäigud, kasutaja eelistused ja seansi tasemel metaandmed.
Kaasaegsed RAG-süsteemid tuginevad kontekstipõhisele otsingule, et säilitada sidusaid mitmepöördelisi vestlusi suurte keelemudelitega.
Sellesse kategooriasse kuuluvad sellised tehnikad nagu päringute ümberkirjutamine, HyDE ja kontekstuaalne manustamine.
Vektorandmebaasid nagu Pinecone, Weaviate ja Chroma toetavad kontekstipõhist otsingut metaandmete filtreerimise ja hübriidotsingu kaudu.
Üldiselt saavutab see vestlus- ja isikupärastatud võrdlusaluste puhul suurema täpsuse võrreldes kontekstipõhiste meetoditega.
Mis on Kontekstipime otsing?
Päringumeetod, mis töötleb iga päringut eraldi, arvestamata eelnevaid interaktsioone või kasutajaspetsiifilisi signaale.
See käsitleb iga otsingupäringut eraldiseisva päringuna, ignoreerides vestluse ajalugu või seansi konteksti.
Klassikalised märksõnaotsingumootorid, nagu varased Lucene'i ja BM25 implementatsioonid, toimivad sel viisil.
See on arvutuslikult odavam ja kiirem, kuna täiendavat konteksti pole vaja töödelda ega salvestada.
See toimib hästi faktiotsingute puhul, kus päring üksi sisaldab vastuse leidmiseks piisavalt teavet.
See toimib võrdlusalusena, mille suhtes kontekstipõhiseid meetodeid akadeemilistes võrdlusalustes tavaliselt mõõdetakse.
Kontekstiteadlik otsing tõlgendab päringut osana käimasolevast suhtlusest, tuginedes varasematele päringupööretele, kasutajaprofiilidele ja isegi dokumendi ümbritsevatele metaandmetele, et aru saada, mida keegi tegelikult mõtleb. Kontekstipime otsing seevastu vaatleb päringut eraldi – sisestatud sõnad on ainus signaal, mida see kasutab. See muudab kontekstipimedad süsteemid etteaimatavaks ja hõlpsasti silutavaks, kuid need eksivad sageli, kui küsimus sõltub eelnevast.
Esinemine vestluskeskkondades
Kui inimesed vestlevad tehisintellekti abilisega, esitatakse järelküsimusi harva iseseisvalt. Sellised fraasid nagu „kuidas on lood teise küsimusega?“ või „kuidas see võrreldav on?“ on mõistlikud ainult eelneva kontekstiga. Kontekstipõhine päring käsitleb neid loomulikult, kirjutades mitmetähenduslikud päringud enne otsingu tegemist iseseisvateks. Kontekstipõhine päring kipub sellistel juhtudel tagastama ebaolulisi tulemusi, mistõttu enamik tootmiskeskkonna vestlusroboteid kasutab nüüd mingit kontekstipõhist torujuhet.
Kiirus, hind ja infrastruktuur
Kuna kontekstipõhine päringu tegemine jätab vahele mälu haldamise ja päringute ümberkirjutamisega seotud lisatöö, töötab see kiiremini ja on suuremahulises haldamises odavam. Kontekstipõhine päring lisab üldkulusid – peate salvestama seansi oleku, käivitama päringute ümberkirjutamise mudeleid ja sageli filtreerima vektori tulemusi metaandmete alusel. Suuremahuliste ja lihtsate töökoormuste puhul, näiteks miljonite staatiliste dokumentide indekseerimisel, on kontekstipõhised meetodid endiselt omal kohal.
Täpsus ja võrdlustulemused
Uuringud tiheda vestluspõhise otsingu kohta, sh Meta AI ja Microsofti töö andmekogumitel nagu QReCC ja TopiOCQA, näitavad järjepidevalt, et kontekstipõhised meetodid ületavad MRR-i ja nDCG-skoorides kontekstipõhistest baasväärtustest 10–20%. Lõhe suureneb mitmepöördeliste päringute puhul, kus domineerivad asesõnad ja viited. Ühepöördeliste faktiküsimuste puhul aga väheneb erinevus märkimisväärselt.
Kui lihtsus võidab
Mitte iga rakendus ei vaja kontekstiteadlikkust. Sisemised teadmusbaasid, juriidiliste dokumentide otsing ja e-kaubanduse toodete otsing toimivad kontekstipõhise otsinguga sageli hästi, kuna päringud kipuvad olema spetsiifilised ja iseseisvad. Sellistel juhtudel muudab kontekstipõhise otsingu lihtsus, kiirus ja madalamad taristukulud selle praktilisemaks valikuks.
Plussid ja miinused
Kontekstiteadlik otsing
Eelised
+Haldab mitmekordseid vestlusi
+Toetab isikupärastamist
+Kõrgemad asjakohasuse skoorid
+Parem mitmetähenduslike päringute jaoks
Kinnitatud
−Suurem arvutuslik kulu
−Keerulisem rakendada
−Nõuab seansi salvestusruumi
−Raskem siluda
Kontekstipime otsing
Eelised
+Kiire ja kerge
+Lihtne rakendada
+Madalamad taristukulud
+Ennustatav käitumine
Kinnitatud
−Halb järelpäringute tegemisel
−Isikupärastamine puudub
−Väiksem täpsus vestluses
−Jätab vestlusvihjed vahele
Tavalised eksiarvamused
Müüt
Kontekstiteadlik otsing on alati parem kui kontekstipõhine otsing.
Tõelisus
Mitte tingimata. Ühe pöördega ja täpselt määratletud päringute puhul võivad kontekstipõhised meetodid sobida või isegi edestada kontekstipõhiseid meetodeid, kuna need väldivad müra, mida lisakontekst mõnikord tekitab. Kontekstipõhise otsingu eelis ilmneb kõige selgemini mitme pöördega või isikupärastatud stsenaariumides.
Müüt
Kontekstipõhine otsing on aegunud ja seda enam ei kasutata.
Tõelisus
Kaugel sellest. BM25 ja põhiline tihe otsing jäävad paljude tootmisotsingu süsteemide, sealhulgas ettevõtte dokumendiotsingu ja e-kaubanduse platvormide selgrooks. Need toimivad tugevate alusjoonena ja on hübriidarhitektuurides sageli kombineeritud kontekstitundlike kihtidega.
Müüt
Kontekstiteadlik otsing tähendab, et mudel "mäletab" kõike.
Tõelisus
Praktikas kasutavad need süsteemid piiratud akent hiljutistest vestlustest, kokkuvõtlikest metaandmetest või ümberkirjutatud päringutest. Tõeline pikaajaline mälu on endiselt lahtine uurimisprobleem ja enamik süsteeme unustab vanemad pöörded pärast kontekstiaknast lahkumist.
Müüt
Vektorotsing on alati kontekstipõhine.
Tõelisus
Tiheda vektori otsing võib olla ükskõik milline. Lihtne vektorotsing ilma metaandmete filtreerimise või päringu ümberkirjutamiseta on sisuliselt kontekstipõhine. Seansi ajaloo, filtrite või päringu laiendamise lisamine muudab selle kontekstitundlikuks.
See vähendab neid, aga ei kõrvalda neid. Isegi hea otsingu korral võivad keelemudelid lõike valesti tõlgendada või teavet valesti kombineerida. Otsingu kvaliteet on üks pusletükk – otsingu käitumine on sama oluline.
Sageli küsitud küsimused
Mis on kontekstipõhine otsing RAG-is?
Kontekstiteadlik otsing RAG-is viitab dokumentide hankimisele, võttes arvesse vestluse ajalugu, kasutaja kavatsust ja metaandmeid, mitte ainult algpäringut. Tavaliselt hõlmab see päringu ümberkirjutamist, kontekstuaalset manustamist või seansipõhist filtreerimist, et tagada leitud lõikude vastavus sellele, mida kasutaja kontekstis mõtles.
Kuidas kontekstipõhine päring toimib?
Kontekstipõhine otsing toimib nii, et kasutaja päringut sobitatakse indeksiga ilma eelnevatele interaktsioonidele viitamata. Klassikaline BM25 märksõnaotsing ja põhilised tihedad vektorotsingud kuuluvad sellesse kategooriasse. Iga päringut käsitletakse uue, sõltumatu päringuna, mis hoiab süsteemi kiire ja prognoositava.
Kumb on vestlusrobotite jaoks parem, kontekstipõhine või kontekstipime otsingusüsteem?
Kontekstiteadlik päringuvõimalus on vestlusrobotite puhul peaaegu alati parem, sest kasutajad esitavad sageli järelküsimusi, mis sõltuvad varasematest voorudest. Ilma kontekstita ei suuda süsteem lahendada asesõnu ega viiteid nagu „see üks“ või „eelmine valik“, mis viib ebaoluliste vastusteni.
Kas saate mõlemat otsingumeetodit kombineerida?
Jah, hübriidsed otsingusüsteemid ühendavad kiiruse ja asjakohasuse tasakaalustamiseks märksõnaotsingu (kontekstipime) ja semantilise (sageli kontekstitundliku) otsingu. Paljud tootmissüsteemid kasutavad BM25-d koos tihedate manustustega ja seejärel ühendavad tulemused vastastikuse järjestusfusiooniga enne kontekstuaalsete filtrite rakendamist.
Kas kontekstipõhise otsingu käivitamine on kallim?
Üldiselt küll, sest vaja on salvestada seansi olekut, käivitada päringute ümberkirjutamise mudeleid ja rakendada metaandmete filtreid. Lisakoormus on erinev, kuid võrreldes tavalise vektorotsinguga on oodata umbes 20–50% suuremat latentsust ja arvutusvõimsust, olenevalt konteksti käsitlemise keerukusest.
Mis on päringu ümberkirjutamine kontekstipõhises otsingus?
Päringu ümberkirjutamine on protsess, mille käigus teisendatakse mitmetähenduslik ja kontekstist sõltuv küsimus enne otsingu alustamist iseseisvaks ja terviklikuks päringuks. Näiteks küsimus „kuidas on selle hinnaga?“ võidakse vestlusajaloo põhjal ümber kirjutada küsimuseks „mis on iPhone 15 hind?“. See on üks levinumaid tehnikaid kontekstitundlikes süsteemides.
Kas BM25 on kontekstipime?
Jah, traditsiooniline BM25 on kontekstipõhine. See hindab dokumente puhtalt terminite sageduse ja dokumendi pöördsageduse põhjal praeguse päringu suhtes. Siiski saate BM25 kontekstipõhisesse torujuhtmesse mähkida, kirjutades päringu esmalt ümber või filtreerides tulemusi seansi metaandmete järgi.
Millised võrdlusnäitajad mõõdavad kontekstipõhist otsingut?
Levinud võrdlusaluste hulka kuuluvad QReCC (küsimuste ümberkirjutamine vestluskontekstis), TopiOCQA (teemapõhine vestlusküsimuste kvaliteedikontroll) ja CAsT (vestlusabi jälgimise rada). Need andmekogumid hindavad, kui hästi süsteemid käsitlevad mitmepöördelisi päringuid, mille puhul kontekst on õige vastuse leidmiseks oluline.
Kas kõik vektorandmebaasid toetavad kontekstipõhist otsingut?
Enamik tänapäevaseid vektorandmebaase, nagu Pinecone, Weaviate, Chroma ja Qdrant, toetavad metaandmete filtreerimist ja hübriidotsingut, mis on kontekstipõhise otsingu alustalad. Tegelik kontekstihaldus – päringute ümberkirjutamine, seansi mälu – rakendatakse aga tavaliselt andmebaasi peal asuval rakenduskihil.
Millal peaksin kontekstipõhist otsingut kasutama?
Kontekstipõhine otsing sobib hästi olukordadesse, kus päringud on iseseisvad, isikupärastamist pole vaja ning latentsus või hind on prioriteet. Näideteks on sisemine dokumendiotsing, juriidiline otsing, tooteotsing e-kaubanduse saitidel ja kõik stsenaariumid, kus kasutajad tavaliselt sisestavad täielikke ja spetsiifilisi küsimusi.
Otsus
Valige kontekstipõhine päring, kui teie rakendus hõlmab mitmepöördelisi vestlusi, isikupärastamist või mitmetähenduslikke järelpäringuid – see on tänapäevaste RAG-i ja tehisintellekti assistentide standard. Lihtsate ühepöördelisi otsinguid tehes, kus kiirus ja madal hind on olulisemad kui vestluse sügavus, kasutage kontekstipõhist päringut.