intel·ligència artificialrecuperació-generació-augmentadadrapsistemes de cercaPNL
Recuperació sensible al context vs. recuperació cega al context
La recuperació contextual utilitza informació circumdant com l'historial de consultes, la intenció de l'usuari i les relacions amb els documents per oferir resultats més rellevants, mentre que la recuperació cega al context tracta cada consulta de forma aïllada. La primera potencia la IA conversacional moderna i la cerca personalitzada, mentre que la segona continua sent útil per a cerques senzilles i puntuals.
Destacats
La recuperació sensible al context manté la coherència de la conversa recordant consultes prèvies i senyals de l'usuari.
La recuperació cega al context és més ràpida, més econòmica i més senzilla d'implementar per a cerques factuals puntuals.
La majoria dels assistents d'IA de producció ara es basen en la recuperació contextual per gestionar les preguntes de seguiment amb precisió.
Els punts de referència acadèmics mostren que els mètodes sensibles al context superen les línies de base cegues al context en un 10-20% en tasques de diversos torns.
Què és Recuperació sensible al context?
Un mètode de recuperació que considera l'historial de consultes, el comportament de l'usuari i el context del document per retornar resultats més rellevants.
Incorpora senyals com ara torns de conversa anteriors, preferències de l'usuari i metadades a nivell de sessió per refinar els resultats de la cerca.
Els sistemes RAG moderns es basen en la recuperació sensible al context per mantenir converses coherents de diversos torns amb models lingüístics grans.
Tècniques com la reescriptura de consultes, HyDE i les incrustacions contextuals entren en aquesta categoria.
Les bases de dades vectorials com Pinecone, Weaviate i Chroma permeten la recuperació contextual mitjançant el filtratge de metadades i la cerca híbrida.
Generalment aconsegueix una major precisió en punts de referència conversacionals i personalitzats en comparació amb els mètodes cecs al context.
Què és Recuperació cega al context?
Un mètode de recuperació que processa cada consulta de manera independent sense tenir en compte les interaccions prèvies ni els senyals específics de l'usuari.
Tracta cada consulta de cerca com una sol·licitud independent, ignorant l'historial de converses o el context de la sessió.
Els motors de cerca de paraules clau clàssics com les primeres implementacions de Lucene i BM25 funcionen d'aquesta manera.
És computacionalment més barat i més ràpid, ja que no cal processar ni emmagatzemar cap context addicional.
Funciona bé per a cerques factuals on la consulta per si sola conté prou informació per trobar la resposta.
Serveix com a línia de base contra la qual es mesuren normalment els mètodes sensibles al context en els punts de referència acadèmics.
Taula comparativa
Funcionalitat
Recuperació sensible al context
Recuperació cega al context
Gestió de consultes
Utilitza l'historial de sessions i els senyals de l'usuari
Tracta cada consulta de manera independent
Rellevància en les converses
Alt: manté la coherència del diàleg
Baix: té dificultats amb els seguiments
Cost computacional
Més alt a causa del processament del context
Més baix i més ràpid per consulta
Personalització
Admet la personalització a nivell d'usuari
Sense personalització per defecte
Complexitat d'implementació
Requereix memòria, reescriptura i metadades
Índex invertit simple o cerca vectorial
Millors casos d'ús
Chatbots, assistents, cerca personalitzada
Consultes factuals puntuals, cerca de documents
Tècniques d'exemple
HyDE, reescriptura de consultes, incrustacions contextuals
BM25, recuperació densa bàsica, cerca de paraules clau
Requisits d'emmagatzematge
Requereix emmagatzematge de sessions i metadades
Mínim — només l'índex
Comparació detallada
Com entén cada enfocament les consultes
La recuperació sensible al context interpreta una consulta com a part d'una interacció en curs, basant-se en torns anteriors, perfils d'usuari i fins i tot en les metadades circumdants del document per esbrinar què vol dir realment algú. La recuperació cega al context, en canvi, examina la consulta de manera aïllada: les paraules que escriviu són l'únic senyal que utilitza. Això fa que els sistemes cecs al context siguin predictibles i fàcils de depurar, però sovint fallen quan una pregunta depèn del que hi havia abans.
Rendiment en entorns de conversa
Quan la gent xateja amb un assistent d'IA, les preguntes de seguiment poques vegades es mantenen soles. Frases com ara "què passa amb el segon?" o "com es compara això?" només tenen sentit amb un context previ. La recuperació sensible al context gestiona aquestes preguntes de manera natural reescrivint consultes ambigües en consultes independents abans de cercar. La recuperació cega al context tendeix a retornar resultats irrellevants en aquests casos, motiu pel qual la majoria de chatbots de producció ara utilitzen algun tipus de canalització sensible al context.
Velocitat, cost i infraestructura
Com que la recuperació cega al context evita la feina addicional de mantenir la memòria i reescriure les consultes, s'executa més ràpidament i costa menys operar a escala. La recuperació sensible al context afegeix una sobrecàrrega: cal emmagatzemar l'estat de la sessió, executar models de reescriptura de consultes i sovint filtrar els resultats vectorials per metadades. Per a càrregues de treball d'alt volum i baixa complexitat, com ara la indexació de milions de documents estàtics, els mètodes cecs al context encara es mantenen ferms.
Precisió i resultats de referència
La recerca sobre la recuperació densa conversacional, incloent-hi el treball de Meta AI i Microsoft en conjunts de dades com QReCC i TopiOCQA, mostra consistentment que els mètodes sensibles al context superen les línies de base cegues al context en un 10-20% en les puntuacions MRR i nDCG. La diferència s'eixampla en les consultes de diversos torns on dominen els pronoms i les referències. Dit això, per a les preguntes factuals d'un sol torn, la diferència es redueix considerablement.
Quan la simplicitat guanya
No totes les aplicacions necessiten coneixement contextual. Les bases de coneixement internes, la cerca de documents legals i la cerca de productes de comerç electrònic sovint funcionen bé amb la recuperació cega al context perquè les consultes tendeixen a ser específiques i autònomes. En aquests escenaris, la simplicitat, la velocitat i el menor cost d'infraestructura de la recuperació cega al context la converteixen en l'opció més pràctica.
Avantatges i Inconvenients
Recuperació sensible al context
Avantatges
+Gestiona converses de diversos torns
+Admet la personalització
+Puntuacions de rellevància més altes
+Millor per a consultes ambigües
Consumit
−Cost computacional més elevat
−Més complex d'implementar
−Requereix emmagatzematge de sessions
−Més difícil de depurar
Recuperació cega al context
Avantatges
+Ràpid i lleuger
+Fàcil d'implementar
+Menor cost d'infraestructura
+Comportament predictible
Consumit
−Deficient en consultes de seguiment
−Sense personalització
−Menys precisió al xat
−Perd pistes de conversa
Conceptes errònies habituals
Mite
La recuperació sensible al context sempre supera la recuperació cega al context.
Realitat
No necessàriament. Per a consultes d'un sol torn i ben especificades, els mètodes cecs al context poden igualar o fins i tot superar els que tenen en compte el context perquè eviten el soroll que de vegades introdueix el context addicional. L'avantatge de la recuperació amb coneixement de context es manifesta més clarament en escenaris de diversos torns o personalitzats.
Mite
La recuperació cega al context està obsoleta i ja no s'utilitza.
Realitat
Lluny d'això. BM25 i la recuperació densa bàsica continuen sent l'eix vertebrador de molts sistemes de cerca de producció, incloent-hi la cerca de documents empresarials i les plataformes de comerç electrònic. Serveixen com a línies de base sòlides i sovint es combinen amb capes sensibles al context en arquitectures híbrides.
Mite
La recuperació sensible al context significa que el model "ho recorda" tot.
Realitat
A la pràctica, aquests sistemes utilitzen una finestra limitada de conversa recent, metadades resumides o consultes reescrites. La veritable memòria a llarg termini encara és un problema de recerca obert, i la majoria de sistemes obliden els torns més antics un cop surten de la finestra de context.
Mite
La cerca vectorial sempre té en compte el context.
Realitat
La recuperació de vectors densos pot ser de qualsevol de les dues opcions. Una cerca vectorial simple sense filtratge de metadades ni reescriptura de consultes és essencialment cega al context. Afegir historial de sessions, filtres o expansió de consultes és el que la fa sensible al context.
Mite
La recuperació sensible al context elimina les al·lucinacions en els sistemes RAG.
Realitat
Els redueix però no els elimina. Fins i tot amb una bona recuperació, els models lingüístics poden malinterpretar passatges o combinar informació de manera incorrecta. La qualitat de la recuperació és una peça del trencaclosques: el comportament de generació importa igualment.
Preguntes freqüents
Què és la recuperació sensible al context en RAG?
La recuperació contextual en RAG fa referència a la recuperació de documents tenint en compte l'historial de converses, la intenció de l'usuari i les metadades, en lloc de només la consulta en brut. Normalment implica la reescriptura de consultes, incrustacions contextuals o filtratge basat en sessions per garantir que els passatges recuperats realment responguin al que l'usuari volia dir en context.
Com funciona la recuperació cega al context?
La recuperació cega al context funciona fent coincidir la consulta de l'usuari amb un índex sense cap referència a interaccions prèvies. La cerca clàssica de paraules clau BM25 i les cerques de vectors densos bàsiques entren en aquesta categoria. Cada consulta es tracta com una sol·licitud nova i independent, cosa que manté el sistema ràpid i predictible.
Què és millor per als chatbots, la recuperació contextual o la recuperació cega al context?
La recuperació contextual gairebé sempre és millor per als chatbots perquè els usuaris sovint fan preguntes de seguiment que depenen de torns anteriors. Sense context, el sistema no pot resoldre pronoms o referències com ara "aquell" o "l'opció anterior", cosa que porta a respostes irrellevants.
Podeu combinar els dos mètodes de recuperació?
Sí, els sistemes de recuperació híbrids combinen la cerca de paraules clau (cega al context) i la semàntica (sovint sensible al context) per equilibrar la velocitat i la rellevància. Molts sistemes de producció utilitzen BM25 juntament amb incrustacions denses i després fusionen els resultats amb la fusió de rangs recíprocs abans d'aplicar filtres contextuals.
La recuperació sensible al context costa més d'executar?
Generalment ho fa, perquè cal emmagatzemar l'estat de la sessió, executar models de reescriptura de consultes i aplicar filtres de metadades. La sobrecàrrega varia, però s'espera aproximadament un 20-50% més de latència i càlcul en comparació amb una cerca vectorial simple, depenent de com de sofisticada sigui la gestió del context.
Què és la reescriptura de consultes en la recuperació sensible al context?
La reescriptura de consultes és el procés de convertir una pregunta ambigua i dependent del context en una consulta independent i autocontinguda abans de cercar. Per exemple, "què passa amb el seu preu?" es pot reescriure com "quin és el preu de l'iPhone 15?" basant-se en l'historial de converses. Aquesta és una de les tècniques més comunes utilitzades en sistemes sensibles al context.
El BM25 és cec al context?
Sí, el BM25 tradicional no té en compte el context. Puntua els documents basant-se únicament en la freqüència dels termes i la inversa de la freqüència dels documents en relació amb la consulta actual. Tanmateix, podeu embolicar el BM25 en un pipeline sensible al context reescrivint primer la consulta o filtrant els resultats per metadades de sessió.
Quins punts de referència mesuren la recuperació sensible al context?
Els punts de referència habituals inclouen QReCC (Reescriptura de preguntes en context conversacional), TopiOCQA (QA conversacional orientada a temes) i CAsT (Track d'assistència conversacional). Aquests conjunts de dades avaluen l'eficiència dels sistemes en la gestió de consultes multitorn on el context és essencial per trobar la resposta correcta.
Totes les bases de dades vectorials admeten la recuperació sensible al context?
La majoria de bases de dades vectorials modernes com Pinecone, Weaviate, Chroma i Qdrant admeten el filtratge de metadades i la cerca híbrida, que són blocs bàsics per a la recuperació contextual. Tanmateix, la gestió del context real (reescriptura de consultes, memòria de sessió) s'implementa normalment a la capa d'aplicació a la part superior de la base de dades.
Quan hauria d'utilitzar la recuperació cega al context?
La recuperació cega al context és una bona opció quan les consultes són independents, no cal personalitzar-les i la latència o el cost són prioritaris. Alguns exemples són la cerca interna de documents, la cerca legal, la cerca de productes en llocs de comerç electrònic i qualsevol escenari en què els usuaris normalment escriguin preguntes completes i específiques.
Veredicte
Trieu la recuperació contextual quan la vostra aplicació impliqui converses de diversos torns, personalització o consultes de seguiment ambigües: és l'estàndard per als assistents moderns de RAG i IA. Utilitzeu la recuperació cega al context per a cerques senzilles d'un sol torn on la velocitat i el baix cost importen més que la profunditat de la conversa.