intel·ligència artificialrecuperació-generació-augmentadadrapsistemes de cercaPNL

Recuperació sensible al context vs. recuperació cega al context

La recuperació contextual utilitza informació circumdant com l'historial de consultes, la intenció de l'usuari i les relacions amb els documents per oferir resultats més rellevants, mentre que la recuperació cega al context tracta cada consulta de forma aïllada. La primera potencia la IA conversacional moderna i la cerca personalitzada, mentre que la segona continua sent útil per a cerques senzilles i puntuals.

Destacats

La recuperació sensible al context manté la coherència de la conversa recordant consultes prèvies i senyals de l'usuari.
La recuperació cega al context és més ràpida, més econòmica i més senzilla d'implementar per a cerques factuals puntuals.
La majoria dels assistents d'IA de producció ara es basen en la recuperació contextual per gestionar les preguntes de seguiment amb precisió.
Els punts de referència acadèmics mostren que els mètodes sensibles al context superen les línies de base cegues al context en un 10-20% en tasques de diversos torns.

Què és Recuperació sensible al context?

Un mètode de recuperació que considera l'historial de consultes, el comportament de l'usuari i el context del document per retornar resultats més rellevants.

Incorpora senyals com ara torns de conversa anteriors, preferències de l'usuari i metadades a nivell de sessió per refinar els resultats de la cerca.
Els sistemes RAG moderns es basen en la recuperació sensible al context per mantenir converses coherents de diversos torns amb models lingüístics grans.
Tècniques com la reescriptura de consultes, HyDE i les incrustacions contextuals entren en aquesta categoria.
Les bases de dades vectorials com Pinecone, Weaviate i Chroma permeten la recuperació contextual mitjançant el filtratge de metadades i la cerca híbrida.
Generalment aconsegueix una major precisió en punts de referència conversacionals i personalitzats en comparació amb els mètodes cecs al context.

Què és Recuperació cega al context?

Un mètode de recuperació que processa cada consulta de manera independent sense tenir en compte les interaccions prèvies ni els senyals específics de l'usuari.

Tracta cada consulta de cerca com una sol·licitud independent, ignorant l'historial de converses o el context de la sessió.
Els motors de cerca de paraules clau clàssics com les primeres implementacions de Lucene i BM25 funcionen d'aquesta manera.
És computacionalment més barat i més ràpid, ja que no cal processar ni emmagatzemar cap context addicional.
Funciona bé per a cerques factuals on la consulta per si sola conté prou informació per trobar la resposta.
Serveix com a línia de base contra la qual es mesuren normalment els mètodes sensibles al context en els punts de referència acadèmics.

Taula comparativa

Funcionalitat	Recuperació sensible al context	Recuperació cega al context
Gestió de consultes	Utilitza l'historial de sessions i els senyals de l'usuari	Tracta cada consulta de manera independent
Rellevància en les converses	Alt: manté la coherència del diàleg	Baix: té dificultats amb els seguiments
Cost computacional	Més alt a causa del processament del context	Més baix i més ràpid per consulta
Personalització	Admet la personalització a nivell d'usuari	Sense personalització per defecte
Complexitat d'implementació	Requereix memòria, reescriptura i metadades	Índex invertit simple o cerca vectorial
Millors casos d'ús	Chatbots, assistents, cerca personalitzada	Consultes factuals puntuals, cerca de documents
Tècniques d'exemple	HyDE, reescriptura de consultes, incrustacions contextuals	BM25, recuperació densa bàsica, cerca de paraules clau
Requisits d'emmagatzematge	Requereix emmagatzematge de sessions i metadades	Mínim — només l'índex

Comparació detallada

Com entén cada enfocament les consultes

La recuperació sensible al context interpreta una consulta com a part d'una interacció en curs, basant-se en torns anteriors, perfils d'usuari i fins i tot en les metadades circumdants del document per esbrinar què vol dir realment algú. La recuperació cega al context, en canvi, examina la consulta de manera aïllada: les paraules que escriviu són l'únic senyal que utilitza. Això fa que els sistemes cecs al context siguin predictibles i fàcils de depurar, però sovint fallen quan una pregunta depèn del que hi havia abans.

Rendiment en entorns de conversa

Quan la gent xateja amb un assistent d'IA, les preguntes de seguiment poques vegades es mantenen soles. Frases com ara "què passa amb el segon?" o "com es compara això?" només tenen sentit amb un context previ. La recuperació sensible al context gestiona aquestes preguntes de manera natural reescrivint consultes ambigües en consultes independents abans de cercar. La recuperació cega al context tendeix a retornar resultats irrellevants en aquests casos, motiu pel qual la majoria de chatbots de producció ara utilitzen algun tipus de canalització sensible al context.

Velocitat, cost i infraestructura

Com que la recuperació cega al context evita la feina addicional de mantenir la memòria i reescriure les consultes, s'executa més ràpidament i costa menys operar a escala. La recuperació sensible al context afegeix una sobrecàrrega: cal emmagatzemar l'estat de la sessió, executar models de reescriptura de consultes i sovint filtrar els resultats vectorials per metadades. Per a càrregues de treball d'alt volum i baixa complexitat, com ara la indexació de milions de documents estàtics, els mètodes cecs al context encara es mantenen ferms.

Precisió i resultats de referència

La recerca sobre la recuperació densa conversacional, incloent-hi el treball de Meta AI i Microsoft en conjunts de dades com QReCC i TopiOCQA, mostra consistentment que els mètodes sensibles al context superen les línies de base cegues al context en un 10-20% en les puntuacions MRR i nDCG. La diferència s'eixampla en les consultes de diversos torns on dominen els pronoms i les referències. Dit això, per a les preguntes factuals d'un sol torn, la diferència es redueix considerablement.

Quan la simplicitat guanya

No totes les aplicacions necessiten coneixement contextual. Les bases de coneixement internes, la cerca de documents legals i la cerca de productes de comerç electrònic sovint funcionen bé amb la recuperació cega al context perquè les consultes tendeixen a ser específiques i autònomes. En aquests escenaris, la simplicitat, la velocitat i el menor cost d'infraestructura de la recuperació cega al context la converteixen en l'opció més pràctica.

Avantatges i Inconvenients

Recuperació sensible al context

Avantatges

+ Gestiona converses de diversos torns
+ Admet la personalització
+ Puntuacions de rellevància més altes
+ Millor per a consultes ambigües

Consumit

− Cost computacional més elevat
− Més complex d'implementar
− Requereix emmagatzematge de sessions
− Més difícil de depurar

Recuperació cega al context

Avantatges

+ Ràpid i lleuger
+ Fàcil d'implementar
+ Menor cost d'infraestructura
+ Comportament predictible

Consumit

− Deficient en consultes de seguiment
− Sense personalització
− Menys precisió al xat
− Perd pistes de conversa

Conceptes errònies habituals

Mite

La recuperació sensible al context sempre supera la recuperació cega al context.

Realitat

No necessàriament. Per a consultes d'un sol torn i ben especificades, els mètodes cecs al context poden igualar o fins i tot superar els que tenen en compte el context perquè eviten el soroll que de vegades introdueix el context addicional. L'avantatge de la recuperació amb coneixement de context es manifesta més clarament en escenaris de diversos torns o personalitzats.

Mite

La recuperació cega al context està obsoleta i ja no s'utilitza.

Realitat

Lluny d'això. BM25 i la recuperació densa bàsica continuen sent l'eix vertebrador de molts sistemes de cerca de producció, incloent-hi la cerca de documents empresarials i les plataformes de comerç electrònic. Serveixen com a línies de base sòlides i sovint es combinen amb capes sensibles al context en arquitectures híbrides.

Mite

La recuperació sensible al context significa que el model "ho recorda" tot.

Realitat

A la pràctica, aquests sistemes utilitzen una finestra limitada de conversa recent, metadades resumides o consultes reescrites. La veritable memòria a llarg termini encara és un problema de recerca obert, i la majoria de sistemes obliden els torns més antics un cop surten de la finestra de context.

Mite

La cerca vectorial sempre té en compte el context.

Realitat

La recuperació de vectors densos pot ser de qualsevol de les dues opcions. Una cerca vectorial simple sense filtratge de metadades ni reescriptura de consultes és essencialment cega al context. Afegir historial de sessions, filtres o expansió de consultes és el que la fa sensible al context.

Mite

La recuperació sensible al context elimina les al·lucinacions en els sistemes RAG.

Realitat

Els redueix però no els elimina. Fins i tot amb una bona recuperació, els models lingüístics poden malinterpretar passatges o combinar informació de manera incorrecta. La qualitat de la recuperació és una peça del trencaclosques: el comportament de generació importa igualment.

Preguntes freqüents

Què és la recuperació sensible al context en RAG?

La recuperació contextual en RAG fa referència a la recuperació de documents tenint en compte l'historial de converses, la intenció de l'usuari i les metadades, en lloc de només la consulta en brut. Normalment implica la reescriptura de consultes, incrustacions contextuals o filtratge basat en sessions per garantir que els passatges recuperats realment responguin al que l'usuari volia dir en context.

Com funciona la recuperació cega al context?

La recuperació cega al context funciona fent coincidir la consulta de l'usuari amb un índex sense cap referència a interaccions prèvies. La cerca clàssica de paraules clau BM25 i les cerques de vectors densos bàsiques entren en aquesta categoria. Cada consulta es tracta com una sol·licitud nova i independent, cosa que manté el sistema ràpid i predictible.

Què és millor per als chatbots, la recuperació contextual o la recuperació cega al context?

La recuperació contextual gairebé sempre és millor per als chatbots perquè els usuaris sovint fan preguntes de seguiment que depenen de torns anteriors. Sense context, el sistema no pot resoldre pronoms o referències com ara "aquell" o "l'opció anterior", cosa que porta a respostes irrellevants.

Podeu combinar els dos mètodes de recuperació?

Sí, els sistemes de recuperació híbrids combinen la cerca de paraules clau (cega al context) i la semàntica (sovint sensible al context) per equilibrar la velocitat i la rellevància. Molts sistemes de producció utilitzen BM25 juntament amb incrustacions denses i després fusionen els resultats amb la fusió de rangs recíprocs abans d'aplicar filtres contextuals.

La recuperació sensible al context costa més d'executar?

Generalment ho fa, perquè cal emmagatzemar l'estat de la sessió, executar models de reescriptura de consultes i aplicar filtres de metadades. La sobrecàrrega varia, però s'espera aproximadament un 20-50% més de latència i càlcul en comparació amb una cerca vectorial simple, depenent de com de sofisticada sigui la gestió del context.

Què és la reescriptura de consultes en la recuperació sensible al context?

La reescriptura de consultes és el procés de convertir una pregunta ambigua i dependent del context en una consulta independent i autocontinguda abans de cercar. Per exemple, "què passa amb el seu preu?" es pot reescriure com "quin és el preu de l'iPhone 15?" basant-se en l'historial de converses. Aquesta és una de les tècniques més comunes utilitzades en sistemes sensibles al context.

El BM25 és cec al context?

Sí, el BM25 tradicional no té en compte el context. Puntua els documents basant-se únicament en la freqüència dels termes i la inversa de la freqüència dels documents en relació amb la consulta actual. Tanmateix, podeu embolicar el BM25 en un pipeline sensible al context reescrivint primer la consulta o filtrant els resultats per metadades de sessió.

Quins punts de referència mesuren la recuperació sensible al context?

Els punts de referència habituals inclouen QReCC (Reescriptura de preguntes en context conversacional), TopiOCQA (QA conversacional orientada a temes) i CAsT (Track d'assistència conversacional). Aquests conjunts de dades avaluen l'eficiència dels sistemes en la gestió de consultes multitorn on el context és essencial per trobar la resposta correcta.

Totes les bases de dades vectorials admeten la recuperació sensible al context?

La majoria de bases de dades vectorials modernes com Pinecone, Weaviate, Chroma i Qdrant admeten el filtratge de metadades i la cerca híbrida, que són blocs bàsics per a la recuperació contextual. Tanmateix, la gestió del context real (reescriptura de consultes, memòria de sessió) s'implementa normalment a la capa d'aplicació a la part superior de la base de dades.

Quan hauria d'utilitzar la recuperació cega al context?

La recuperació cega al context és una bona opció quan les consultes són independents, no cal personalitzar-les i la latència o el cost són prioritaris. Alguns exemples són la cerca interna de documents, la cerca legal, la cerca de productes en llocs de comerç electrònic i qualsevol escenari en què els usuaris normalment escriguin preguntes completes i específiques.

Veredicte

Trieu la recuperació contextual quan la vostra aplicació impliqui converses de diversos torns, personalització o consultes de seguiment ambigües: és l'estàndard per als assistents moderns de RAG i IA. Utilitzeu la recuperació cega al context per a cerques senzilles d'un sol torn on la velocitat i el baix cost importen més que la profunditat de la conversa.

Comparacions relacionades

Actualitzacions de gràfics basades en esdeveniments vs. processament de gràfics per lots

Aquest desglossament detallat explora les diferències fonamentals entre les actualitzacions de gràfics basades en esdeveniments i el processament de gràfics per lots dins de les arquitectures d'IA. Mentre que les pipelines basades en esdeveniments gestionen la transmissió en temps real i les mutacions irregulars de la topologia de xarxa, el processament per lots consolida els canvis en execucions computacionals pesades i programades per maximitzar el rendiment del sistema i la saturació del maquinari.

Actualitzacions de models en temps real vs. reentrenament de models per lots

Les actualitzacions de models en temps real i el reentrenament de models per lots representen dos enfocaments fonamentalment diferents per mantenir els sistemes d'aprenentatge automàtic actualitzats. Els mètodes en temps real s'adapten instantàniament a les noves dades, mentre que el reentrenament per lots reconstrueix els models a intervals programats utilitzant conjunts de dades acumulats.

Actualitzacions de versions de LLM vs. manteniment de models antics

Les actualitzacions de la versió LLM se centren en la implementació de models de llenguatge més nous i capaços amb un raonament i unes funcions millorades, mentre que el manteniment de models antics manté els sistemes d'IA més antics funcionant de manera fiable. Les organitzacions han de sospesar la innovació contra l'estabilitat a l'hora de decidir entre actualitzar o mantenir els seus models existents.

Adaptació de domini vs. entrenament dins del domini

Aquesta comparació analitza les opcions estratègiques en l'aprenentatge automàtic entre l'adaptació de domini, que transfereix coneixement d'un entorn d'origen etiquetat a un entorn de destinació diferent, i l'entrenament dins del domini, que crea models completament a partir de dades recollides de la configuració exacta de desplegament de destinació.

Adaptació lingüística en IA vs. sistemes d'IA agnòstics al llenguatge

L'adaptació lingüística en la IA se centra en l'ensenyament de models per gestionar idiomes específics mitjançant l'afinament i l'aprenentatge per transferència, mentre que els sistemes d'IA agnòstics a l'idioma tenen com a objectiu processar qualsevol idioma sense formació específica per a l'idioma. Ambdós enfocaments aborden els reptes multilingües, però difereixen fonamentalment en l'arquitectura, les dades d'entrenament i el desplegament al món real.