tehisintellekttehisintellekti agendidLLMautomatiseeriminevestluslik-aitööriistade kasutamine
Vestlusagendid vs tööriistu kasutavad agendid
Vestlusagendid keskenduvad loomulikule dialoogile ja tekstipõhisele suhtlusele, samas kui tööriistu kasutavad agendid laiendavad tehisintellekti võimalusi väliste funktsioonide ja API-de abil. Mõlemad esindavad autonoomsete tehisintellekti süsteemide erinevaid lähenemisviise, kusjuures vestlusmudelid paistavad silma suhtluses ja tööriistu kasutavad agendid on spetsialiseerunud reaalsete ülesannete täitmisele.
Esiletused
Vestlusagendid seavad esikohale dialoogi kvaliteedi, tööriistu kasutavad agendid aga reaalsete ülesannete täitmise.
Tööriistu kasutavad agendid järgivad planeeri-tegutse-vaatle tsüklit, mis maandab vastused väliste andmete, mitte ainult mudelmälu põhjal.
Vestlusagendid saavad vabalt hallutsineerida; tööriistu kasutavad agendid saavad tööriistade tagasiside kaudu oma tähelepanekuid kontrollida ja ennast parandada.
Kaasaegsed tootmissüsteemid ühendavad üha enam mõlemat lähenemisviisi, kasutades vestlust esiotsa ja tööriistu tagaotsa.
Mis on Vestlusagendid?
Tehisintellekti süsteemid, mis on loodud peamiselt loomuliku keele dialoogiks, küsimustele vastamiseks ja kasutajatega sidusate vestluste pidamiseks.
Vestlusagendid on üles ehitatud suurte keelemudelite ümber, mida on treenitud massiivsetel tekstikorpustel, et genereerida inimlikke vastuseid.
Nad tuginevad trafopõhistele arhitektuuridele, samale tehnoloogiale, mis on loodud selliste mudelite nagu GPT-4, Claude ja Llama taga.
Enamik vestlusagente töötab ühe või lühikese mitme pöördega kontekstiakna piires ilma püsiva mäluta.
Tavaliselt ei suhtle nad väliste süsteemidega, välja arvatud juhul, kui neid on otseselt täiendatud otsingu- või tööriistafunktsioonidega.
Populaarsete näidete hulka kuuluvad ChatGPT, Google Gemini vestlusrežiim ja Anthropici Claude oma standardses vestluskonfiguratsioonis.
Mis on Tööriistu kasutavad agendid?
Tehisintellekti süsteemid, mis laiendavad keelemudeli võimalusi, kutsudes reaalsete ülesannete täitmiseks väliseid funktsioone, API-sid, andmebaase ja tarkvaratööriistu.
Tööriistu kasutavad agendid järgivad arutlustsüklit, kus nad planeerivad, valivad tööriista, rakendavad seda ja jälgivad tulemust enne jätkamist.
Raamistikud nagu LangChain, AutoGPT ja ReAct populariseerisid mustrit, mis andis õigusteaduse magistritele struktureeritud juurdepääsu välistele utiliitidele.
Nad saavad teha selliseid toiminguid nagu veebis otsimine, koodi käivitamine, andmebaasidest päringute tegemine, e-kirjade saatmine ja brauserite juhtimine.
2022. aasta ReActi artiklis tutvustati arutlemise ja tegutsemise sünergiat, mis on tänapäevaste tööriistu kasutavate agentide aluskontseptsioon.
OpenAI funktsioonide kutsumise API-st, mis avaldati 2023. aastal, sai standardmehhanism keelemudelite ühendamiseks väliste tööriistadega.
Võrdlustabel
Funktsioon
Vestlusagendid
Tööriistu kasutavad agendid
Põhifunktsioon
Loomulikus keeles dialoog ja teabe edastamine
Ülesannete täitmine väliste tööriistade ja API-de kaudu
Vestlusagendid on loodud eelkõige suhtlemiseks. Nende arhitektuur keskendub sidusa ja kontekstipõhise teksti loomisele vastuseks kasutaja küsimustele. Tööriistu kasutavad agendid on seevastu loodud tegutsema. Nad käsitlevad keelt pigem planeerimisvahendina kui lõppväljundina, kasutades seda otsustamaks, milliseid väliseid ressursse kasutada ja kuidas tulemusi tõlgendada.
Suhtlemine välismaailmaga
Standardne vestlusagent asub oma keelemudeli sees. Ilma täiendava toestuseta ei saa see reaalajas ilma kontrollida, CRM-ist andmeid hankida ega arvutusi teha. Tööriistu kasutavad agendid täidavad selle lünga, mässides mudeli orkestreerimiskihti, mis paljastab funktsioonid, API-d ja teenused. Mudel otsustab, millal ja kuidas neid kutsuda, muutes agendi passiivsest vastajast digitaalsete töövoogude aktiivseks osalejaks.
Arutluskäik ja otsuste tegemine
Vestlusagendid arutlevad kaudselt oma järgmise märgi ennustuste kaudu, mis toimib hästi keeleülesannete puhul, kuid piirab nende võimet fakte kontrollida või mitmeastmelisi toiminguid teha. Tööriistu kasutavad agendid järgivad selgesõnalisi arutlusmustreid nagu ReAct või mõtteahela planeerimine, kus iga samm põhineb kas sisemisel arutluskäigul või välisel vaatlusel. See muudab nende otsustusprotsessi läbipaistvamaks ja auditeeritavamaks.
Usaldusväärsus ja vigade taastamine
Kui vestlusagent pole kindel, siis ta tavaliselt heidab end või hallutsineerib, kuna tal pole võimalust oma väiteid kontrollida. Tööriistu kasutavad agendid saavad vigadest taastuda tööriista uuesti päringu esitamise, väljundite skeemide alusel valideerimise või alternatiivsete lähenemisviiside proovimise teel. See tagasisideahel vähendab oluliselt hallutsinatsioone ülesannete puhul, mis nõuavad faktilist täpsust, näiteks kliendiandmete hankimine või finantsarvutuste tegemine.
Praktilised rakendused
Vestlusagendid säravad stsenaariumides, kus eesmärk on arusaamine, selgitamine või loominguline genereerimine, näiteks juhendamine, meilide koostamine või klienditoe pakkumine. Tööriistu kasutavad agendid on suurepärased siis, kui ülesanne nõuab pigem tegemist kui ütlemist, näiteks kohtumiste broneerimine, SQL-päringute käivitamine või mitmeastmeliste äriprotsesside automatiseerimine. Paljud tootmissüsteemid ühendavad nüüd mõlemad, kasutades vestlusliideseid kavatsuste kogumiseks ja tööriistade käivitamist selle täitmiseks.
Plussid ja miinused
Vestlusagendid
Eelised
+Loomulik dialoogivoog
+Lihtne paigaldada
+Lai keelevalik
+Madal integreerimise üldkulu
Kinnitatud
−Piiratud reaalse maailma tegevus
−Kalduvus hallutsinatsioonidele
−Välist kinnitust pole
−Nõrk mitmeastmeliste ülesannete puhul
Tööriistu kasutavad agendid
Eelised
+Teostab reaalseid tegusid
+Vähendab hallutsinatsioone
+Integreerub API-dega
+Tegeleb keerukate töövoogudega
Kinnitatud
−Suurem seadistuse keerukus
−Tööriista rikke riskid
−API-kõnede latentsusaeg
−Nõuab hoolikat orkestreerimist
Tavalised eksiarvamused
Müüt
Vestlusagendid ja tööriistu kasutavad agendid on täiesti eraldi tehnoloogiad.
Tõelisus
Enamik tööriistu kasutavaid agente on üles ehitatud vestluskeele mudelitele. See erinevus on pigem arhitektuuriline kui fundamentaalne, kuna sama aluseks olev LLM võib toimida mõlemas režiimis, olenevalt sellest, kuidas see on pakitud ja kuidas seda palutakse.
Müüt
Tööriistu kasutavad agendid ei hallutsineeri kunagi, sest nad kasutavad väliseid tööriistu.
Tõelisus
Tööriistu kasutavad agendid võivad ikkagi hallutsinatsioone kogeda, valides vale tööriista, tõlgendades tööriista väljundeid valesti või fabritseerides parameetreid. Tööriistad vähendavad, kuid ei kõrvalda hallutsinatsioone, eriti kui arutlusprotsess ise on ebausaldusväärne.
Müüt
Vestlusagendid ei pääse reaalajas teabele ligi.
Tõelisus
Paljud tänapäevased vestlusagendid sisaldavad otsingu abil laiendatud genereerimise või sirvimise tööriistu, mis võimaldavad neil reaalajas andmeid hankida. Baasarhitektuur võib olla vestluspõhine, kuid tootmiskeskkonna juurutused lisavad sageli tööriistade võimalusi kaadritagustesse rakendustesse.
Müüt
Tööriistu kasutavad agendid on alati täpsemad kui vestlusagendid.
Tõelisus
Täpsus sõltub ülesandest. Avatud loomingulise kirjutamise või subjektiivse nõustamise puhul on vestlusagendid sageli paremad kui tööriistad kasutavad süsteemid. Tööriistad aitavad faktiliste ja protseduuriliste ülesannete puhul, kuid ei lisa väärtust, kui vastus on puhtalt keeleline.
Müüt
Tööriista kasutava agendi loomine nõuab uue mudeli nullist treenimist.
Tõelisus
Enamik tööriistu kasutavaid agente konstrueeritakse olemasolevate keelemudelite abil funktsioonide kutsumise skeemide abil, et neid täpsustada või viimistleda. Uut baasmudelit pole vaja, mistõttu on see lähenemisviis tööstuses nii kiiresti levinud.
Sageli küsitud küsimused
Mis on peamine erinevus vestlusagendi ja tööriistu kasutava agendi vahel?
Vestlusagent keskendub loomuliku keele vastuste genereerimisele, samas kui tööriistu kasutav agent laiendab seda võimekust, kutsudes reaalsete ülesannete täitmiseks väliseid funktsioone, API-sid ja teenuseid. Vestlusagent räägib; tööriistu kasutav agent tegutseb.
Kas vestlusagent oskab tööriistu kasutada?
Jah. Kaasaegseid vestlusagente, nagu ChatGPT ja Claude, saab konfigureerida sirvimise, koodi käivitamise ja funktsioonide kutsumise funktsioonidega. Nendes konfiguratsioonides käituvad nad hübriidsüsteemidena, mis ühendavad dialoogi tööriistade käivitamisega.
Milliseid raamistikke kasutatakse tööriistu kasutavate agentide loomiseks?
Populaarsete raamistike hulka kuuluvad LangChain, LlamaIndex, AutoGPT, CrewAI ja Microsoft AutoGen. Need pakuvad abstraktsioone tööriistade määratlemiseks, agentide tsüklite haldamiseks ja mitme agendi töövoogude orkestreerimiseks põhimudelite põhjal.
Kas tööriistade kasutamise vahendid vähendavad hallutsinatsioone?
Eriti faktipäringute puhul saavad nad seda teha, kuna agent saab väiteid väliste allikate põhjal kontrollida. Tööriista valimise või väljundi tõlgendamise ajal võivad hallutsinatsioonid siiski esineda, seega pole tööriista kasutamine iseenesest täielik lahendus.
Milline agent sobib klienditoe jaoks paremini?
Hübriidsüsteemid toimivad tavaliselt kõige paremini. Vestluskiht tegeleb loomuliku dialoogi ja tooniga, samas kui tööriistakiht hangib kontoandmeid, töötleb tagasimakseid või eskaleerib pileteid. Puhtalt vestlusagentidel on raskusi toimingutega ja puhtalt tööriistadel põhinevad agendid tunduvad sageli robotlikud.
Mis on ReAct raamistik?
Yao ja tema kolleegide 2022. aasta artiklis tutvustatud ReAct ühendab arutluskäigu ja tegutsemise ühes tsüklis. Agent mõtleb, mida teha, sooritab toimingu tööriista abil, jälgib tulemust ja kordab. Sellest sai tänapäevaste tööriistu kasutavate agentide alusmuster.
Kas tööriistu kasutavate agentide käitamine on kallim?
Üldiselt jah, sest iga tööriistakutse lisab latentsusaega ja võib kaasa tuua API-kulusid kolmandate osapoolte teenustelt. Mitmeastmelised agenditsüklid võivad samuti tarbida rohkem tokeneid. See kompromiss on tavaliselt väärt ülesannete puhul, mis nõuavad täpsust või reaalset tegevust.
Kas tööriistu kasutavad agendid saavad ilma internetita töötada?
Jah, kui tööriistad on lokaalsed. Agendid saavad ilma internetiühenduseta kasutada seadmes olevaid kalkulaatoreid, kohalikke andmebaase, failisüsteeme või ettevõtte sisemisi API-sid. Arhitektuur on sama olenemata tööriistade asukohast.
Milliseid oskusi on vaja tööriista kasutava agendi loomiseks?
Tavaliselt on vaja kiireid insenerioskusi, tuttavust LLM API-dega, programmeerimise põhitõdesid (tavaliselt Python või TypeScript) ja arusaamist tööriistaskeemide määratlemisest. Enamiku rakendustaseme agentide versioonide jaoks pole masinõppe alaseid teadmisi vaja.
Kas vestlusagendid asendavad lõpuks tööriistu kasutavad agendid?
Ebatõenäoline. Need kaks lähenemisviisi täidavad erinevaid eesmärke ja neid kombineeritakse üha enam. Tulevikusüsteemid käsitlevad vestlust tõenäoliselt liidesena ja tööriistade kasutamist teostuskihina, mistõttu on erinevus pigem arhitektuuri kui konkurentsi küsimus.
Otsus
Valige vestlusagent, kui teie peamine vajadus on kvaliteetne dialoog, sisu loomine või teadmusbaasist küsimustele vastamine. Valige tööriistu kasutav agent, kui vajate tehisintellekti reaalsete toimingute tegemiseks, väliste süsteemidega integreerumiseks või mitmeastmeliste töövoogude automatiseerimiseks. Praktikas ühendavad kõige võimsamad tänapäevased süsteemid mõlemad, kasutades vestlust liidesena ja tööriistu mootorina.