dirbtinis intelektasprograminės įrangos inžinerijamašininis mokymasisagentų darbo eigos
Taisyklėmis pagrįsti agentai ir mokymosi pagrindu veikiantys agentai
Šiame architektūriniame palyginime deterministinė taisyklėmis pagrįstų agentų inžinerija su prisitaikančiu duomenimis pagrįstu mokymosi pagrįstų agentų pobūdžiu, įvertinant jų pritaikomumą realiame pasaulyje, mastelio keitimo ribas ir našumą esant neapibrėžtumui.
Akcentai
Taisyklėmis pagrįsti agentai įgyvendina griežtą, deterministinį pasaulėžiūrą, sukurtą vien tik žmonių srities patirtimi.
Mokymosi pagrindu veikiantys agentai dinamiškai prisitaiko, atskleisdami subtilius matematinius modelius, kurių žmonės gali nepastebėti.
Taisyklėmis pagrįstai sistemai nereikia pradinių duomenų, tačiau ji prastai veikia atvirojo pasaulio aplinkoje.
Dėl mokymosi pagrindu veikiančių sistemų skaidrumo stokos jas sunkiau audituoti siekiant užtikrinti griežtą atitiktį reglamentams.
Kas yra Taisyklėmis pagrįsti agentai?
Sistemos, valdomos aiškios, žmogaus užkoduotos logikos ir sąlyginių teiginių, siekiant pateikti nuspėjamus, deterministinius rezultatus.
Veikia griežtai pagal „jei-tada“ semantinį karkasą, kurį visiškai sukūrė žmonių programuotojai.
Pasižymi absoliučiu nuspėjamumu, užtikrinant tą pačią produkciją kiekvieną kartą esant tam tikrai įvesties informacijai.
Nereikia jokių mokymo duomenų ar optimizavimo fazių prieš diegiant gamyboje.
Parodo visiškai skaidrų sprendimų priėmimo procesą, kurį žmonės gali lengvai patikrinti.
Visiškai nepavyksta, kai susiduriama su naujais kraštiniais atvejais, esančiais už aiškios iš anksto užprogramuotos logikos ribų.
Kas yra Mokymosi pagrindu veikiantys agentai?
Adaptyvūs programinės įrangos subjektai, kurie savarankiškai atranda modelius, optimizuoja politikas ir tobulina veiksmus per duomenų atskleidimą.
Naudoja neuroninius tinklus, statistinius modelius arba pastiprinimo algoritmus elgesiui apibendrinti.
Gerina našumą laikui bėgant nuolat sąveikaujant su duomenimis arba imituojamomis aplinkomis.
Klesti daugiamatėse, sudėtingose erdvėse, kuriose yra daug aplinkos triukšmo.
Iš esmės veikia kaip juodoji dėžė, todėl tikslią žingsnis po žingsnio logiką sunku interpretuoti.
Reikalinga didelė skaičiavimo infrastruktūra mokymo, tikslinimo ir išvadų ciklams.
Palyginimo lentelė
Funkcija
Taisyklėmis pagrįsti agentai
Mokymosi pagrindu veikiantys agentai
Pagrindinis mechanizmas
Žmogaus sukurtos ekspertų taisyklės
Algoritminis duomenų optimizavimas
Nuspėjamumas
100 % deterministinis
Tikimybinis ir statistinis
Duomenų priklausomybė
Nereikia
Reikalingi dideli arba dideli duomenų rinkiniai
Elgesys kraštutiniais atvejais
Sistemos gedimas arba numatytoji klaida
Apytikslis spėjimas arba apibendrinimas
Paaiškinimas
Visiškai skaidrus (aiškūs loginiai medžiai)
Neskaidrios (sudėtingos svorio matricos)
Mastelio sudėtingumas
Tampa nevaldoma augant taisyklėms
Pagerina našumą, kai skaičiuojama pagal mastą
Vystymosi kliūtis
Laikas, skirtas pokalbiams su srities ekspertais
Laikas, skirtas duomenų rinkimui ir valymui
Išsamus palyginimas
Architektūrinė logika ir sprendimų priėmimas
Taisyklėmis pagrįsti agentai remiasi „iš viršaus į apačią“ principu veikiančiu dizainu, kur žmonės inžinieriai veikia kaip smegenys, rankiniu būdu suplanuodami kiekvieną leistiną būseną ir atitinkamą veiksmą. Dėl to susidaro standi, trapi struktūra, kuri puikiai veikia siaurose ribose, bet negali savarankiškai plėstis. Mokymosi pagrįsti agentai apverčia šią paradigmą, naudodami „iš apačios į viršų“ metodą, naudodami tikslo funkcijas arba atlygio signalus, kad naršytų duomenų erdvėse ir suformuluotų savo vidines sėkmės strategijas.
Neapibrėžtumo ir aplinkos sudėtingumo valdymas
Patekusi į chaotišką aplinką, tokią kaip autonominis vairavimas ar natūralios kalbos apdorojimas, taisyklėmis pagrįsta sistema patiria kombinatorinį sprogimą, nes neįmanoma parašyti pakankamai kodo eilučių, kad apimtų realybę. Mokymosi pagrindu sukurtos sistemos čia pranoksta save, nes ieško statistinių koreliacijų, o ne griežtų apribojimų. Jos grakščiai išlygina trūkstamus kintamuosius, numatydamos saugiausią ar logiškiausią kelią į priekį, remdamosi istoriniais modeliais.
Priežiūra, mastelio keitimas ir techninė skola
Didelės taisyklėmis pagrįstos architektūros palaikymas ilgainiui tampa programinės įrangos inžinerijos košmaru, nes pridėjus naują taisyklę, galima netyčia prieštarauti penkioms esamoms taisyklėms arba jas sugadinti. Ir atvirkščiai, mokymusi pagrįsto modelio mastelio keitimas reiškia įvairesnių duomenų tiekimą ir parametrų talpos didinimą. Nors tai sumažina rankinio kodavimo kliūtis, atsiranda kitokia techninės skolos forma, susijusi su duomenų srauto valdymu ir modelio dreifo stebėjimu.
Skaidrumas ir atitiktis reglamentams
Labai reguliuojamuose sektoriuose, tokiuose kaip medicininė diagnostika ar paskolų patvirtinimas, taisyklėmis pagrįstos sistemos išlieka labai vertinamos, nes jų vykdymo kelius galima aiškiai atspausdinti ir patikrinti, ar jie atitinka teisinius reikalavimus. Mokymosi pagrindu sukurtiems modeliams sunku užtikrinti absoliutų skaidrumą, nes jiems dažnai reikia antrinių paaiškinamų dirbtinio intelekto metodų, kad būtų galima apytiksliai nustatyti, kodėl buvo pateikta tam tikra prognozė. Šis kompromisas tarp neapdoroto našumo ir audituojamos atskaitomybės apibrėžia daugelį šiuolaikinių diegimo pasirinkimų.
Privalumai ir trūkumai
Taisyklėmis pagrįsti agentai
Privalumai
+Visiškai nuspėjami rezultatai
+Nuliniai duomenų reikalavimai
+Nepriekaištingas matematinis paaiškinamumas
+Mažos skaičiavimo išlaidos
Pasirinkta
−Ypač trapi architektūra
−Didelės rankinio kodavimo pastangos
−Negalima apibendrinti iki naujumo
−Nesėkmė sudėtingoje aplinkoje
Mokymosi pagrindu veikiantys agentai
Privalumai
+Išskirtiniai universalūs gebėjimai
+Klesti chaotiškoje aplinkoje
+Svarstyklės su skaičiavimo galia
+Atranda naujų sprendimų
Pasirinkta
−Neskaidrūs sprendimų priėmimo procesai
−Reikalauja didžiulių duomenų rinkinių
−Linkę į statistines haliucinacijas
−Didelės mokymo skaičiavimo išlaidos
Dažni klaidingi įsitikinimai
Mitas
Taisyklėmis pagrįstos sistemos yra pasenęs šlamštas, kuriam nėra vietos šiuolaikinėje dirbtinio intelekto inžinerijoje.
Realybė
Jie išlieka kritinės saugos infrastruktūros, finansinių operacijų atitikties ir automatizuotos atsiskaitymo programinės įrangos pagrindu. Daugelis šiuolaikinių įmonių juos sąmoningai naudoja kaip apsauginius barjerus, apsaugančius nuo nepastovių mašininio mokymosi modelių, kad būtų išvengta pavojingų ar nepastovių rezultatų.
Mitas
Mokymosi principais pagrįsti agentai automatiškai supranta savo užduočių prasmę.
Realybė
Šie agentai neturi tikro supratimo; vietoj to jie optimizuoja sudėtingas statistines koreliacijas ir daugiamačius geometrinius modelius. Jei įvesties duomenys pasikeičia taip, kad šios paslėptos koreliacijos nutrūksta, agento našumas greitai suprastėja.
Mitas
Sukurti taisyklėmis pagrįstą agentą visada yra greičiau, nes jam nereikia mokymo.
Realybė
Nors diegimas yra momentinis, rankinis ekspertų apklausos, kraštutinių atvejų nustatymo ir klaidų neturinčių loginių medžių konstravimo etapas gali užtrukti mėnesius intensyvios inžinerijos. Mokymosi modelis dažnai gali visiškai apeiti šį rankinio vertimo etapą, jei jau yra aukštos kokybės duomenų rinkiniai.
Mitas
Mokymusi pagrįstas modelis galiausiai taps 100 % tikslus, jei bus pakankamai duomenų.
Realybė
Statistiniai modeliai iš esmės yra tikimybiniai ir visada turi paklaidos ribą. Didėjanti duomenų įvairovė sumažina šią ribą, tačiau triukšmas, imties šališkumas ir pasiskirstymo pokyčiai reiškia, kad jie niekada negali garantuoti absoliutaus tikrumo, kurį suteikia deterministinis kodas.
Dažnai užduodami klausimai
Koks yra klasikinis kasdienis taisyklėmis pagrįsto agento pavyzdys?
Klasikinis pavyzdys – el. pašto šlamšto filtras, ieškantis konkrečių raktinių žodžių, tokių kaip „loterijos laimėjimas“ arba „banko pavedimas“. Jei laiške yra šios nurodytos frazės, sistema akimirksniu vykdo taisyklę, nukreipiančią jį į šlamšto aplanką. Nors jis labai efektyvus esant paprastoms grėsmėms, jis visiškai neveikia, jei sukčius pakeičia rašybą, kad apeitų tikslią raktinių žodžių atitikimo taisyklę.
Kaip mokymusi pagrįsti agentai elgiasi situacijose, su kuriomis niekada anksčiau nesusidūrė?
Jie remiasi matematine savybe, vadinama apibendrinimu, susiedami naują scenarijų su artimiausiais statistiniais modeliais, išmoktais mokymo metu. Užuot užstrigęs, modelis interpoliuoja veiksmą, kurio sėkmės tikimybė, jo skaičiavimais, yra didžiausia. Nors tai leidžia lanksčiai spręsti problemas, kartais gali kilti keistų, netikėtų klaidų, jei scenarijus yra pernelyg neįprastas.
Ar įmanoma sujungti taisyklėmis pagrįstą mechaniką su mokymosi algoritmais?
Taip, šis metodas žinomas kaip hibridinė dirbtinio intelekto sistema arba neurosimbolinė architektūra ir atspindi didžiulę tendenciją įmonių dirbtinio intelekto srityje. Šioje sistemoje mokymosi agentas gali laisvai tyrinėti, generuoti turinį arba optimizuoti planus. Tačiau jo rezultatai yra verčiami griežtu taisyklėmis pagrįstu filtru, kuris blokuoja netinkamus veiksmus, užtikrindamas saugumą ir atitiktį reikalavimams.
Kodėl finansų įstaigos vis dar pirmenybę teikia taisyklėmis pagrįstoms programoms sukčiavimo aptikimui?
Reguliavimo institucijos reikalauja, kad bankai aiškiai pagrįstų, kodėl konkreti sąskaita buvo pažymėta arba kodėl paskolos paraiška buvo atmesta. Taisyklėmis pagrįsta sistema pateikia aiškų, atsekamą kelią, rodantį, kad sąskaita suaktyvino konkretų slenkstį. Bandymas paaiškinti atmetimą remiantis abstrakčiais svoriais neuroniniame tinkle gali sukelti didelių teisinių ir atitikties pažeidžiamumų.
Kaip šių dviejų metodų priežiūros išlaidos palyginamos per ilgą laikotarpį?
Taisyklėmis pagrįsta sistema reikalauja didelių inžinerinio darbo sąnaudų, nes programuotojai turi nuolat rašyti ir testuoti kodo pataisymus, keičiantis verslo reikalavimams. Mokymosi sistema reikalauja mažiau rankinio kodavimo, tačiau jai reikalingos didelės nuolatinės investicijos į duomenų rinkimo srautus, debesų kompiuteriją periodiniam modelių perkvalifikavimui ir specialias MLOp komandas, kurios stebi duomenų dreifą.
Ar taisyklėmis pagrįstas agentas gali pasimokyti iš savo klaidų veikdamas realiu laiku?
Ne, grynai taisyklėmis pagrįstas agentas vykdymo metu yra visiškai statiškas ir negali modifikuoti savo logikos, remdamasis našumo stebėjimu. Jei taisyklė yra ydinga, agentas kartos tą pačią klaidą, kol žmogus inžinierius rankiniu būdu neredaguos šaltinio kodo. Jam visiškai trūksta autonominių savitaisymo ciklų, būdingų pastiprinimo mokymuisi.
Kas lemia, kad mokymusi pagrįstos sistemos yra tokios brangios skaičiavimo požiūriu?
Jie remiasi milijonais ar milijardais matematinių svorių, kuriuos reikia nuolat koreguoti taikant procesą, vadinamą atgaliniu propagavimu. Gradientų skaičiavimas dideliuose duomenų rinkiniuose reikalauja lygiagrečių apdorojimo architektūrų, randamų tik specializuotuose GPU. Tuo tarpu taisyklėmis pagrįstos sistemos tiesiog nuosekliai įvertina loginius teiginius, kurie gali veikti beveik bet kuriame pagrindiniame procesoriuje.
Kuris agento tipas geriau tinka vaizdo žaidimų NPC?
Tai priklauso nuo žaidimo stiliaus, tačiau dauguma komercinių žaidimų pirmenybę teikia taisyklėmis pagrįstoms baigtinių būsenų mašinoms. Žaidimų kūrėjams reikia, kad NPC elgtųsi nuspėjamai, kad galėtų papasakoti darnią istoriją ir pateikti subalansuotus iššūkius. Mokymusi pagrįstas NPC gali rasti nenumatytų spąstų arba elgtis chaotiškai, sugadindamas kuruojamą žaidėjo patirtį, nors jis naudojamas pažangiose simuliacijose, siekiant patikrinti žaidimo pusiausvyros ribas.
Nuosprendis
Rinkitės taisyklėmis pagrįstą agentą, kai projektuojate labai struktūrizuotus darbo eigą, kur klaidos yra netoleruotinos, logika aiški ir įstatymai reikalauja visiško audituojamumo. Rinkitės mokymusi pagrįstą agentą, kai dirbate su netvarkingais, nenuspėjamais ar nestruktūrizuotais duomenų laukais, kurių modeliai yra pernelyg subtilūs, kad žmonės programuotojai galėtų efektyviai užkoduoti.