See põhjalik analüüs vastandab tehisnärvivõrgu treenimise mehaanikat inimese kognitiivse arenguga. Kui süvaõpe tugineb statistiliste mustrite leidmiseks tagasilevitamisele, massiivsetele andmekogumitele ja miljarditele iteratiivsetele korrigeerimistele, siis inimese õppimine kasutab konteksti, füüsilise kogemuse ja kontseptuaalse abstraktsiooni poolt juhitud ülitõhusat ja vähese andmemahuga sünaptilist plastilisust.
Esiletused
Tehisvõrgud nõuavad miljoneid matemaatilisi iteratsioone, samas kui inimesed toetuvad kontekstilisele abstraktsioonile.
Tagasilevimine nõuab globaalset koordineerimist, samas kui bioloogilised ajud kohanevad lokaliseeritud sünaptiliste uuenduste kaudu.
Tehisintellekti mudelid näevad vaeva katastroofilise unustamisega – probleemiga, millest inimesed une ja keskendumisvõime konsolideerimise kaudu mööda hiilivad.
Bioloogilised süsteemid toimivad murdosa energiast, mida vajavad kõrgjõudlusega andmetöötlusklastrid.
Mis on Neuraalvõrgu koolitus?
Kunstlike raskuste matemaatiline optimeerimine gradiendi laskumise ja massiivsete andmekogumite abil veafunktsiooni minimeerimiseks.
Tugineb peamiselt tagasilevitamisele, et levitada veasignaale kihtide vahel tagasi.
Lihtsate klassifitseerimisülesannete omandamiseks on vaja tuhandeid kuni miljoneid selgesõnalisi näiteid.
Kannatab katastroofilise unustamise all, kui talle tutvustatakse uusi, omavahel mitteseotud ülesandeid ilma ümberõppeta.
Toimib standardse järeldusfaasi ajal staatiliste, fikseeritud arhitektuuride kaudu.
Kulutab suure täpsuse saavutamiseks märkimisväärselt elektri- ja arvutusenergiat.
Mis on Inimese õppeprotsessid?
Närviteede bioloogiline kohanemine, mida juhivad sensoorne kogemus, uudishimu ja kontekstuaalne kontseptualiseerimine.
Kasutab sünaptilist plastilisust, võimaldades ajul reaalajas pidevalt ümber programmeerida.
Võimalik õppida null- või ühekordselt, omandades uusi kontseptsioone ühekordse kokkupuutega.
Säilitab pingutuseta ajaloolised teadmiste raamistikud, integreerides samal ajal täiesti uusi oskusi.
Töötab uskumatult tõhusa bioloogilise eelarvega, mille võimsus on umbes 20 vatti.
Võrdlustabel
Funktsioon
Neuraalvõrgu koolitus
Inimese õppeprotsessid
Esmane mehhanism
Matemaatiline gradiendi laskumine ja tagasilevi
Bioloogiline sünaptiline plastilisus ja neurotransmitterite modulatsioon
Andmete tõhusus
Äärmiselt madal; nõuab tohutuid arvutusandmestikke
Äärmiselt kõrge; referentseerib reegleid väheste näidete põhjal
Energiatarve
Megavatid suuremahuliseks klastrite koolitamiseks
Ligikaudu 20 vatti pidevat ainevahetusvõimsust
Pidev õppimine
Kehv; kalduvus eelmised ülesanded täielikult unustada
Suurepärane; lisab uued oskused vanadele raamistikele
Õppimissuund
Rangelt eesmärgile orienteeritud kahjumifunktsiooni minimeerimise kaudu
Uurimuslik, iseseisev ja kontekstitundlik
Riistvara ja tarkvara jaotus
Koodi ja füüsiliste ränikiipide eristamine
Lahutamatu; füüsiline arhitektuur on tarkvara
Üksikasjalik võrdlus
Kohanemise mehhanism
Tehisvõrgud õpivad, kohandades numbrilisi kaalusid jäiga maatriksi ulatuses. Tagasilevitamise ajal arvutab keskne algoritm väljundi täpse vea ja edastab arvutuspõhised parandused süsteemis tagasi. Inimese ajud seevastu kasutavad lokaliseeritud sünaptilist plastilisust. Füüsilised rajad tugevnevad või nõrgenevad rakuliste piikide ajastuse põhjal, võimaldades bioloogilisel süsteemil orgaaniliselt kohaneda ilma globaalse peaalgoritmita, mis neid kohandusi haldaks.
Andmed ja arvutuslik efektiivsus
Jalgratta äratundmiseks peab tehisvõrk töötlema tuhandeid erinevaid pilte, mis sisaldavad erinevaid nurki, valgustust ja tausta, et kaardistada statistilisi piire. Inimlaps peab jalgratast tavaliselt nägema vaid üks või kaks korda. Inimese kognitiivne protsess kasutab olemasolevaid vaimseid raamistikke, intuitiivset füüsikat ja struktuurianaloogiaid, samas kui tehisvõrk alustab sisuliselt iga kord, kui uus arhitektuur initsialiseeritakse, juhusliku müra tühjalt lehelt.
Üldistamine ja ülekantav õpe
Kunstlikud süsteemid on väljaspool oma kitsaid treeningjaotusi kurikuulsalt haprad. Mudel, mis on treenitud meisterlikult konkreetset videomängu mängima, kukub täielikult läbi, kui taustavärv veidi muutub, välja arvatud juhul, kui seda sihipäraselt peenhäälestatakse. Inimesed on suurepärased ülekandeõppes, rakendades sujuvalt ühes valdkonnas õpitud abstraktseid tasakaalu, hoo ja strateegia kontseptsioone täiesti võõrastes stsenaariumides.
Mälu säilitamine ja kohanemisvõime
Kui tehisnärvivõrk on sunnitud õppima täiesti uut ülesannet, kirjutavad värsked gradiendiuuendused sageli üle eelmiste ülesannete jaoks määratud numbrilised kaalud, põhjustades katastroofilise unustamise. Inimajud saavad elukestva õppega elegantselt hakkama. Me magame, et koondada igapäevased kogemused pikaajalisteks struktuurideks, tagades, et autojuhtimise õppimine ei halvendaks meie võimet kirjutada, rääkida ega tuttavaid nägusid ära tunda.
Plussid ja miinused
Neuraalvõrgu koolitus
Eelised
+Töötleb miljoneid paralleelseid sisendeid
+Veatu matemaatiline järjepidevus
+Lihtsalt dubleeritav ja skaleeritav
+Tuvastab hüpermõõtmelised mustrid
Kinnitatud
−Massiivsed andmenõuded
−Suur energiatarve
−Kalduvus katastroofilisele unustamisele
−Puudub loomupärane terve mõistus
Inimese õppeprotsessid
Eelised
+Uskumatu andmetõhusus
+Meisterlik abstraktne üldistus
+Elukestev mälu integreerimine
+Ülimadalad energiatarbed
Kinnitatud
−Aeglane, järjestikune sissevõtmine
−Kalduvus kognitiivsele väsimusele
−Teadmisi ei saa koheselt kopeerida
−Emotsionaalsete seisundite poolt kallutatud
Tavalised eksiarvamused
Müüt
Kunstlikud närvivõrgud toimivad täpselt nagu bioloogiline inimese aju.
Tõelisus
Mõiste „närvivõrk” on suuresti metafoor. Kui varased disainilahendused olid lõdvalt inspireeritud bioloogiast, siis tänapäevane süvaõpe tugineb jäigale maatriksarvutusele ja globaalsetele optimeerimisalgoritmidele, mis ei näe sugugi välja nagu elava ajukoe segane, keemiline ja asünkroonne mehaanika.
Müüt
Süvaõppe mudelitel on pärast treenimist inimlaadne arusaam.
Tõelisus
Tehisintellekti mudelid on suurepärased sisendite ja väljundite vaheliste statistiliste korrelatsioonide kaardistamisel, kuid neil puudub täielikult semantiline arusaam. Mudel suudab genereerida veest veatuid kirjeldusi ilma igasuguse niiskuse, janu või füüsilise olemasolu mõisteta.
Müüt
Inimese ajul on fikseeritud salvestusmaht, just nagu arvuti mälupangal.
Tõelisus
Inimese mälu ei tööta nagu digitaalne kõvaketas, mis täitub gigabaitidega andmeid. Bioloogiline mälu on konstruktiivne ja assotsiatiivne; uute kontseptsioonide õppimine loob tegelikult rohkem konksusid, mis võivad tulevase teabe hankimist lihtsamaks muuta, selle asemel, et füüsiline ruum otsa saaks.
Müüt
Tehisintellekti võrgu suuruse suurendamine annab sellele automaatselt inimtasemel arutluskäigu.
Tõelisus
Parameetrite skaleerimine parandab mustrite sobitamist ja annab tulemuseks keeruka matkimise, kuid see ei lahenda põhilisi arhitektuurilisi piiranguid. Pelgalt suurus ei anna tehisintellektile sisemist motivatsiooni, füüsilist kehastust ega võimet maailma kohta juhuslikult arutleda.
Sageli küsitud küsimused
Mis täpselt on tagasilevi ja kas inimese ajud seda kasutavad?
Tagasilevi on matemaatiline tehnika, mida kasutatakse veafunktsiooni gradiendi arvutamiseks närvivõrgu kaalude suhtes. See saadab veasignaale tagasi läbi mudeli kihtide, et ühendusi kohandada. Puuduvad lõplikud tõendid selle kohta, et inimese ajud kasutavad tagasilevi. Bioloogilised neuronid suhtlevad sünapside kaudu edasi liikuvate elektriliste piikide ja keemiliste signaalide kaudu, kohandudes lokaalselt ajaliste mustrite kaudu, selle asemel, et saada globaalseid matemaatilisi korrektsioone tsentraliseeritud algoritmilt.
Miks vajavad arvutid miljoneid näiteid, et õppida seda, mida laps ühest näitest õpib?
Laps sünnib väljaarendatud bioloogilise arhitektuuriga, mis on miljonite aastate jooksul optimiseeritud ellujäämiseks füüsilises universumis. Lastel on kaasasündinud arusaam intuitiivsest füüsikast, objektide püsivusest ning põhjusest ja tagajärjest. Kui laps näeb looma esimest korda, ühendab ta selle visuaalse pildi massiivse, eelnevalt olemasoleva raamistikuga. Kunstlikud mudelid alustavad oma koolitust tühja lehe ja juhuslike numbritega, mis tähendab, et nad peavad joonte, geomeetria, valgustuse ja kohaloleku põhimõisted täiesti nullist tuletama.
Kas tehisnärvivõrk saab treeningu ajal uudishimu kogeda?
Standardsed närvivõrgud ei koge emotsioone ega uudishimu. Arvutiteadlased suudavad aga simuleerida dünaamikat, mida tuntakse sisemise uudishimuna tugevdusõppe agentides. See saavutatakse matemaatilise tasu lisamisega kaotusfunktsioonile iga kord, kui agent puutub kokku täiesti uute olekute või ettearvamatute andmetega. Kuigi see soodustab uurimist ja jäljendab uudishimulikku käitumist, jääb see pigem arvutatud matemaatiliseks optimeerimiseks kui emotsionaalseks või psühholoogiliseks ajendiks.
Mis on katastroofiline unustamine ja miks inimesed selle all ei kannata?
Katastroofiline unustamine tekib siis, kui tehisvõrku treenitakse uue ülesande jaoks ja sellest tulenevad matemaatilised uuendused kirjutavad üle eelmiste ülesannete ajal õpitud kaalukonfiguratsioonid, muutes vana oskuse kasutuks. Inimesed väldivad seda, sest meie ajud kasutavad keerukat segu täiendavatest õppesüsteemidest. Hipokampus jäädvustab kiiresti uued igapäevased kogemused, samas kui neokorteks integreerib selle teabe une ajal aeglaselt stabiilsetesse pikaajalistesse raamistikesse, kaitstes põhiteadmisi ootamatute häirete eest.
Kuidas on tehisintellekti abil treenimise energiatõhusus võrreldav inimese ajuga?
Energiatõhususe erinevus on tohutu. Piirivalve süvaõppe mudeli treenimiseks on vaja lao suuruseid andmekeskusi, mis tarbivad megavatte energiat, sageli kulutades piisavalt elektrit tuhandete kodude nädalate pikkuseks tööks. Inimese aju haldab keerulist keelesünteesi, füüsilist koordinatsiooni, sensoorset töötlemist ja abstraktset mõtlemist samaaegselt, töötades samal ajal vaid 20-vatise bioloogilise energiaga, mida toidab täielikult põhiline kalorite tarbimine.
Milline roll on füüsilisel kehastusel inimese õppimisel võrreldes tehisintellekti treenimisega?
Kehastumine on inimese kognitiivse arengu nurgakivi. Inimesed õpivad füüsiliselt ümbritseva keskkonnaga suheldes, esemeid manipuleerides, gravitatsiooni tundes ja liikumise tagajärgi kogedes. See pidev tagasisideahel loob kindla ja maandatud arusaama reaalsusest. Enamik tehisintellekti mudeleid on täiesti kehatud, töötledes staatilisi digitaalseid märke või piksleid isoleeritult ilma igasuguste füüsiliste panuste, ruumilise kohaloleku või reaalse maailma tugipunktideta.
Kas tehisintellekti mudelid saavad pidevalt õppida samal ajal, kui tarbijad neid kasutavad?
Standardsetes tootmisjuurutustes külmutatakse tehisintellekti mudelid pärast treeningfaasi lõppu. Kommertsmudeliga suheldes on see järeldusrežiimis, mis tähendab, et selle sisemised kaalud ei muutu teie päringute põhjal. Uutest andmetest õppimiseks peavad insenerid koguma kasutajalogisid, koondama need suurteks partiideks ja käivitama eraldi ja kuluka ümberõppetsükli. Inimesed seevastu õpivad dünaamiliselt ja värskendavad oma vaimseid mudeleid pidevalt iga vestluse ja kogemusega.
Kas neuromorfne andmetöötlus kaotab lõhe tehisintellekti ja inimese õppimise vahel?
Neuromorfne andmetöötlus püüab seda lõhet ületada, disainides riistvara, mis jäljendab bioloogiliste neuronite ja sünapside füüsilist struktuuri. Traditsiooniliste protsessorite asemel, mis pidevalt andmeid mälupankade ja protsessorite vahel liigutavad, töötlevad neuromorfsed kiibid teavet otse kiibil olevate hõredate, asünkroonsete elektriimpulsside abil. See lähenemisviis võiks oluliselt vähendada energiatarbimist ja võimaldada tulevastes tehisintellekti süsteemides lokaliseeritud, aju-sarnaseid õppemehhanisme.
Otsus
Neuraalvõrkude treenimine on võrratu, kui on vaja analüüsida tohutul hulgal struktureeritud andmeid, et leida peeneid, kõrgmõõtmelisi mustreid, mis inimsilmale silmale jäävad. Siiski jääb inimese õppimine adaptiivse ja loomingulise probleemide lahendamise kuldstandardiks ettearvamatutes keskkondades, kus andmeid on vähe ja kontekst on kõik.