Žmogaus atminties sistemos ir mašininio mokymosi atminties reprezentacijos
Šioje išsamioje analizėje sugretinami organinės, daugiasluoksnės žmogaus smegenų atminties struktūros su matematiniais, svoriais pagrįstais atvaizdavimais, naudojamais mašininio mokymosi architektūrose. Nors žmogaus atmintis dinamiškai filtruoja ir rekonstruoja patirtį per tarpusavyje susijusius biologinius tinklus, mašininis mokymasis remiasi fiksuotais vektoriniais įterpimais, gradientais ir silicio atmintimi, kad išsaugotų statistinius modelius.
Akcentai
Žmogaus atmintis remiasi specializuotais struktūriniais lygiais, o mašininis mokymasis sujungia žinias į vieningas svorio matricas.
Biologiniai tinklai naudoja konstruktyvią paiešką, o kompiuteriai atlieka tikslias matematines koordinačių užklausas.
Žmonės automatiškai geni nenaudingą informaciją, kad optimizuotų smegenų sveikatą, tačiau mašinoms reikia inžinerinių pataisymų, kad būtų išvengta duomenų sugadinimo.
Organinės smegenys veikia su tik dalimi energijos, kurios reikia šiuolaikiniams silicio duomenų centrams informacijai saugoti.
Kas yra Žmogaus atminties sistemos?
Biologinis sensorinių, trumpalaikių ir ilgalaikių struktūrų tinklas, kuris koduoja, saugo ir rekonstruoja patirtį.
Kognityvinę atmintį skirsto į atskirus operacinius sluoksnius: sensorinę atmintį, darbinę atmintį ir nuolatines ilgalaikes sistemas.
Pasitelkia sinapsinį plastiškumą ir ilgalaikę potenciaciją, kad fiziškai pakeistų ląstelių ryšius kurdamas atminties kelią.
Labai remiasi semantiniais tinklais, o tai reiškia, kad nauji duomenys automatiškai susiejami su esamomis žiniomis, remiantis konceptualia prasme.
Sukelia nesąmoningą atgaivinimą per aplinkos ženklus, emocines būsenas arba staigius cheminius pokyčius smegenyse.
Palaiko neįtikėtinai žemą medžiagų apykaitos energijos profilį, atlikdamas sudėtingus kognityvinius veiksmus su maždaug 20 vatų galia.
Kas yra Mašininio mokymosi atminties reprezentacijos?
Matematiniai modeliai, įskaitant svorių matricas, paslėptas būsenas ir vektorines erdves, kurie fiksuoja duomenų modelius.
Išmoktą informaciją saugo kaip statinius skaitinius parametrus tūkstančiuose giliai sluoksniuotų dirbtinių neuroninių jungčių.
Naudoja daugiamačius vektorinius tarpus, kad atvaizduotų ryšius tarp skirtingų duomenų taškų per geometrinį atstumą.
Atskiria mokymosi etapą nuo vykdymo etapo, įšaldant sistemos svorius po mokymo, nebent atliekamas aiškus tikslus derinimas.
Reikalinga speciali silicio įranga, kuri intensyvių modelio mokymo ciklų metu sunaudoja tūkstančius vatų elektros energijos.
Ilgalaikį kontekstą sprendžia per specializuotus mechanizmus, tokius kaip savikontrolės sluoksniai arba išorinės vektorinės duomenų bazės.
Palyginimo lentelė
Funkcija
Žmogaus atminties sistemos
Mašininio mokymosi atminties reprezentacijos
Struktūrinis branduolys
Biologiniai neuronai, sinapsės ir neurotransmiteriai
Monolitiniai parametrai, dėmesio langai arba vektorinės saugyklos priedai
Informacijos išgavimas
Asociatyvus, nuo užuominų priklausomas ir labai rekonstruktyvus
Algoritminės matricos skaliarinės sandaugos ir matematinės paieškos
Mokymosi kaina
Labai maža medžiagų apykaita; nuolatinis mokymasis fone
Didelės skaičiavimo išlaidos, reikalaujančios GPU klasterių
Duomenų keitimas
Labai kintamas; šiek tiek keičiasi su kiekvienu atšaukimu
Nekintama, nebent atgalinio platinimo komandos pakeičia svorius
Naujų įvesčių tvarkymas
Sklandžiai integruojasi į esamus asociatyvius tinklus
Rizikuoja katastrofiškai pamiršti be atskiro tikslinimo
Konteksto ribos
Begalinis, bet miglotas; apribotas dėmesio ir dėmesio
Griežtai apribota užkoduotų žetonų konteksto langų
Išsamus palyginimas
Architektūrinis projektavimas ir sluoksniavimas
Žmogaus pažinimo funkcijos segmentuoja duomenis per kelias specializuotas saugyklas, pradedant trumpalaikiu sensoriniu buferiu, kuris filtruoja aplinkos baltąjį triukšmą. Vertingi duomenys perkeliami į darbo atmintį aktyviam manipuliavimui, prieš tai, kai hipokampas juos sujungia į ilgalaikę saugyklą. Mašininio mokymosi modeliuose retai pasitaiko natūralus struktūrinis suskirstymas. Vietoj to, tradiciniai neuroniniai tinklai suspaudžia visus mokymo duomenis tiesiai į vieną didžiulę svorių matricą, o tai reiškia, kad modelis turi reprezentuoti plačias sąvokas ir mažas formatavimo taisykles tame pačiame skaičiavimo sluoksnyje.
Kodavimas ir žinių geometrija
Kai žmogus susiduria su nauja sąvoka, smegenys ją sujungia į asociatyvų tinklą, susiedamos objektą su jo pavadinimu, garsu ir emocine reikšme. Mašininio mokymosi modeliai tai konceptualiai atkartoja, tačiau įgyvendina per daugiamačius vektorinius įterpimus. Žodžius ar vaizdus braižydamas kaip koordinates geometrinėje erdvėje, modelis sukuria kraštovaizdį, kuriame matematiškai susijusios idėjos yra arti viena kitos. Tačiau, nors žmonių asociacijos yra giliai įsišaknijusios gyvenimiškoje realybėje ir subjektyviame kontekste, mašininiai įterpimai atspindi šaltus, statistinius atstumus, gautus vien iš teksto bendro pasirodymo ar pikselių išdėstymo.
Užmaršties ir optimizavimo evoliucija
Užmiršimas yra labai svarbi žmogaus smegenų optimizavimo priemonė, leidžianti joms atmesti nereikšmingus duomenis, pavyzdžiui, ką valgėte pietums prieš tris savaites, kad galėtų teikti pirmenybę išgyvenimo modeliams. Šis organinis genėjimas yra nuolatinis ir sklandus. Mašininiam mokymuisi sunku sklandžiai rasti šią pusiausvyrą. Kai modelis mokomas su visiškai nauju duomenų rinkiniu, gaunami gradiento atnaujinimai dažnai visiškai perrašo ankstesnes svorio vertes. Tai sukuria katastrofiško užmiršimo iššūkį, reikalaujantį, kad inžinieriai įdiegtų sudėtingus derinimo metodus, siekdami užtikrinti, kad sistema nesunaikintų savo senojo intelekto, bandydama įgyti naujų įgūdžių.
Energijos suvartojimas ir mastelio keitimas
Biologinės smegenys yra efektyvumo šedevras, valdantis didžiules atminties ir abstrakčių minčių saugyklas, tuo pačiu sunaudodamas mažiau energijos nei standartinė buitinė lemputė. Jos visą gyvenimą plečia savo žinių bazę, nereikalaudamos struktūrinių atnaujinimų. Mašininio mokymosi reprezentacijoms reikia milžiniškų pramoninių išteklių. Modelio apmokymas išlaikyti didelę pasaulio žinių reprezentaciją reikalauja didžiulių duomenų centrų, sudėtingų vandens aušinimo sistemų ir milijonų dolerių elektros energijos, todėl skaitmeninis atminties reprezentavimas yra neįtikėtinai daug išteklių reikalaujanti užduotis, palyginti su anglies pagrindu veikiančiomis alternatyvomis.
Privalumai ir trūkumai
Žmogaus atminties sistemos
Privalumai
+Neįtikėtinas energijos vartojimo efektyvumas
+Sklandus tarpmodalinis susiejimas
+Dinaminė konceptuali abstrakcija
+Automatinis fono optimizavimas
Pasirinkta
−Linkęs į pasakojimo iškraipymą
−Griežtos fizinės paieškos kliūtys
−Pažeidžiami degeneracinėms ligoms
−Ribotas neapdoroto skaičiavimo greitis
Mašininio mokymosi atminties reprezentacijos
Privalumai
+Nepriekaištingas matematinis pakartojimas
+Atsparus emociniams iškraipymams
+Žaibiškai greita parametrų paieška
+Lengvai kopijuojama visoje aparatinėje įrangoje
Pasirinkta
−Linkęs į katastrofišką užmarštį
−Dideli elektros energijos poreikiai
−Didelės aparatinės įrangos infrastruktūros išlaidos
−Sunkumai su duomenimis, kurie nėra platinami
Dažni klaidingi įsitikinimai
Mitas
Dirbtiniai neuroniniai tinklai saugo atmintį lygiai taip pat, kaip ir biologiniai neuronų tinklai žmogaus smegenyse.
Realybė
Nors laisvai įkvėpti biologinių struktūrų, mašininio mokymosi mazgai yra supaprastintos matematinės funkcijos, kurios daugina įvestis iš skaitinių svorių. Jiems trūksta biocheminio sudėtingumo, neurotransmiterių įvairovės ir architektūrinės įvairovės, būdingos gyviesiems smegenų audiniams.
Mitas
Dideli kalbų modeliai gali amžinai prisiminti jūsų pokalbį savo pagrindiniame tinkle.
Realybė
Dirbtinio intelekto modelis neatnaujina savo pagrindinių svorių atsitiktinio pokalbio metu. Jo trumpalaikis išlaikymas visiškai priklauso nuo kontekstinio lango, kuris veikia kaip aktyvi iškarpinė. Kai pokalbio sesija užsidaro arba pasiekiama žetonų riba, modelis visiškai pamiršta šią informaciją, nebent ji būtų išsaugota išorinėje duomenų bazėje.
Mitas
Žmogaus atmintis praeities įvykius išsaugo kaip atskirus, nekintamus skaitmeninius filmo klipus.
Realybė
Biologinė atmintis yra visiškai rekonstrukcinė, o ne paremta saugojimu. Kiekvieną kartą, kai žmogus prisimena įvykį, jo smegenys supina fragmentus su dabartinėmis emocijomis ir įsitikinimais, o tai reiškia, kad prisiminimas šiek tiek pasikeičia kiekvieną kartą, kai prie jo prisimenama.
Mitas
Dirbtinio intelekto modelis su milijardais parametrų turi didesnę atminties talpą nei suaugęs žmogus.
Realybė
Žmogaus smegenų atminties kiekybinis įvertinimas naudojant skaitmeninius terminus yra iš esmės netikslus. Nors dirbtinis intelektas gali pažodžiui saugoti didžiulius kiekius neapdoroto teksto, žmogaus smegenys sudaro trilijonus sinapsinių jungčių, lengvai valdydamos abstrakčias metaforas, motorinius įgūdžius ir jutiminius duomenis, kurių kompiuteriai negali lengvai apskaičiuoti.
Dažnai užduodami klausimai
Kuo skiriasi žmonių darbinė atmintis ir dirbtinio intelekto kontekstinis langas?
Žmogaus darbinė atmintis yra labai dinamiška, bet biologiškai ribota – vienu metu galinti aktyviai sutelkti dėmesį tik apie keturis–septynis elementus, nors gilius semantinius ryšius ji apdoroja be jokių pastangų. Dirbtinio intelekto konteksto langas yra fiksuota matematinė erdvė, matuojama žetonais, galinti vienu metu apdoroti šimtus teksto puslapių. Tačiau dirbtinis intelektas šią informaciją apdoroja vien statistiniais dėmesio svoriais, neturėdamas sąmoningo dėmesio, emocinio vertinimo ir protinių manipuliacijų, kurias žmonės taiko savo mintims.
Kaip katastrofiškas užmiršimas įvyksta mašininio mokymosi srityje, bet ne sveikų žmonių smegenyse?
Katastrofiškas užmiršimas įvyksta todėl, kad mašininio mokymosi atnaujinimai apima bendrų svorių matricų modifikavimą visame pasaulyje. Kai nauji duomenys priverčia atgalinę sklaidą perskaičiuoti tuos svorius, senesnės konfigūracijos gali būti visiškai perrašytos. Žmogaus smegenys to išvengia, nes naudoja dvigubos atminties sistemą. Hipokampas greitai įsisavina naujas detales, netrikdydamas neokortekso, lėtai integruodamas tas pamokas laikui bėgant miego metu per procesą, vadinamą konsolidacija.
Ar išorinė vektorinė duomenų bazė gali būti laikoma tikru žmogaus ilgalaikės atminties atitikmeniu?
Ne, vektorinė duomenų bazė veikia kaip pažangi, labai efektyvi paieškos indeksas. Ji paverčia duomenis statinėmis skaitinėmis koordinatėmis ir, gavusi dirbtinio intelekto paraginimą, naudoja matematinius veiksmus, kad surastų atitinkamus įrašus. Nors ji praplečia modelio veikimo aprėptį, jai trūksta gyvo, tarpusavyje susijusio žmogaus ilgalaikės atminties pobūdžio, kuri nuolat keičiasi, jungiasi prie jutiminių dirgiklių ir atnaujinama pagal asmens tapatybę.
Kodėl mašininio mokymosi modelio mokymui reikia daug daugiau duomenų nei žmogaus vaiko mokymui?
Žmonių vaikai turi milijonus metų evoliucinės programos, tiesiogiai įdiegtos į jų biologinę architektūrą, leidžiančią jiems mokytis iš pavienių pavyzdžių per procesą, vadinamą mokymusi keliais bandymais. Jie taip pat sąveikauja su fiziniu pasauliu naudodami kelis pojūčius vienu metu. Mašininio mokymosi modeliai prasideda nuo visiškai tuščių matematinių drobių, kurioms reikia milijonų pasikartojančių duomenų įvesčių, kad būtų galima nuo nulio atrasti pagrindinius statistinius ryšius.
Kokį vaidmenį emocijos vaidina žmogaus atminties išlaikyme, palyginti su dirbtinio intelekto atminties praradimo funkcija?
Emocijos žmonėms veikia kaip vidinis prioritetų nustatymo variklis. Kai įvykis sukelia stiprią emocinę reakciją, streso hormonai giliai užantspauduoja tą epizodinę atmintį smegenyse ilgalaikiam išlikimui. Dirbtinio intelekto nuostolių funkcija yra matematinis skaičiavimas, kuris matuoja klaidų dažnį tarp modelio išvesties ir tikslinių duomenų. Jis naudoja šį šaltą skaitinį dispersiją svoriams koreguoti mokymo metu, visiškai atsietai nuo bet kokios subjektyvios vertės ar išgyvenimo instinkto.
Kuo skiriasi semantinė atmintis tarp žmogaus smegenų ir dirbtinio neuroninio tinklo?
Žmogaus semantinė atmintis yra struktūrizuotas pasaulio faktų, kultūrinių sąvokų ir asmeninio supratimo tinklas, sukurtas per gyvenimišką patirtį ir socialinę sąveiką. Dirbtinio intelekto semantinė reprezentacija generuojama apskaičiuojant erdvinius atstumus įterptojoje erdvėje. Modelis žino, kad tam tikros sąvokos koreliuoja pagal mokymo tekste esančius modelius, tačiau jam trūksta realaus pasaulio patirties, reikalingos norint iš tikrųjų suprasti, ką tos sąvokos reiškia.
Ar miegas gali pagerinti mašininio mokymosi atminties reprezentacijas taip, kaip jis įtvirtina žmogaus atmintį?
Kompiuterių mokslininkai sukūrė mokymo metodus, vadinamus miego pakartojimo algoritmais, tiesiogiai įkvėptus biologinio miego. Šių ciklų metu neuroninis tinklas apdoroja imituotus duomenis iš ankstesnio mokymo, kad sustiprintų senus ryšius ir prisitaikytų prie naujų įvesties duomenų. Nors tai padeda sumažinti katastrofišką užmiršimą, tai išlieka užprogramuotu naudingumo scenarijumi, o ne sudėtingu, atkuriamuoju biologiniu procesu, kurį žmogaus smegenys patiria kiekvieną naktį.
Ar mašininio mokymosi architektūros kada nors visiškai atspindės žmogaus atminties sistemas?
Nors inžinieriai projektuoja sudėtingas, modulines dirbtinio intelekto sistemas, kurios apjungia trumpalaikius dėmesio apvalkalus, ilgalaikes vektorių saugyklas ir epizodinius registravimo buferius, jos vis dar iš esmės skiriasi nuo žmogaus biologijos. Tikroji konvergencija reikštų perėjimą nuo statinių silicio architektūrų prie adaptyvios neuromorfinės įrangos, kuri galėtų fiziškai perjungti savo ryšius realiuoju laiku, tuo pačiu metu veikiant vieningos sąmoningos sąmonės sąlygomis.
Nuosprendis
Rinkitės žmogaus kognityvinius modelius, kai dirbate su labai dinamiškomis, nestruktūrizuotomis aplinkomis, kurioms reikalingas adaptyvus mokymasis iš negausių duomenų taškų be didelių energijos sąnaudų. Kreipkitės į mašininio mokymosi atminties reprezentacijas, kai jūsų užduočiai reikalingas absoliutus matematinis tikslumas, greitas milijonų dokumentų apdorojimas ir sistema, atspari organiniam atminties irimui.