Signali za strojno učenje v primerjavi s podatki, ki niso v distribuciji
Učni signali so označeni primeri in mehanizmi povratnih informacij, ki učijo modele strojnega učenja med razvojem, medtem ko se podatki izven distribucije nanašajo na vhodne podatke, ki ne spadajo v vzorce, s katerimi se je model srečal med učenjem. Razumevanje obeh konceptov je bistvenega pomena za gradnjo sistemov umetne inteligence, ki se učinkovito učijo in zanesljivo posplošujejo na scenarije iz resničnega sveta.
Poudarki
Učni signali oblikujejo, kaj se model nauči; podatki OOD razkrivajo, česa se ni naučil.
Signali za usposabljanje delujejo med razvojem, medtem ko se izzivi OOD pojavijo med uvajanjem.
Raznoliki učni signali zmanjšujejo, vendar nikoli ne odpravljajo napak OOD v produkcijskih sistemih.
Robustna umetna inteligenca zahteva tako močne podatke za učenje kot tudi eksplicitne mehanizme za zaznavanje izven distribucije.
Kaj je Signali za strojno učenje?
Označeni podatki in mehanizmi povratnih informacij, ki se uporabljajo za učenje modelov, kako med procesom učenja natančno napovedovati.
Učni signali vključujejo označene primere, funkcije nagrajevanja in vrednosti izgub, ki vodijo posodobitve parametrov modela skozi gradientni spust.
Nadzorovano učenje se opira na vhodno-izhodne pare, kjer človeški komentatorji zagotavljajo oznake resnice za vsak primerek učenja.
Učenje z okrepitvijo uporablja signale nagrajevanja iz okolja namesto eksplicitnih oznak za oblikovanje vedenja agentov skozi čas.
Samonadzorovano učenje generira lasten nadzorni signal s napovedovanjem maskiranih ali transformiranih delov vhodnih podatkov.
Kakovost in raznolikost učnih signalov neposredno določata, kako dobro model opravlja naloge, ki jih še ni videl.
Kaj je Podatki o izstopu iz distribucije?
Vhodni vzorci, ki se statistično razlikujejo od podatkov, na katerih je bil model usposobljen, kar pogosto povzroča nezanesljive ali nepredvidljive napovedi.
Zaznavanje izven porazdelitve identificira vhodne podatke, ki ne spadajo v porazdelitev učenja, da prepreči, da bi modeli dajali preveč samozavestne napačne napovedi.
Do premika porazdelitve pride, ko se razmerje med vhodnimi in izhodnimi podatki spremeni med učnim in uvajalnim okoljem.
Pogosti scenariji OOD vključujejo primere nasprotovanja, nove razrede, poškodovane vhodne podatke in podatke iz različnih geografskih ali demografskih populacij.
Modeli, usposobljeni na ozkih naborih podatkov, pogosto dramatično odpovejo, ko so uporabljeni v odprtem svetu, kjer je raznolikost vhodnih podatkov veliko večja.
Tehnike, kot so ocenjevanje gostote, točkovanje na podlagi energije in nesoglasje med ansambli, pomagajo sistemom prepoznati, kdaj naletijo na neznane vhodne podatke.
Primerjalna tabela
Funkcija
Signali za strojno učenje
Podatki o izstopu iz distribucije
Vloga v cevovodu strojnega učenja
Temelji modelnega učenja
Izziv med uvajanjem
Ko je pomembno
Med fazo usposabljanja
Med sklepanjem in uvajanjem
Primarni namen
Naučite modele pravilnega vedenja
Prepoznajte omejitve in napake modela
Vir
Urejeni nabori podatkov in povratne zanke
Vhodni podatki iz resničnega sveta zunaj obsega usposabljanja
Učni signali obstajajo zato, da model naučijo, kako izgleda pravilno vedenje. Pojavljajo se v različnih oblikah, od označenih slik pri nadzorovanem učenju do nagradnih točk pri učenju z okrepitvijo, in neposredno oblikujejo uteži, ki jih razvije nevronska mreža. Podatki izven distribucije služijo nasprotnemu namenu med uvajanjem: razkrivajo meje tega, kar se je model naučil. Ko sistem naleti na vhode izven distribucije, razkrije vrzeli v svojem učenju in preizkusi, ali lahko model prepozna lastne omejitve.
Časovna usklajenost v življenjskem ciklu strojnega učenja
Signali za učenje so aktivni med razvojno fazo, kjer vsaka serija podatkov prispeva k posodabljanju parametrov modela. Ko se učenje zaključi, ti signali ne vplivajo več neposredno na model. Podatki izven distribucije postanejo pomembni v času sklepanja, ko se nameščeni modeli soočajo z nepredvidljivimi vhodnimi podatki iz resničnega sveta. Prehod med tema fazama je tista, kjer mnogi sistemi umetne inteligence odpovejo, saj modeli, optimizirani za porazdelitve učenja, pogosto doživijo težave, ko se pogoji spremenijo.
Upoštevanje kakovosti in raznolikosti
Visokokakovostni učni signali zahtevajo skrbno kuriranje, natančno označevanje in uravnoteženo predstavitev med kategorijami. Slaba kakovost signala vodi do modelov, ki si zapomnijo šum, namesto da bi se naučili uporabnih vzorcev. Pri scenarijih izven porazdelitve je izziv drugačen: tudi odlični učni podatki ne morejo pokriti vseh možnih vhodnih podatkov, s katerimi se model lahko sreča. Zato raziskovalci poudarjajo tako širše učne porazdelitve kot eksplicitne mehanizme zaznavanja izven porazdelitvenih elementov (OOD), namesto da bi se zanašali samo na učne podatke.
Razmerje do robustnosti modela
Moč učnih signalov določa osnovno kompetenco modela, medtem ko izpostavljenost spremembam porazdelitve preizkuša, ali ta kompetenca vzdrži. Model, usposobljen na raznolikih, dobro označenih podatkih, se običajno bolje posplošuje na scenarije izven dosega nepričakovanih objektov (OOD), čeprav nobena količina usposabljanja ne zagotavlja popolne robustnosti. Sodobni pristopi združujejo bogate učne signale z ločenimi sistemi za zaznavanje OOD, kar ustvarja večplastno obrambo pred nepričakovanimi vhodi.
Praktične posledice za razvoj umetne inteligence
Inženirji, ki gradijo produkcijske sisteme umetne inteligence, morajo hkrati obravnavati oba koncepta. Močni signali za usposabljanje zmanjšujejo pogostost napak pri izdelavi izdelkov na prostem (OOD), vendar okolja za uvajanje vedno vsebujejo presenečenja, ki jih usposabljanje ne more predvideti. Ta dvojna osredotočenost je spodbudila naložbe v tehnike, kot so dopolnjevanje podatkov, generiranje sintetičnih podatkov in kvantifikacija negotovosti. Ekipe, ki ignorirajo katero koli stran, tvegajo, da bodo zgradile sisteme, ki se dobro obnesejo pri testiranju, vendar nepredvidljivo odpovedo v produkciji.
Prednosti in slabosti
Signali za strojno učenje
Prednosti
+Neposredno učno vodenje
+Prilagodljivo glede na količino podatkov
+Omogoča nadzorovano učenje
+Podpira optimizacijo nagrajevanja
Vse
−Drago za označevanje
−Omejeno s pokritostjo podatkov
−Nevarnost širjenja pristranskosti
−Kakovost se razlikuje glede na vir
Podatki o izstopu iz distribucije
Prednosti
+Razkriva slabosti modela
+Spodbuja raziskave robustnosti
+Omogoča varnostne mehanizme
+Razkriva tveganja uvajanja
Vse
−Težko je v celoti predvideti
−Povzroča nepredvidljive napake
−Težko je natančno simulirati
−Pogosto premalo zastopani v primerjalnih testih
Pogoste zablode
Mit
Več podatkov za usposabljanje v celoti odpravi težave z nedistribucijo.
Resničnost
Tudi modeli, usposobljeni na milijardah primerov, naletijo na vhodne podatke, ki jih še nikoli niso videli. Premik porazdelitve je neločljivo povezan z uvajanjem v resničnem svetu in noben nabor podatkov ne more zajeti vseh možnih scenarijev. Zaznavanje izven dosega uporabnikov (OOD) ostaja potrebno ne glede na obseg učenja.
Mit
Učni signali in podatki o ogledu na daljavo (OOD) so v strojnem učenju nepovezana koncepta.
Resničnost
Ta koncepta sta tesno povezana, ker meje učnih signalov določajo, kaj šteje kot izven distribucije. Model, usposobljen na medicinskih slikah iz ene bolnišnice, lahko slike iz druge bolnišnice obravnava kot izven distribucije, čeprav sta oba tehnično gledano medicinska podatka.
Mit
Model, ki dosega visoko natančnost pri testnih podatkih, bo dobro obravnaval vhodne podatke iz objektov na prostem (OOD).
Resničnost
Testni nizi običajno prihajajo iz iste distribucije kot učni podatki, zato visoka natančnost testov ne zagotavlja robustnosti na spremembe distribucije. Modeli so lahko zanesljivo napačni pri vhodnih podatkih OOD, hkrati pa ohranjajo odlično delovanje znotraj distribucije.
Mit
Zaznavanje izven distribucije je pomembno le za varnostno kritične aplikacije.
Resničnost
Zaznavanje OOD je pomembno za praktično vsak nameščen sistem strojnega učenja, od priporočilnih mehanizmov do klepetalnih robotov. Nepričakovani vnosi lahko poslabšajo uporabniško izkušnjo, povzročijo pristranske izhode ali sprožijo kaskadne napake v podrejenih sistemih, ne glede na domeno aplikacije.
Mit
Samonadzorovano učenje odpravlja potrebo po tradicionalnih učnih signalih.
Resničnost
Samonadzorovane metode se še vedno zanašajo na učne signale, le da se ti generirajo samodejno iz podatkovne strukture in ne na človeške oznake. Nadzorni signal lahko napoveduje maskirane besede ali naslednje video sličice, vendar še vedno vodi učenje skozi posodobitve gradientov.
Pogosto zastavljena vprašanja
Kakšna je razlika med učnimi signali in učnimi podatki?
Podatki za učenje se nanašajo na surove primere, ki se vnesejo v model, medtem ko so signali za učenje nadzorne informacije, pridobljene iz teh podatkov, kot so oznake, nagrade ali samoustvarjeni cilji. Signali so tisti, ki dejansko spodbujajo učenje, medtem ko podatki zagotavljajo substrat, iz katerega se črpajo signali. Nabor podatkov brez uporabnih signalov ne more učinkovito usposobiti nadzorovanega modela.
Kako v praksi zaznate podatke o izstopu iz distribucije?
Med pogoste pristope spadajo spremljanje zanesljivosti napovedi, uporaba ločenih modelov zaznavanja OOD, merjenje energijskih rezultatov in uporaba statističnih testov na vhodnih značilnostih. Nekatere metode primerjajo nove vhodne podatke s statistiko porazdelitve učenja, druge pa klasifikatorje usposabljajo posebej za razlikovanje med vzorci v porazdelitvi in OOD. Najboljša izbira je odvisna od arhitekture modela in omejitev uvajanja.
Ali lahko model, usposobljen na dobrih signalih, še vedno ne uspe na podatkih OOD?
Da, seveda. Tudi modeli z odličnimi učnimi podatki naletijo na vhodne podatke zunaj svoje naučene porazdelitve. To je še posebej pogosto, kadar se okolja uvajanja razlikujejo od pogojev učenja, kot so na primer novi svetlobni pogoji za modele vida ali neznano besedišče za jezikovne modele. Napake pri ustvarjanju vsebin na daljavo so običajen del uvajanja sistemov strojnega učenja.
Zakaj je zaznavanje izven distribucije pomembno za varnost umetne inteligence?
Zaznavanje OOD pomaga sistemom umetne inteligence prepoznati, kdaj delujejo zunaj svojih pristojnosti, kar preprečuje preveč samozavestne napačne odgovore in omogoča nadomestno vedenje. Brez njega lahko modeli ustvarijo verjetne, a napačne izhode na neznanih vhodnih podatkih, kar je nevarno v zdravstvu, avtonomni vožnji in drugih področjih z visokimi vložki.
Katere vrste učnih signalov obstajajo v sodobnem strojnem učenju?
Sodobno strojno učenje uporablja več vrst signalov: nadzorovane oznake za klasifikacijo in regresijo, nagrade za učenje z okrepitvijo, kontrastivne pare za učenje s predstavitvami in samogenerirane cilje za samonadzorovane metode. Vsaka vrsta signala oblikuje učenje drugače in ustreza različnim problemskim področjem.
Kakšna je povezava med premikom distribucije in podatki o izstopu iz distribucije?
Premik porazdelitve je širši pojav, pri katerem se porazdelitev podatkov spremeni med usposabljanjem in uvajanjem, medtem ko se podatki OOD nanašajo na specifične vhodne podatke, ki ne spadajo v porazdelitev usposabljanja. Premik porazdelitve je lahko postopen (kovarialni premik) ali nenaden (konceptni premik), zaznavanje OOD pa pomaga prepoznati, kdaj do premika pride.
Ali veliki jezikovni modeli dobro obravnavajo vhodne podatke zunaj distribucije?
Veliki jezikovni modeli nekatere scenarije OOD obravnavajo bolje kot manjši modeli, ker njihovi široki učni korpusi pokrivajo raznolike besedilne vzorce. Vendar se še vedno spopadajo z resnično novimi vhodnimi podatki, specializiranimi domenami zunaj svojih učnih podatkov in nasprotnimi pozivi, namenjenimi izzvanju nepričakovanega vedenja. Izzivi OOD vztrajajo tudi v velikem obsegu.
Kakšno vlogo igra dopolnjevanje podatkov pri zmanjševanju napak pri izdelavi na daljavo (OOD)?
Povečevanje podatkov umetno širi porazdelitve učenja z uporabo transformacij, kot so rotacije, vbrizgavanje šuma ali parafraziranje. To modele med učenjem izpostavi bolj raznolikim vhodnim podatkom, kar lahko izboljša robustnost na spremembe porazdelitve pri uvajanju. Vendar pa povečanje ne more simulirati vseh možnih sprememb v resničnem svetu.
Ali je odkrivanje izven distribucije rešen problem?
Ne, zaznavanje izvenzemeljskih objektov (OOD) ostaja aktivno raziskovalno področje s precejšnjimi nerešenimi izzivi. Trenutne metode dobro delujejo v nadzorovanih primerjalnih testih, vendar se pogosto spopadajo s kompleksnostjo uporabe v resničnem svetu. Raziskovalci še naprej razvijajo boljše tehnike za visokodimenzionalne vhodne podatke, multimodalne podatke in scenarije odprtega sveta.
Kako učni signali vplivajo na pristranskost modela?
Učni signali kodirajo predpostavke in pristranskosti tistega, ki jih je ustvaril, pa naj gre za človeške komentatorje ali avtomatizirane sisteme. Če oznake odražajo družbene pristranskosti ali premalo predstavljajo določene skupine, se modeli naučijo teh vzorcev in jih ohranjajo v napovedih. Zato so raznolike ekipe za označevanje in pregledi pristranskosti ključnega pomena za odgovoren razvoj umetne inteligence.
Ocena
Učni signali in podatki o izven distribucije predstavljajo dve plati iste medalje v strojnem učenju: ena opredeljuje, kaj se model nauči, druga pa razkriva meje tega učenja. Pri gradnji katerega koli sistema strojnega učenja dajte prednost visokokakovostnim in raznolikim učnim signalom, vendar to naložbo pred uvedbo združite z zaznavanjem izven distribucije in testiranjem robustnosti. Najbolj zanesljivi sistemi umetne inteligence oba obravnavajo kot bistvena, namesto da bi izbrali enega pred drugim.