mākslīgais intelektsmašīnmācīšanāsmākslīgā intelekta ētikadatu zinātne

Modeļa neobjektivitāte pret datu neobjektivitāti mākslīgā intelekta sistēmās

Lai gan abi koncepti noved pie negodīgiem vai sagrozītiem mākslīgā intelekta rezultātiem, modeļa neobjektivitāte izriet no izstrādātāju algoritmiskām dizaina izvēlēm un matemātiskiem pieņēmumiem, savukārt datu neobjektivitāte rodas no kļūdainas, nepilnīgas vai vēsturiski aizspriedumainas informācijas, kas tiek izmantota sistēmas apmācībai.

Iezīmes

Datu problēmas atspoguļo kļūdainus pamata mācību materiālus, savukārt modeļu problēmas atspoguļo kļūdainu spriešanas mehānismu.
Sistēmai var būt pilnīgi reprezentatīvs datu kopums, un tā joprojām var radīt diskriminējošus rezultātus inženiertehnisko izvēļu dēļ.
Algoritmiskās novirzes bieži mākslīgi pastiprina nelielas reālās pasaules statistiskās korelācijas absolūtos noteikumos.
Datu problēmām nepieciešama plaša pirmapstrāde, savukārt algoritmiskām problēmām nepieciešama pēcapstrāde vai arhitektūras pielāgošana.

Kas ir Modeļa aizspriedumi?

Mašīnmācīšanās algoritma matemātiskā struktūra, optimizācijas funkcijas vai arhitektūras dizaina lēmumi rada kropļojumus.

Tas var notikt pat tad, ja apmācības datu kopa ir pilnīgi līdzsvarota un pilnībā brīva no reālās pasaules aizspriedumiem.
Inženieri bieži vien apzināti ievieš nelielu bāzes matemātisko novirzi, lai novērstu pārmērīgu pielāgošanu un uzlabotu prognozes par jauniem datiem.
Izstrādātāju pieņemtie lēmumi par funkciju svēršanu var nejauši pastiprināt triviālas īpašības, pārvēršot tās kritiskos lēmumu faktoros.
Sarežģīti neironu tīkli var izstrādāt iekšējus matemātiskus saīsinājumus, kas pastāvīgi dod priekšroku konkrētiem lēmumu pieņemšanas ceļiem, nevis citiem.
Lai izolētu un izmērītu šo parādību, bieži tiek izmantoti tādi novērtēšanas rādītāji kā Fairlearn un IBM AI Fairness 360.

Kas ir Datu neobjektivitāte?

Sagrozīta vai nereprezentatīva apmācības informācija, kas atspoguļo cilvēku aizspriedumus, sistēmisku nevienlīdzību vai kļūdainas reālās pasaules izlases veidošanas metodes.

Tas darbojas kā galvenais līdzeklis vēsturiskās sabiedrības diskriminācijas tiešai ievadīšanai mūsdienu automatizētajās darbplūsmās.
Nelīdzsvarotība iedzīvotāju izlasē bieži vien noved pie sistēmu sliktas veiktspējas attiecībā uz minoritāšu vai nepietiekami pārstāvētām demogrāfiskām grupām.
Subjektīva vai nekonsekventa cilvēku marķēšana datu sagatavošanas laikā bieži vien iekodē personiskus aizspriedumus apmācības pamatā.
Tas var izpausties kā mērījumu neobjektivitāte, ja vākšanas rīki vai metodes sistemātiski dod priekšroku noteiktām vidēm.
Mazināšanas stratēģijas parasti ietver intensīvu pirmapstrādi, datu palielināšanu vai jaunu apmācības punktu sintezēšanu, lai atjaunotu līdzsvaru.

Salīdzinājuma tabula

Funkcija	Modeļa aizspriedumi	Datu neobjektivitāte
Primārais avots	Algoritmiskā arhitektūra un dizaina izvēles	Kļūdaina kolekcija vai vēsturiska nevienlīdzība
Notikuma nosacījums	Var notikt pat ar nevainojamiem treniņu datiem	Rodas tāpēc, ka ienākošie dati ir apdraudēti
Bieži sastopams piemērs	Pārspīlēta noteiktu parametru svēršana kodēšanas laikā	Apmācība par vēsturiskiem darbā pieņemšanas datiem, kas deva priekšroku vīriešiem
Noteikšanas punkts	Modeļa izstrāde un testēšana pirms ieviešanas	Sākotnējās datu izpētes un auditēšanas fāzes
Primārais labojums	Parametru, ierobežojumu vai arhitektūru pielāgošana	Datu kopu atkārtota atlase, tīrīšana vai papildināšana
Atbildīgās puses	Mašīnmācīšanās inženieri un izstrādātāji	Datu vācēji, anotētāji un domēna eksperti
Metrikas fokuss	Secinājumu punktu sadalījums starp grupām	Klases un etiķešu nelīdzsvarotība pamata patiesībā

Detalizēts salīdzinājums

Cēlonis un izcelsme

Fundamentālā atšķirība slēpjas tajā, kur izstrādes dzīves ciklā rodas novirze. Modeļa neobjektivitāte ir iekšēja problēma, kas rodas inženiertehnisku lēmumu rezultātā, piemēram, izvēloties konkrētu matemātisku algoritmu vai pielāgojot iezīmju svarus. Savukārt datu neobjektivitāte ir ārēja problēma, kas rodas sistēmā, piegādājot tai reālās pasaules informāciju, kas ir nepilnīga, nepareizi atlasīta vai atspoguļo vēsturisko sabiedrības nevienlīdzību.

Ietekme uz sistēmas veiktspēju

Šīs divas problēmas izpaužas atšķirīgi, ieviešot mākslīgā intelekta sistēmu. Ja algoritmam ir strukturāli trūkumi, tas pastāvīgi dod priekšroku noteiktiem lēmumu pieņemšanas ceļiem, potenciāli ignorējot sarežģītas nianses neatkarīgi no tā, ko dati rāda. Ja vainojamas ir datu problēmas, sistēma var nevainojami izpildīt matemātiskos aprēķinus, bet sniegt diskriminējošus rezultātus, jo tā tika apmācīta, izmantojot sagrozītu realitātes versiju.

Identifikācija un diagnostika

Šo problēmu atklāšana prasa atšķirīgas audita metodes dažādos izstrādes posmos. Praktiķi agrīni atklāj datu problēmas, veicot statistiskas pārbaudes, lai noteiktu klases nelīdzsvarotību, vai auditējot demogrāfisko pārstāvību apmācības kopās. Algoritma strukturālie trūkumi parasti tiek identificēti vēlāk, salīdzinot secinājumu rādītājus dažādās grupās, lai nodrošinātu, ka matemātika objektīvi apstrādā populācijas.

Sanācijas stratēģijas

Šo problēmu risināšana prasa pilnīgi atšķirīgus rīkus no izstrādes komandas. Datu līmeņa noviržu novēršanai ir jāapkopo daudzveidīgāki paraugi, jāpārraksta marķēšanas vadlīnijas vai jāizmanto sintētisko datu ģenerēšana, lai līdzsvarotu apmācības pamatu. Algoritmisku noviržu pārvarēšanai ir jāmodificē zaudējumu funkcijas, jāmaina modeļa arhitektūra vai jāpiemēro matemātiskie ierobežojumi apmācības laikā.

Priekšrocības un trūkumi

Modeļa nobīdes kontrole

Iepriekšējumi

+ Optimizē apstrādes ātrumu
+ Novērš nopietnu pārapstrādi
+ Ļauj veikt matemātiskas korekcijas

Ievietots

− Var izveidot stingrus ceļus
− Ignorē sarežģītas teksta nianses
− Nepieciešama padziļināta tehniska pārbūve

Datu neobjektivitātes korekcija

Iepriekšējumi

+ Aizsargā vēsturisko precizitāti
+ Uzlabo minoritāšu grupu sniegumu
+ Veicina lietotāju uzticību

Ievietots

− Neticami dārgi savākt
− Cilvēka marķēšana ir subjektīva
− Var ieviest sintētisko troksni

Biežas maldības

Mīts

Mākslīgā intelekta sistēmas ir pilnīgi neitrālas, jo datoriem nav cilvēcisku jūtu.

Realitāte

Algoritmi dabiski atspoguļo to izstrādātāju apzinātās un neapzinātās izvēles. Pat bez emocijām matemātiskās formulas var ieprogrammēt, lai piešķirtu prioritāti konkrētiem mainīgajiem, kas pēc būtības rada neizdevīgus apstākļus noteiktām grupām.

Mīts

Izmantojot perfekti līdzsvarotu datu kopu, tiek garantēts objektīvs mākslīgā intelekta modelis.

Realitāte

Tīri dati ir tikai puse no uzvaras. Inženieri joprojām var ieviest sistēmiskas kļūdas, izvēloties funkcijas, matemātiskus optimizācijas mērķus vai izvēloties arhitektūru, kas dod priekšroku vienkāršotiem īsceļiem, nevis niansētām realitātēm.

Mīts

Izņemot no datiem tādus sensitīvus atribūtus kā rase vai dzimums, tiek novērsta diskriminācija.

Realitāte

Sistēmas viegli identificē aizstājējmainīgos, kas cieši korelē ar aizsargātiem atribūtiem, piemēram, pasta indeksiem vai izglītību. Algoritms var rekonstruēt izlaistos demogrāfiskos modeļus un turpināt sniegt sagrozītas prognozes.

Mīts

Jūs varat pilnībā izslēgt visu veidu aizspriedumus no mašīnmācīšanās sistēmas.

Realitāte

Pilnīga izslēgšana nav matemātiski iespējama, jo dažādas taisnīguma definīcijas bieži vien ir pretrunā viena ar otru. Sistēmas optimizēšana, lai sasniegtu perfektu paritāti vienā metrikā, bieži vien pasliktina tās taisnīgumu vai precizitāti citā.

Bieži uzdotie jautājumi

Vai mākslīgais intelekts var attīstīt algoritmisku neobjektivitāti, ja cilvēki to nav tieši ieprogrammējuši?

Jā, tas bieži notiek sarežģītu neironu tīklu pašoptimizācijas procesā. Sistēma ir ieprogrammēta, lai atrastu visefektīvāko matemātisko ceļu precizitātes maksimizēšanai. To darot, tā var atklāt un izmantot neparedzētus saīsinājumus vai korelācijas funkcijās, faktiski radot savus negodīgos lēmumu pieņemšanas ceļus bez skaidriem cilvēka norādījumiem.

Kā vēsturiskā nevienlīdzība pārvēršas datu neobjektivitātē mūsdienu algoritmiem?

Kad mašīnmācīšanās modeļi tiek apmācīti, izmantojot vēsturiskus ierakstus, tie apkopo tā laikmeta sistēmisko nevienlīdzību, kurā šī informācija tika reģistrēta. Piemēram, ja uzņēmums vēsturiski izslēdza sievietes no vadības amatiem, pieņemšanas darbā rīks, kas apmācīts, izmantojot šos iepriekšējos CV, iemācīsies, ka vīrieši kandidāti ir statistiski labāki. Sistēma uzskata pagātnes diskrimināciju par objektīvu nākotnes panākumu paraugu.

Kāpēc izstrādātāji apzināti ieviestu modelī bāzes līnijas novirzi?

Inženieri ievieš kontrolētu matemātiskās novirzes formu, ko bieži sauc par regularizāciju, lai novērstu sistēmas pārāk lielu pielāgošanos tās apmācības datiem. Bez šī apzinātā ierobežojuma modelis varētu perfekti iegaumēt savus apmācības piemērus, bet pilnībā neizdoties, saskaroties ar jauniem, reālās pasaules scenārijiem. Tas ir aprēķināts kompromiss, kas tiek veikts, lai palielinātu sistēmas kopējo elastību.

Kāda ir atšķirība starp izlases neobjektivitāti un mērījumu neobjektivitāti?

Izlases veidošanas problēmas rodas, ja sākotnējā vākšanas posmā noteiktas grupas tiek pilnībā izslēgtas vai pārāk pārstāvētas, kas nozīmē, ka datu kopums neatspoguļo patieso populāciju. Mērīšanas problēmas rodas, ja paši datu vākšanas rīki vai metodes ir kļūdaini vai nekonsekventi. Piemēram, augstas kvalitātes digitālās kameras izmantošana turīgos rajonos un zemas izšķirtspējas kameru izmantošana nabadzīgākos rajonos rada mērījumu neprecizitāti.

Vai sintētisko datu ģenerēšana var labot ļoti sagrozītu apmācības datu kopu?

Sintētiskā ģenerēšana var palīdzēt līdzsvarot nepietiekami pārstāvētās kategorijas, radot mākslīgus piemērus, kas atdarina minoritāšu grupu iezīmes. Tomēr izstrādātājiem jāievēro piesardzība, jo šī metode ir saistīta ar riskiem. Ja sākotnējie dati satur smalkus aizspriedumus, automatizētās ģenerēšanas process var netīšām pastiprināt šos konkrētos trūkumus, kā rezultātā tiks izveidots lielāks, bet tikpat kompromitēts apmācības pamats.

Kādus rīkus izstrādes komandas var izmantot, lai pārbaudītu šīs sistēmiskās novirzes?

Inženieri savu sistēmu auditam izmanto vairākus ievērojamus atvērtā pirmkoda rīku komplektus, tostarp Google What-If Tool, IBM AI Fairness 360 un Microsoft Fairlearn. Šie ietvari nodrošina konkrētus rādītājus, lai novērtētu taisnīgumu dažādās grupās. Tie palīdz komandām noteikt, vai atšķirības rodas pamatā esošo datu kopu nelīdzsvarotības vai iekšējās algoritmiskās mehānikas dēļ.

Kā starpniekservera mainīgie ļauj sistēmām apiet demogrāfiskos ierobežojumus?

Pat ja no datu kopas tiek pilnībā dzēsti sensitīvi atribūti, piemēram, rase vai dzimums, citi šķietami nekaitīgi datu punkti paliek ar tiem saistīti. Tādi faktori kā ģeogrāfiskā atrašanās vieta, iepirkšanās paradumi vai kultūras preferences bieži vien darbojas kā aizstājēji. Sarežģīts neironu tīkls viegli savieno šos punktus, ļaujot tam paredzēt slēptās demogrāfiskās iezīmes un saglabāt sagrozītus rezultātus.

Kura veida novirzi inženieru komandām ir grūtāk atrisināt?

Algoritmiskās novirzes parasti tiek uzskatītas par grūtāk labojamām, jo tās ir dziļi iesakņojušās programmatūras sarežģītajos matemātiskajos vienādojumos. Lai gan datu kopu problēmas bieži vien tiek atrisinātas, apkopojot labāku informāciju, strukturālas problēmas risināšanai nepieciešama dziļa tehniska iejaukšanās. Inženieriem ir jāpārraksta galvenās optimizācijas funkcijas vai jāpārprojektē visa neironu tīkla arhitektūra, lai būtiski mainītu informācijas apstrādes veidu.

Spriedums

Izvēlieties koncentrēties uz datu neobjektivitāti, ja jūsu galvenais mērķis ir nodrošināt, lai jūsu mašīnmācīšanās procesā nonāktu tīra, iekļaujoša un vēsturiski līdzsvarota informācija. Pievērsiet uzmanību modeļa neobjektivitātei, kad jums ir jāauditē, kā jūsu programmatūra apstrādā šo informāciju, nodrošinot, ka pati matemātiskā arhitektūra nerada vai nepastiprina negodīgus modeļus.

Saistītie salīdzinājumi

A/B testēšana modeļu rādīšanā salīdzinājumā ar viena modeļa ieviešanu

A/B testēšana modeļu apkalpošanā novirza trafiku starp konkurējošām modeļu versijām, lai novērtētu reālo veiktspēju, savukārt viena modeļa ieviešana visiem lietotājiem nosūta vienu modeli. Komandas izvēlas starp tiem, pamatojoties uz riska toleranci, trafika apjomu un statistiskās validācijas nepieciešamību pirms pilnīgas ieviešanas.

A/B testēšana satura izlaidumos salīdzinājumā ar vienreizējiem satura izlaidumiem

A/B testēšana satura izlaidumos ietver variāciju ieviešanu dažādiem auditorijas segmentiem un veiktspējas mērīšanu, savukārt vienreizēji satura izlaidumi vienlaikus nodrošina vienu versiju visiem lietotājiem. Katra pieeja atbilst dažādiem mērķiem, A/B testēšanai dodot priekšroku uz datiem balstītai optimizācijai, bet vienreizējiem izlaidumiem prioritāte ir ātrums un vienkāršība.

Adaptīvā izguve salīdzinājumā ar statisko izguves cauruļvadiem

Adaptīvā izguve dinamiski pielāgo, kā un kādu informāciju sistēma izgūst, pamatojoties uz vaicājumu, savukārt statiskās izguves cauruļvadi ievēro fiksētus noteikumus neatkarīgi no konteksta. Abas nodrošina modernas mākslīgā intelekta lietojumprogrammas, taču tās ievērojami atšķiras pēc elastības, izmaksām un precizitātes. Izvēle starp tām ir atkarīga no darba slodzes sarežģītības un budžeta.

Adaptīvais intelekts pret fiksētas uzvedības sistēmām

Šajā detalizētajā salīdzinājumā tiek pētītas adaptīvo intelekta dzinēju arhitektūras atšķirības, darbības ierobežojumi un reālā veiktspēja salīdzinājumā ar fiksētas uzvedības automatizācijas sistēmām. Mēs aplūkojam, kā sistēmas, kas nepārtraukti mācās no jauniem vides datiem, atbilst stingrām, paredzamām, uz noteikumiem balstītām sistēmām.

Aģentu apmācība vidēs salīdzinājumā ar bezsaistes datu kopu apmācību

Aģentu apmācība vidēs ietver mācīšanos, izmantojot reāllaika mijiedarbību ar simulētu vai fizisku vidi, savukārt bezsaistes datu kopu apmācība balstās uz iepriekš apkopotiem datiem bez papildu piekļuves videi. Abas pieejas apmāca mašīnmācīšanās modeļus, taču būtiski atšķiras tas, kā aģenti apkopo pieredzi un uzlabo veiktspēju.