tehisintellektmasinõpetehisintellekti eetikaandmeteadus

Mudeli kallutatus vs andmekallutatus tehisintellekti süsteemides

Kuigi mõlemad kontseptsioonid viivad ebaõiglaste või moonutatud tehisintellekti tulemusteni, tuleneb mudeli kallutatus arendajate tehtud algoritmilistest disainivalikutest ja matemaatilistest eeldustest, samas kui andmete kallutatus tuleneb vigasest, mittetäielikust või ajalooliselt eelarvamuslikust teabest, mida süsteemi treenimiseks kasutatakse.

Esiletused

Andmetega seotud probleemid esindavad vigaseid alusõppematerjale, samas kui mudelitega seotud probleemid esindavad vigast arutlusmehhanismi.
Süsteemil võib olla täiesti representatiivne andmestik, kuid see võib siiski anda insenerivalikute tõttu diskrimineerivaid tulemusi.
Algoritmilised moonutused võimendavad sageli kunstlikult väiksemaid reaalse maailma statistilisi korrelatsioone absoluutseteks reegliteks.
Andmeprobleemid nõuavad ulatuslikku eeltöötlust, samas kui algoritmilised probleemid vajavad järeltöötlust või arhitektuuri kohandamist.

Mis on Mudeli kallutatus?

Masinõppe algoritmi enda matemaatilise struktuuri, optimeerimisfunktsioonide või arhitektuuriliste disainilahenduste poolt tekitatud moonutused.

See võib juhtuda isegi siis, kui treeningandmestik on ideaalselt tasakaalustatud ja täiesti vaba reaalse maailma eelarvamustest.
Insenerid toovad sageli tahtlikult sisse väikese matemaatilise algtaseme nihke, et vältida üleliigset sobitamist ja parandada uute andmete ennustusi.
Arendajate tehtud otsustused omaduste kaalumise kohta võivad kogemata triviaalseid omadusi kriitilisteks otsustusteguriteks võimendada.
Komplekssed närvivõrgud saavad luua sisemisi matemaatilisi otseteid, mis eelistavad järjepidevalt teatud otsustusprotsesse teistele.
Selle nähtuse isoleerimiseks ja mõõtmiseks kasutatakse sageli selliseid hindamismõõdikuid nagu Fairlearn ja IBM AI Fairness 360.

Mis on Andmete kallutatus?

Kallutatud või mitteesinduslik koolitusinfo, mis peegeldab inimlikke eelarvamusi, süsteemset ebavõrdsust või vigaseid reaalse maailma valimimeetodeid.

See toimib peamise vahendina ajaloolise ühiskondliku diskrimineerimise süstimiseks otse tänapäevastesse automatiseeritud töövoogudesse.
Rahvastiku valimi tasakaalustamatus põhjustab sageli süsteemide kehva toimivust vähemusrühmade või alaesindatud demograafiliste rühmade puhul.
Subjektiivne või ebajärjekindel inimeste sildistamine andmete ettevalmistamise ajal kodeerib sageli isiklikke eelarvamusi koolituse alusse.
See võib avalduda mõõtmisvea vormis, kui kogumisvahendid või -meetodid eelistavad süstemaatiliselt teatud keskkondi.
Leevendamisstrateegiad hõlmavad tavaliselt ulatuslikku eeltöötlust, andmete täiendamist või uute treeningpunktide sünteesimist tasakaalu taastamiseks.

Võrdlustabel

Funktsioon	Mudeli kallutatus	Andmete kallutatus
Esmane allikas	Algoritmiline arhitektuur ja disainivalikud	Vigane kogumine või ajaloolised ebavõrdsused
Esinemise tingimus	Võib juhtuda isegi veatute treeningandmete korral	Tekib seetõttu, et sissetulevad andmed on ohustatud
Üldine näide	Teatud parameetrite ülekaalustamine kodeerimise ajal	Koolitus meeste eelistatud ajalooliste värbamisandmete kohta
Tuvastuspunkt	Mudeli väljatöötamine ja juurutamiseelne testimine	Esialgsed andmete uurimise ja auditeerimise etapid
Esmane parandus	Parameetrite, piirangute või arhitektuuride kohandamine	Andmekogumite uuesti valimine, puhastamine või täiendamine
Vastutavad osapooled	Masinõppe insenerid ja arendajad	Andmekogujad, annotaatorid ja valdkonnaeksperdid
Mõõdikute fookus	Järeldusskoori jaotus rühmade vahel	Klassi ja sildi tasakaalustamatus põhitõdes

Üksikasjalik võrdlus

Põhjus ja päritolu

Põhiline erinevus seisneb selles, kus arendustsükli jooksul kallutatus alguse saab. Mudeli kallutatus on sisemine probleem, mis tuleneb inseneriotsustest, näiteks konkreetse matemaatilise algoritmi valimisest või tunnuste kaalude kohandamisest. Seevastu andmete kallutatus on väline probleem, mis tekib süsteemi sisestades reaalmaailma teavet, mis on mittetäielik, valesti valitud või peegeldab ajaloolist ühiskondlikku ebavõrdsust.

Mõju süsteemi jõudlusele

Need kaks väljakutset avalduvad tehisintellekti süsteemi juurutamisel erinevalt. Kui algoritmil on struktuurilisi vigu, eelistab see pidevalt teatud otsustusprotsesse, ignoreerides potentsiaalselt keerulisi nüansse olenemata sellest, mida andmed näitavad. Kui süüdlaseks on andmeprobleemid, võib süsteem oma matemaatikat veatult teostada, kuid anda diskrimineerivaid väljundeid, kuna seda õpetati reaalsuse moonutatud versiooni abil.

Identifitseerimine ja diagnostika

Nende probleemide paljastamine nõuab erinevatel arendusetappidel erinevaid auditeerimistehnikaid. Praktikud märkavad andmeprobleeme varakult, tehes statistilisi kontrolle klasside tasakaalustamatuse osas või auditeerides demograafilist esindatust treeningkogumites. Algoritmi struktuurivead tuvastatakse tavaliselt hiljem, võrreldes järelduste skoori erinevate rühmade vahel, et tagada matemaatika võrdne kohtlemine populatsioonide vahel.

Parandusstrateegiad

Nende probleemide lahendamine nõuab arendusmeeskonnalt täiesti erinevaid tööriistu. Andmetasemel esinevate vigade lahendamiseks on vaja koguda mitmekesisemaid valimeid, ümber kirjutada märgistusjuhised või kasutada sünteetiliste andmete genereerimist treeningu aluse tasakaalustamiseks. Algoritmilistest vigadest ülesaamiseks on vaja muuta kadumisfunktsioone, muuta mudeli arhitektuuri või rakendada matemaatilisi piiranguid treeningu ajal.

Plussid ja miinused

Mudeli eelarvamuste kontroll

Eelised

+ Optimeerib töötlemiskiirust
+ Hoiab ära tugeva üleliigse paigaldamise
+ Võimaldab matemaatilisi kohandusi

Kinnitatud

− Võib luua jäikaid teid
− Ignoreerib keerulisi tekstinüansse
− Nõuab põhjalikke tehnilisi ümberehitusi

Andmete kallutatuse korrigeerimine

Eelised

+ Kaitseb ajaloolist täpsust
+ Parandab vähemusrühmade sooritust
+ Edendab kasutajate usaldust

Kinnitatud

− Uskumatult kallis koguda
− Inimese sildistamine on subjektiivne
− Võib sisse tuua sünteetilist müra

Tavalised eksiarvamused

Müüt

Tehisintellekti süsteemid on täiesti neutraalsed, kuna arvutitel puuduvad inimlikud tunded.

Tõelisus

Algoritmid peegeldavad loomulikult oma arendajate teadlikke ja alateadlikke valikuid. Isegi ilma emotsioonideta saab matemaatilisi valemeid programmeerida nii, et need seavad prioriteediks teatud muutujad, mis teatud gruppe loomupäraselt ebasoodsasse olukorda seavad.

Müüt

Ideaalselt tasakaalustatud andmestiku kasutamine tagab erapooletu tehisintellekti mudeli.

Tõelisus

Puhtad andmed on vaid pool võitu. Insenerid saavad endiselt süsteemseid moonutusi sisse tuua funktsioonide valiku, matemaatiliste optimeerimiseesmärkide või arhitektuuri valimise kaudu, mis eelistab lihtsustatud otseteid nüansirikaste reaalsuste asemel.

Müüt

Selliste tundlike tunnuste nagu rass või sugu eemaldamine andmetest kõrvaldab diskrimineerimise.

Tõelisus

Süsteemid tuvastavad hõlpsalt vahendusmuutujaid, mis korreleeruvad tugevalt kaitstud atribuutidega, näiteks postiindeksite või haridusliku taustaga. Algoritm suudab rekonstrueerida väljajäetud demograafilised mustrid ja jätkata moonutatud ennustuste tegemist.

Müüt

Masinõppesüsteemist saab täielikult kõrvaldada igasuguse eelarvamuse.

Tõelisus

Täielik elimineerimine on matemaatiliselt võimatu, kuna õigluse erinevad definitsioonid on sageli omavahel vastuolus. Süsteemi optimeerimine täiusliku pariteedi saavutamiseks ühes mõõdikus vähendab sageli selle õiglust või täpsust teises.

Sageli küsitud küsimused

Kas tehisintellekt saab arendada algoritmilist eelarvamust, kui inimesed seda otseselt ei programmeeri?

Jah, see juhtub sageli keerukate närvivõrkude eneseoptimeerimise protsessi käigus. Süsteem on programmeeritud leidma kõige tõhusama matemaatilise tee täpsuse maksimeerimiseks. Seda tehes võib see avastada ja ära kasutada soovimatuid otseteid või korrelatsioone funktsioonides, luues sisuliselt omaenda ebaõiglase otsustusprotsessi ilma selgesõnalise inimliku juhiseta.

Kuidas ajalooline ebavõrdsus tänapäevaste algoritmide jaoks andmete kallutatuseks muutub?

Kui masinõppemudeleid treenitakse ajalooliste andmete põhjal, siis need salvestavad selle ajajärgu süsteemse ebavõrdsuse, mil see teave salvestati. Näiteks kui ettevõte on ajalooliselt naisi juhtivatelt ametikohtadelt välja jätnud, siis nende varasemate CV-de põhjal treenitud värbamistööriist õpib, et meeskandidaadid on statistiliselt eelistatumad. Süsteem käsitleb varasemat diskrimineerimist tulevase edu objektiivse mallina.

Miks peaksid arendajad mudelisse tahtlikult baasjoone kallutatuse sisse tooma?

Insenerid kasutavad kontrollitud matemaatilise nihke vormi, mida sageli nimetatakse regulariseerimiseks, et vältida süsteemi liigset kohanemist oma treeningandmetega. Ilma selle tahtliku piiranguta võib mudel oma treeningnäited ideaalselt meelde jätta, kuid uute reaalsete stsenaariumidega kokku puutudes täielikult läbi kukkuda. See on kalkuleeritud kompromiss, mille eesmärk on suurendada süsteemi üldist paindlikkust.

Mis vahe on valimi kallutatusel ja mõõtmiskallutusel?

Valimiprobleemid tekivad siis, kui teatud rühmad jäetakse esialgses kogumisfaasis täielikult välja või on üleesindatud, mis tähendab, et andmestik ei peegelda tegelikku populatsiooni. Mõõtmisprobleemid tekivad siis, kui andmekogumisvahendid või -meetodid ise on vigased või ebajärjekindlad. Näiteks kvaliteetse digikaamera kasutamine jõukates piirkondades ja madala eraldusvõimega kaamerate kasutamine vaesemates linnaosades tekitab mõõtmisvea.

Kas sünteetiliste andmete genereerimine saab parandada tugevalt moonutatud treeningandmestikku?

Sünteetiline genereerimine aitab tasakaalustada alaesindatud kategooriaid, luues kunstlikke näiteid, mis matkivad vähemusrühmade tunnuseid. Arendajad peavad aga olema ettevaatlikud, kuna see tehnika kätkeb endas riske. Kui esialgsed andmed sisaldavad peeneid eelarvamusi, võib automatiseeritud genereerimisprotsess tahtmatult neid täpseid vigu võimendada, mille tulemuseks on suurem, kuid samavõrd ohustatud treeningbaas.

Milliseid tööriistu saavad arendusmeeskonnad nende süsteemsete kõrvalekallete testimiseks kasutada?

Insenerid toetuvad oma süsteemide auditeerimiseks mitmele tuntud avatud lähtekoodiga tööriistakomplektile, sealhulgas Google'i What-If tööriistale, IBM-i AI Fairness 360-le ja Microsofti Fairlearnile. Need raamistikud pakuvad spetsiifilisi mõõdikuid õigluse hindamiseks erinevate rühmade vahel. Need aitavad meeskondadel täpselt kindlaks teha, kas ebavõrdsus tuleneb andmestiku aluseks olevast tasakaalustamatusest või sisemisest algoritmilisest mehaanikast.

Kuidas proksimuutujad võimaldavad süsteemidel demograafilistest piirangutest mööda hiilida?

Isegi kui tundlikud atribuudid, nagu rass või sugu, andmestikust täielikult kustutatakse, jäävad muud pealtnäha kahjutud andmepunktid nendega seotuks. Sellised tegurid nagu geograafiline asukoht, ostlemisharjumused või kultuurilised eelistused toimivad sageli kaudsete näitajatena. Keerukas närvivõrk ühendab neid punkte hõlpsalt, võimaldades ennustada varjatud demograafilisi tunnuseid ja säilitada moonutatud tulemusi.

Millist tüüpi moonutusi on insenerimeeskondadel raskem lahendada?

Algoritmilisi vigu peetakse üldiselt raskemini parandatavaks, kuna need on sügavalt juurdunud tarkvara keerukatesse matemaatilistesse võrranditesse. Kuigi andmestikuga seotud probleemid lahendatakse sageli parema teabe kogumisega, nõuab struktuuriprobleemi lahendamine põhjalikku tehnilist sekkumist. Insenerid peavad ümber kirjutama põhilised optimeerimisfunktsioonid või ümber kujundama kogu närvivõrgu arhitektuuri, et muuta põhjalikult seda, kuidas see teavet töötleb.

Otsus

Keskendu andmete kallutatusele, kui sinu peamine eesmärk on tagada, et sinu masinõppe protsessi siseneks puhas, kaasav ja ajalooliselt tasakaalustatud teave. Pööra tähelepanu mudeli kallutatusele, kui sul on vaja auditeerida, kuidas sinu tarkvara seda teavet töötleb, tagades, et matemaatiline arhitektuur ise ei looks ega võimendaks ebaõiglasi mustreid.

Seotud võrdlused

A/B-testimine mudeli serveerimisel vs. ühe mudeli juurutamine

Mudeliteenuse A/B-testimine suunab liiklust konkureerivate mudeliversioonide vahel, et mõõta reaalset toimivust, samas kui ühe mudeli juurutamine saadab kõigile kasutajatele ühe mudeli. Meeskonnad valivad nende vahel riskitaluvuse, liiklusmahu ja statistilise valideerimise vajaduse alusel enne täielikku juurutamist.

A/B-testimine sisuväljaannetes vs ühekordsed sisuväljaanded

Sisuväljaannete A/B-testimine hõlmab variatsioonide levitamist erinevatele sihtrühmadele ja tulemuslikkuse mõõtmist, samas kui ühekordsed sisuväljaanded suunavad ühe versiooni korraga kõigile. Igal lähenemisviisil on erinevad eesmärgid, kusjuures A/B-testimine eelistab andmepõhist optimeerimist ja ühekordsed väljaanded seavad esikohale kiiruse ja lihtsuse.

Adaptiivne intelligentsus vs fikseeritud käitumissüsteemid

See detailne võrdlus uurib adaptiivsete intelligentsete mootorite arhitektuurilisi erinevusi, operatsioonilisi piiranguid ja reaalset jõudlust võrreldes fikseeritud käitumisega automatiseerimissüsteemidega. Vaatleme, kuidas süsteemid, mis pidevalt õpivad uutest keskkonnaandmetest, sobivad kokku jäikade ja ennustatavate reeglipõhiste raamistikega.

Adaptiivne otsing vs staatiline otsing

Adaptiivne otsing kohandab dünaamiliselt, kuidas ja millist teavet süsteem päringu põhjal hangib, samas kui staatilised otsingukanalid järgivad fikseeritud reegleid olenemata kontekstist. Mõlemad toetavad tänapäevaseid tehisintellekti rakendusi, kuid erinevad oluliselt paindlikkuse, maksumuse ja täpsuse poolest. Nende vahel valimine sõltub töökoormuse keerukusest ja eelarvest.

Agentide koolitus keskkondades vs. võrguühenduseta andmestiku koolitus

Agentide koolitamine keskkondades hõlmab õppimist reaalajas simuleeritud või füüsilise keskkonnaga suhtlemise kaudu, samas kui võrguühenduseta andmestiku koolitamine tugineb eelnevalt kogutud andmetele ilma täiendava keskkonnale juurdepääsuta. Mõlemad lähenemisviisid treenivad masinõppe mudeleid, kuid erinevad põhimõtteliselt selle poolest, kuidas agendid kogemusi koguvad ja jõudlust parandavad.