mākslīgais intelektsmašīnmācīšanāssociālās izvēles teorijaparedzošā modelēšanakolektīvā izlūkošanaieteikumu sistēmas

Preferenču apkopošana pret individuālo prognozēšanas modelēšanu

Preferenču apkopošana apvieno vairākas individuālas preferences kolektīvos lēmumos, savukārt individuālā prognozēšanas modelēšana prognozē personīgo uzvedību, izmantojot mašīnmācīšanos viena lietotāja datos. Abām metodēm ir atšķirīgi mērķi mākslīgā intelekta sistēmās, sākot no ieteikumu dzinējiem līdz demokrātiskām balsošanas platformām.

Iezīmes

Preferenču agregācija cīnās ar fundamentālām neiespējamības teorēmām, kuras individuālā prognozēšana pilnībā izvairās
Individuāli prognozēšanas modeļi saskaras ar unikālām aukstās palaišanas problēmām, kuras kolektīvās metodes apiet, izmantojot koplietotos datus.
Bažas par taisnīgumu krasi atšķiras: procedurālā grupas taisnīgums pretstatā individuālās attieksmes paritātei
Mūsdienu ansambļa metodes interesanti apvieno abas paradigmas, apkopojot daudzas individuālas prognozes

Kas ir Preferenču apkopošana?

Apvieno vairākas individuālas preferences, lai izveidotu kolektīvu lēmumu vai rangu.

Kondorsē paradokss parāda, ka vairākuma preferences var cikliski mainīties intransitīvi, padarot agregāciju teorētiski sarežģītu.
Arrow neiespējamības teorēma pierāda, ka neviena perfekta agregācijas metode vienlaikus neapmierina visus taisnīguma kritērijus.
Borda skaitīšana, balsošana pēc daudzskaitļa un salīdzināšana pāros pārstāv principiāli atšķirīgas agregācijas filozofijas.
Mūsdienu mākslīgā intelekta lietojumprogrammas ietver sadarbības filtrēšanu un ansambļa metodes, kas apkopo prognozes dažādos modeļos.
Mehānismu dizains ekonomikā izmanto preferenču apvienošanu, lai izveidotu ar stimuliem saderīgas sistēmas patiesai atklāsmei

Kas ir Individuālā prognozēšanas modelēšana?

Izmanto mašīnmācīšanos, lai prognozētu vienas personas turpmāko uzvedību, pamatojoties uz tās vēsturiskajiem datiem.

Loģistiskā regresija un gradienta palielināšana joprojām tiek plaši izmantota individuālā līmeņa prognozēm rūpniecībā.
Funkciju inženierija bieži vien ietver laika modeļus, demogrāfiskos signālus un kontekstuālus iegulumus.
Bažas par taisnīgumu rodas, ja modeļi diskriminē, pamatojoties uz aizsargātām īpašībām, piemēram, rasi vai dzimumu
Kalibrēšana un diskriminācija ir atšķirīgas paredzošas īpašības; modelis var būt labi kalibrēts, bet netaisnīgs.
Hipotētiskā spriešana palīdz novērtēt, kas notiktu, ja intervences mainītu konkrētus mainīgos šai personai

Salīdzinājuma tabula

Funkcija	Preferenču apkopošana	Individuālā prognozēšanas modelēšana
Galvenais mērķis	Sintezēt kolektīvu izvēli no daudziem ievades avotiem	Prognozēt vienas personas nākotnes rīcību
Datu struktūra	Vairāki preferenču profili vai reitingi	Viena lietotāja gareniskās uzvedības pēdas
Galvenais teorētiskais pamats	Sociālās izvēles teorija un labklājības ekonomika	Statistiskās mācīšanās teorija un cēloņsakarību secinājumi
Bažas par taisnīgumu	Procedūras taisnīgums vēlētāju vai dalībnieku vidū	Individuāla līmeņa vienlīdzīga attieksme un nediskriminācija
Izvades formāts	Kolektīvais rangs, uzvarētājs vai varbūtības sadalījums	Punkta novērtējums, varbūtība vai lēmuma ieteikums
Mērogojamības izaicinājums	Eksponenciāli daudzu preferenču apkopošanas skaitļošanas sarežģītība	Reti dati un aukstā palaišana jauniem lietotājiem
Tipisks pielietojums	Ieteikumu sistēmas, balsošanas platformas, mākslīgā intelekta ansamblis	Kredītreitings, klientu aizplūšanas prognozēšana, personalizēta medicīna
Novērtēšanas metrika	Kondorseta efektivitāte, Bordas rādītāji, sociālās labklājības funkcijas	AUC-ROC, precizitātes atsaukšana, kalibrēšanas kļūda, Briera vērtējums

Detalizēts salīdzinājums

Galvenais mērķis un filozofija

Preferenču apkopošana būtībā jautā, ko vēlas grupa, uzskatot individuālās preferences par kolektīvas lēmumu funkcijas ievadi. Filozofiskās saknes meklējamas Ruso vispārējās gribas teorijā un Benthema utilitārajā aprēķinos. Turpretī individuālā prognozēšanas modelēšana uzskata personu par analīzes vienību — ko šī konkrētā persona darīs tālāk? Pirmā uzsver demokrātisko leģitimitāti un sociālo labklājību; otrā optimizē prognozēšanas precizitāti un rīcības brīvu iejaukšanos.

Teorētiskie pamati

Sociālās izvēles teorija nodrošina matemātisko mugurkaulu preferenču apkopošanai, un Kondorseta, Bordas, Arouvas un Sena fundamentālie rezultāti veido to, ko, mūsuprāt, ir sasniedzams. Individuālā prognozēšanas modelēšana balstās uz statistiskās mācīšanās teoriju, kur Vapņika-Červonenka dimensija un Rademahera sarežģītības ierobežotā vispārināšanas kļūda. Interesanti, ka ansambļa metodes, piemēram, maisīšana un pastiprināšana, rada tiltu: tās apkopo daudzu vāju apguvēju prognozes, apvienojot abas paradigmas.

Taisnīgums un ētika

Apkopošanas taisnīgums attiecas uz to, vai process vienlīdzīgi respektē dalībniekus — vai balsošanas noteikums kādam piešķir nesamērīgu ietekmi? Individuālās prognozēšanas taisnīgums jautā, vai līdzīgi indivīdi saņem līdzīgas prognozes, kas bieži tiek formalizētas, izmantojot demogrāfisko paritāti vai vienādas izredzes. Šie taisnīguma jēdzieni var būt pretrunīgi; apkopošanas metode, kas perfekti atspoguļo vairākuma vēlmes, varētu sistemātiski nostādīt mazākumtautību grupas neizdevīgā situācijā.

Praktiska ieviešana

Preferenču apkopošanas ieviešana plašā mērogā prasa skaitļošanas grūtības pakāpi: Kemeny optimālā apkopošana ir NP sarežģīta, un pat aptuveniem risinājumiem ir nepieciešami sarežģīti algoritmi. Atsevišķi prognozēšanas modeļi saskaras ar atšķirīgiem šķēršļiem — iezīmju inženierija reti sastopamiem uzvedības datiem, koncepcijas nobīdes apstrāde, mainoties lietotāju preferencēm, un modeļa svaiguma saglabāšana bez pārmērīgām atkārtotas apmācības izmaksām. Abos gadījumos ir nepieciešama rūpīga datu infrastruktūras izpēte, taču inženiertehniskie ierobežojumi ievērojami atšķiras.

Novērtēšanas un panākumu rādītāji

Apkopojuma kvalitātes novērtēšana ietver aksiomatisku analīzi — vai metode atbilst neatbilstošu alternatīvu neatkarībai, Pareto efektivitātei vai nediktātai? Empīriski sociālās labklājības funkcijas mēra, cik lielu lietderību sasniedz kolektīvs. Individuālie prognozēšanas modeļi izmanto paredzamos veiktspējas rādītājus, tomēr tie var maldināt: perfekti kalibrēts modelis joprojām var radīt kaitīgus lēmumus, ja to izmanto, neņemot vērā prognozēm atbilstošas rīcības hipotētiskās sekas.

Priekšrocības un trūkumi

Preferenču apkopošana

Iepriekšējumi

+ Demokrātiskā leģitimitāte lēmumos
+ Izturīgs pret viena punkta atteicēm
+ Ietver dažādas perspektīvas
+ Teorētiski pamatotas taisnīguma īpašības

Ievietots

− Bultas neiespējamības ierobežojumi
− Skaitļošanas ziņā dārgi mērogā
− Pakļauts stratēģiskām manipulācijām
− Var apspiest minoritāšu vēlmes

Individuālā prognozēšanas modelēšana

Iepriekšējumi

+ Ļoti personalizēti rezultāti
+ Rīcības stratēģijas noteikšana intervencēm
+ Ātra mērogojamība, izmantojot mākoņdatošanu
+ Nepārtraukta uzlabošana, pateicoties atgriezeniskās saites cilpām

Ievietots

− Bažas par privātumu un uzraudzību
− Pastiprina vēsturiskos aizspriedumus
− Reti dati jauniem lietotājiem
− Necaurredzamība sarežģītu modeļu lēmumos

Biežas maldības

Mīts

Preferenču apkopošana vienmēr sniedz iespēju, kurai dod priekšroku lielākā daļa cilvēku.

Realitāte

Kondorseta paradokss un Bultas teorēma atklāj, ka vairākuma preferences var cikliski cikliski funkcionēt intransitīvi, un neviena metode neatbilst visiem intuitīvajiem taisnīguma kritērijiem. Kandidāts, kas pāru sakritībās pārspēj visus pārējos, var neeksistēt, piespiežot kompromisus starp vēlamajām īpašībām.

Mīts

Individuālie prognozēšanas modeļi paredz, ko cilvēki faktiski darīs.

Realitāte

Šie modeļi prognozē uzvedību, kas ir atkarīga no vēsturiskiem modeļiem, nevis no patiesām nākotnes izvēlēm. Cilvēki mainās, konteksti mainās, un prognozes kļūst pašdestruktīvas, ja tās tiek izmantotas intervencīvi — paredzot, ka kāds aizies no darba, un pēc tam piedāvājot noturēšanas stimulus, tiek mainīts pats prognozētais rezultāts.

Mīts

Apkopošanas metodes ir neitrālas un brīvas no aizspriedumiem.

Realitāte

Katrs apkopošanas noteikums kodē vērtības par to, kuru preferences ir svarīgas un kā konflikti tiek atrisināti. Vairākuma balsošana dod priekšrocības koncentrētām minoritātēm; Borda skaitīšana atalgo plašu pieņemamību. Metodes izvēle pēc būtības ir politiska, ne tikai tehniska.

Mīts

Vairāk datu vienmēr uzlabo individuālās prognozes.

Realitāte

Virs noteikta punkta papildu funkcijas rada troksni, skaitļošanas izmaksas un privātuma risku. Neatbilstoši mainīgie izraisa pārmērīgu pielāgošanu, un vēsturiskie dati no mainīgiem apstākļiem samazina modeļa atbilstību. Izslēdzamo elementu atlasīšana bieži vien ir tikpat svarīga kā iekļaujamo elementu atlasīšana.

Mīts

Praksē šīs divas pieejas nekad nepārklājas.

Realitāte

Sadarbības filtrēšana ieteikumu sistēmās tās tieši apvieno — apkopojot līdzīgu lietotāju preferences, lai prognozētu individuālas izvēles. Ansambļa metodes apkopo daudzus individuālus modeļus. Robežas izplūst sarežģītās mākslīgā intelekta arhitektūrās.

Mīts

Taisnīgums apkopojumā nozīmē, ka ikviens saņem to, ko vēlas.

Realitāte

Vienprātība ir ārkārtīgi reta parādība, un Pareto efektivitāte garantē tikai to, ka neviens nevar uzlaboties, nekaitējot citam. Reālā apvienošana ietver zaudētājus un kompromisus; taisnīgums attiecas uz procesu un proporcionalitāti, nevis uz vispārēju apmierinātību.

Bieži uzdotie jautājumi

Kas ir preferenču agregācija vienkāršoti?

Iedomājieties draugu grupu, kas cenšas izvēlēties restorānu. Visi sakārto savas izvēles, un kaut kādā veidā jums šīs izvēles ir jāapvieno vienā lēmumā. Preferenču apkopošana ir formāls pētījums par to, kā to izdarīt taisnīgi un konsekventi. Tā aptver balsošanas sistēmas, ieteikumu sistēmas un jebkuru situāciju, kurā kolektīvai izvēlei ir nozīme.

Kā patiesībā darbojas individuālā prognozēšanas modelēšana?

Šie modeļi apgūst modeļus no vēsturiskiem datiem par personas rīcību — veiktajiem pirkumiem, noklikšķinātajām saitēm, nokavētajiem maksājumiem — un ekstrapolē uz priekšu. Izplatītākās metodes ietver loģistisko regresiju, nejaušos mežus un neironu tīklus. Modelis identificē, kuras pazīmes paredz interesējošo iznākumu, un pēc tam šīs apgūtās attiecības piemēro jaunām situācijām.

Kāpēc Arrow neiespējamības teorēma ir svarīga mākslīgajam intelektam?

Arrow pierādīja, ka neviena preferenču apkopošanas sistēma nevar vienlaikus apmierināt nelielu šķietami saprātīgu taisnīguma nosacījumu kopumu. Mākslīgā intelekta sistēmām, kas apvieno lietotāju preferences, piemēram, meklēšanas rezultātu ranžēšanu vai satura ieteikšanu, tas nozīmē, ka būtiski kompromisi ir neizbēgami. Dizaineriem ir skaidri jāizvēlas, kurām taisnīguma īpašībām piešķirt prioritāti.

Vai individuāli prognozēšanas modeļi jebkad var būt patiesi godīgi?

Taisnīgumam ir vairākas matemātiskas definīcijas, kas bieži vien ir pretrunā viena ar otru. Modelis var apmierināt demogrāfisko paritāti, bet pārkāpt izlīdzinātās izredzes, vai otrādi. Turklāt prognozēšanas taisnīgums negarantē rezultātu taisnīgumu, ja prognozes ietekmē lēmumus. Izaicinājums ir gan tehnisks, gan dziļi kontekstuāls.

Kas apgrūtina preferenču apkopošanu skaitļošanas ziņā?

Daži optimāli apkopošanas noteikumi, piemēram, Kemenija konsensa ranga noteikšana, prasa pārbaudīt eksponenciāli daudz iespējamo secību, pieaugot alternatīvu skaitam. Pat ar aproksimācijas algoritmiem mērogošana līdz miljoniem vienību vai vēlētāju rada reālas problēmas, kas motivē heiristiskas un nejaušinātas metodes.

Kā ieteikumu sistēmas izmanto abas pieejas kopā?

Sadarbības filtrēšana apkopo līdzīgu lietotāju preferences, lai prognozētu, kas jums varētu patikt. Uz saturu balstīta filtrēšana izmanto individuālu paredzēšanu jūsu pašu vēsturei. Hibrīdās sistēmas apvieno abus, izmantojot kolektīvo gudrību, kad jūsu personas dati ir nepietiekami, un individuālus modeļus, kad jums ir bagāta mijiedarbības vēsture.

Kāda ir aukstās palaišanas problēma individuālajā prognozēšanā?

Kad platformai pievienojas jauns lietotājs vai tiek laists klajā jauns produkts, nav pietiekamu vēsturisko datu, lai veidotu precīzas prognozes. Tā ir individuālo prognožu Ahilleja papēdis. Apkopošanas metodes to daļēji risina, aizņemoties informāciju no līdzīgiem lietotājiem vai precēm, tāpēc praksē dominē hibrīdas pieejas.

Vai preferenču apkopošana var tikt galā ar cilvēkiem, kuri stratēģiski nepareizi ziņo par preferencēm?

Šis ir mehānismu dizaina centrālais jautājums. Dažas sistēmas, piemēram, otrās cenas izsoles, padara patiesu atklāsmi saderīgu ar stimuliem. Taču daudzas balsošanas sistēmas ir manipulējamas — vēlētāji dažreiz var sasniegt labākus rezultātus, sagrozot savas preferences. Stratēģijai noturīgas apkopošanas izstrāde joprojām ir aktīva pētniecības joma.

Kā atšķiras privātuma apsvērumi starp šīm divām pieejām?

Individuāliem prognozēšanas modeļiem bieži vien ir nepieciešami detalizēti personas dati, radot bažas par uzraudzību un piekrišanu. Preferenču apkopošana dažreiz var darboties ar anonimizētiem reitingiem, lai gan abiem arvien vairāk ir nepieciešamas atšķirīgas privātuma metodes. Datu izpaušanas detalizācija ievērojami atšķiras.

Kāda loma katrā pieejā ir izskaidrojamībai?

Apkopošanas metodes saskaras ar izskaidrojamības izaicinājumiem saistībā ar kolektīvās izvēles iemesliem — kas ko ietekmēja un kā. Individuālām prognozēm ir jāpaskaidro, kāpēc konkrēta persona saņēma konkrētu prognozi, īpaši tādās augstas likmes jomās kā kreditēšana un krimināltiesības. Abas arvien vairāk pieprasa pārredzamību, taču skaidrojuma objekti atšķiras.

Vai šīm metodēm ir reālās kļūmes, par kurām man būtu jāzina?

2000. un 2016. gada ASV prezidenta vēlēšanas ilustrēja, kā plurālisma apkopošana var radīt uzvarētājus, kuriem iebilst vairākums. Individuālie prognozēšanas modeļi krimināltiesībās ir parādījuši rasu aizspriedumus recidīvisma prognozēšanā. Abi gadījumi uzsver, ka tehniskā izsmalcinātība nevar aizstāt rūpīgi izvēlētas vērtības.

Kā šīs pieejas varētu attīstīties līdz ar ģeneratīvā mākslīgā intelekta attīstību?

Lieli valodu modeļi tagad var simulēt individuālās preferences apkopošanas eksperimentiem, potenciāli uzlabojot mehānismu dizainu. Tie arī ļauj veikt sarežģītākas individuālas prognozēšanas, izmantojot bagātīgākas pazīmju reprezentācijas. Tomēr sintētisko datu riski un jaunās iespējas, kas mulsina tradicionālās teorētiskās garantijas, rada jaunus izaicinājumus abām paradigmām.

Spriedums

Izvēlieties preferenču apkopošanu, ja lēmumi ietekmē grupas un leģitimitāte prasa demokrātiski iekļaut dažādus viedokļus. Izvēlieties individuālu prognozēšanas modelēšanu, pielāgojot intervences, produktus vai pakalpojumus konkrētiem cilvēkiem un ja detalizēta uzvedības prognozēšana rada vērtību. Daudzas reālās pasaules sistēmas, sākot no personalizētām ieteikumu dzinējiem līdz līdzdalības budžeta platformām, pārdomāti apvieno abas pieejas.

Saistītie salīdzinājumi

A/B testēšana modeļu rādīšanā salīdzinājumā ar viena modeļa ieviešanu

A/B testēšana modeļu apkalpošanā novirza trafiku starp konkurējošām modeļu versijām, lai novērtētu reālo veiktspēju, savukārt viena modeļa ieviešana visiem lietotājiem nosūta vienu modeli. Komandas izvēlas starp tiem, pamatojoties uz riska toleranci, trafika apjomu un statistiskās validācijas nepieciešamību pirms pilnīgas ieviešanas.

A/B testēšana satura izlaidumos salīdzinājumā ar vienreizējiem satura izlaidumiem

A/B testēšana satura izlaidumos ietver variāciju ieviešanu dažādiem auditorijas segmentiem un veiktspējas mērīšanu, savukārt vienreizēji satura izlaidumi vienlaikus nodrošina vienu versiju visiem lietotājiem. Katra pieeja atbilst dažādiem mērķiem, A/B testēšanai dodot priekšroku uz datiem balstītai optimizācijai, bet vienreizējiem izlaidumiem prioritāte ir ātrums un vienkāršība.

Adaptīvā izguve salīdzinājumā ar statisko izguves cauruļvadiem

Adaptīvā izguve dinamiski pielāgo, kā un kādu informāciju sistēma izgūst, pamatojoties uz vaicājumu, savukārt statiskās izguves cauruļvadi ievēro fiksētus noteikumus neatkarīgi no konteksta. Abas nodrošina modernas mākslīgā intelekta lietojumprogrammas, taču tās ievērojami atšķiras pēc elastības, izmaksām un precizitātes. Izvēle starp tām ir atkarīga no darba slodzes sarežģītības un budžeta.

Adaptīvais intelekts pret fiksētas uzvedības sistēmām

Šajā detalizētajā salīdzinājumā tiek pētītas adaptīvo intelekta dzinēju arhitektūras atšķirības, darbības ierobežojumi un reālā veiktspēja salīdzinājumā ar fiksētas uzvedības automatizācijas sistēmām. Mēs aplūkojam, kā sistēmas, kas nepārtraukti mācās no jauniem vides datiem, atbilst stingrām, paredzamām, uz noteikumiem balstītām sistēmām.

Aģentu apmācība vidēs salīdzinājumā ar bezsaistes datu kopu apmācību

Aģentu apmācība vidēs ietver mācīšanos, izmantojot reāllaika mijiedarbību ar simulētu vai fizisku vidi, savukārt bezsaistes datu kopu apmācība balstās uz iepriekš apkopotiem datiem bez papildu piekļuves videi. Abas pieejas apmāca mašīnmācīšanās modeļus, taču būtiski atšķiras tas, kā aģenti apkopo pieredzi un uzlabo veiktspēju.