Atitikimo sąnaudų funkcijos ir klasifikavimo nuostolių funkcijos
Atitikimo sąnaudų funkcijos ir klasifikavimo nuostolių funkcijos atlieka skirtingus vaidmenis mašininiame mokymesi. Atitikimo sąnaudos matuoja prognozuojamų ir pagrindinių atitikmenų panašumą, o klasifikavimo nuostoliai optimizuoja modelius, kad įvestis būtų priskirta atskiroms kategorijoms. Jų skirtumų supratimas padeda specialistams pasirinkti tinkamą kiekvienos užduoties tikslą.
Akcentai
Atitikimo sąnaudų balai atitinka balus, o klasifikavimo nuostoliai formuoja sprendimų ribas tarp kategorijų.
Klasifikavimo nuostoliai, tokie kaip kryžminė entropija, dominuoja prižiūrimame mokymesi, o atitikimo sąnaudos lemia stebėjimo ir derinimo procesus.
Atitikimo sąnaudos tiekiamos kombinatoriniams sprendikliams, o klasifikavimo nuostoliai tiesiogiai integruojami su gradiento pagrindu veikiančiais optimizatoriais.
Šios dvi funkcijų šeimos retai konkuruoja tiesiogiai, bet kartais sujungiamos hibridinėse įterpimo ir atitikimo sistemose.
Kas yra Atitikimo sąnaudų funkcijos?
Matematiniai matai, kurie kiekybiškai įvertina numatomų ir tikslinių atitikmenų panašumą arba skirtumą tokiose užduotyse kaip objektų sekimas ir požymių atitikimas.
Atitikimo kaštų funkcijos priskiria skaitmeninį balą kandidatų poroms, kur mažesnės vertės paprastai rodo geresnį atitikimą tarp numatytų ir faktinių atitikmenų.
Jie plačiai naudojami optinio srauto įvertinime, stereoskopiniame suderinime ir objektų sekimo vamzdynuose, siekiant įvertinti, kaip gerai numatytas atitikimas atitinka faktinius duomenis.
Įprasti pavyzdžiai yra absoliučiųjų skirtumų suma (SAD), kvadratinių skirtumų suma (SSD) ir normalizuota kryžminė koreliacija (NCC).
Skirtingai nuo klasifikavimo nuostolių, atitikimo sąnaudos veikia remiantis nepertraukiamo vertinimo prognozėmis, o diskrečiomis klasės tikimybėmis.
Jie dažnai tarnauja kaip pirmasis didesnio srauto etapas, teikiantis balus sprendėjams, pavyzdžiui, vengriškam paskyrimo problemų algoritmui.
Kas yra Klasifikacijos praradimo funkcijos?
Tikslinės funkcijos, kurios apmoko modelius teisingai suskirstyti įvestis į iš anksto apibrėžtas diskrečias klases, bausdamos už neteisingas prognozes.
Klasifikavimo nuostoliai matuoja neatitikimą tarp numatytų klasės tikimybių ir tikrųjų klasės etikečių, nukreipdami modelius link tikslaus kategorizavimo.
Kryžminis entropijos praradimas ir jo variantai (dvejetainis, kategorinis, retas) yra plačiausiai naudojami klasifikavimo tikslai giliajame mokymesi.
Jie yra tokių užduočių kaip vaizdų atpažinimas, šlamšto aptikimas, nuotaikų analizė ir medicininė diagnostika pagrindas.
Šiuolaikinės sistemos, tokios kaip „PyTorch“ ir „TensorFlow“, teikia integruotas klasifikavimo nuostolių įgyvendinimo galimybes greitam prototipų kūrimui.
Skirtingai nuo atitikimo sąnaudų, klasifikavimo nuostoliai paprastai veikia pagal tikimybių skirstinius, gautus naudojant „softmax“ arba „sigmoid“ aktyvacijas.
Palyginimo lentelė
Funkcija
Atitikimo sąnaudų funkcijos
Klasifikacijos praradimo funkcijos
Pagrindinis tikslas
Kiekybiškai įvertinkite prognozuojamų ir pagrindinių atitikmenų panašumą
Optimizuokite modelius, kad priskirtumėte įvestis teisingoms atskiroms kategorijoms
Atstumu pagrįsti rodikliai, lyginantys neapdorotus arba požymių vektorius
Tikimybiniai matavimai, lyginantys numatomus pasiskirstymus su vienkartinėmis arba minkštomis etiketėmis
Vaidmuo vamzdyne
Dažnai naudojamas užduočių sprendikliuose, tokiuose kaip vengrų algoritmas
Tiesiogiai apmoko klasifikatorius per gradientinį nusileidimą ant pažymėtų duomenų
Gradiento elgesys
Gradientai priklauso nuo neapdorotų prognozavimo paklaidų, dažnai tiesinių arba kvadratinių
Gradientai priklauso nuo prognozės patikimumo, o ryškesni signalai rodo patikimas klaidingas prognozes.
Etiketės formatas
Nuolatinės tikslinės vertės arba suderintos poros
Diskretieji klasių indeksai arba vieno kodavimo vektoriai
Išsamus palyginimas
Pagrindiniai tikslai
Atitikimo kaštų funkcijos egzistuoja tam, kad atsakytų į paprastą klausimą: kiek ši prognozė yra artima teisingam atsakymui? Jos sukuria skaliarinį balą, kuris atspindi atitikmens kokybę, kurią tolesni algoritmai naudoja priskyrimams atlikti. Klasifikacijos nuostolių funkcijos, priešingai, siekia išmokyti modelį ribų tarp kategorijų. Jos stumia numatomas tikimybes link teisingos klasės, tuo pačiu slopindamos neteisingas, formuodamos modelio sprendimų paviršių daugelyje mokymo pavyzdžių.
Matematiniai pagrindai
Atitikimo sąnaudos dažnai priklauso nuo geometrinių arba statistinių atstumo matų. SAD susumuoja absoliučius pikselių skirtumus, SSD juos pakelia kvadratu, kad būtų didesnė bauda už dideles paklaidas, o NCC normalizuoja pagal ryškumo pokyčius. Klasifikavimo nuostoliai yra pagrįsti informacijos teorija. Pavyzdžiui, kryžminė entropija matuoja bitų skaičių, reikalingą prognozei užkoduoti, atsižvelgiant į tikrąjį pasiskirstymą, todėl ji natūraliai tinka tikimybiniams klasifikatoriams.
Naudojimo atvejai praktikoje
Kurdami daugiaobjektį sekiklį, inžinieriai remiasi atitikimo sąnaudomis, kad susietų aptikimus skirtinguose kadruose, dažnai derindami IoU atstumus su išvaizdos įterpimais. Medicininio vaizdavimo klasifikatoriuje, diagnozuojančiame navikus, kryžminės entropijos nuostoliai skatina modelį atskirti piktybinius atvejus nuo gerybinių. Dvi funkcijų šeimos retai tiesiogiai persidengia, nors hibridinės sistemos kartais naudoja klasifikavimo nuostolius, kad išmoktų įterpimus, kuriuos vėliau palygina atitikimo sąnaudos.
Treniruočių dinamika
Atitikimo sąnaudos paprastai sukuria gradientus, kurie keičiasi kartu su prognozavimo paklaidos dydžiu, o tai gali sukelti nestabilumą, kai paklaidos yra didelės. Klasifikavimo nuostoliai, tokie kaip kryžminė entropija, elgiasi kitaip: jie sukuria stiprius gradientus, kai modelis yra užtikrintai klaidingas, bet mažesnius gradientus, kai prognozės artėja prie teisingumo. Ši savybė padeda klasifikatoriams sklandžiai konverguoti, o atitikimo sąnaudoms gali reikėti kruopštaus mokymosi greičio derinimo arba normalizavimo.
Integracija su algoritmais
Atitikimo sąnaudos retai kada egzistuoja atskirai. Jų balai įtraukiami į kombinatorinius sprendiklius, tokius kaip vengrų algoritmas arba Jonker-Volgenant metodas, siekiant gauti optimalius „vienas su vienu“ priskyrimus. Klasifikavimo nuostoliai tiesiogiai integruojami su gradiento pagrindu veikiančiais optimizatoriais, tokiais kaip Adam arba SGD, atnaujinant modelio svorius vienu atgaliniu etapu. Šių dviejų metodų konvejerio sudėtingumas labai skiriasi.
Tinkamos funkcijos pasirinkimas
Pasirinkite atitikimo kainą, kai jūsų užduotis apima prognozių susiejimą su tikslais, pvz., aptikimų susiejimą ar požymių suderinimą. Pasirinkite klasifikavimo nuostolį, kai jūsų tikslas yra išmokyti modelį atpažinti, kuriai kategorijai priklauso įvestis. Kai kuriose pažangiose sistemose abu šie veiksniai pasireiškia kartu: klasifikavimo nuostolis apmoko įterpimo tinklą, o atitikimo kaina palygina tuos įterpimus išvados darymo metu.
Privalumai ir trūkumai
Atitikimo sąnaudų funkcijos
Privalumai
+Paprasta įgyvendinti
+Interpretuojami balai
+Veikia su neapdorotomis funkcijomis
+Gerai dera su užduočių sprendėjais
Pasirinkta
−Jautrus masteliui
−Apribota porinėmis užduotimis
−Nėra tikimybinės išvesties
−Gali būti nestabilu optimizuoti
Klasifikacijos praradimo funkcijos
Privalumai
+Stiprūs gradiento signalai
+Tikimybinė interpretacija
+Integruota į pagrindines sistemas
+Skalaujama daugeliui klasių
Pasirinkta
−Reikalingi pažymėti duomenys
−Jautrus klasės disbalansui
−Gali pernelyg užtikrintai klaidingai klasifikuoti
−Mažiau naudinga regresinėms užduotims
Dažni klaidingi įsitikinimai
Mitas
Atitikimo sąnaudų funkcijos ir klasifikavimo nuostoliai yra keičiami.
Realybė
Jie atlieka visiškai skirtingus tikslus. Atitikimo sąnaudos įvertina porų panašumą, o klasifikavimo nuostoliai moko modelius numatyti atskiras kategorijas. Vieno pakeitimas kitu paprastai duoda prastus rezultatus.
Mitas
Kryžminės entropijos nuostoliai visada veikia geriau nei kiti klasifikavimo nuostoliai.
Realybė
Kryžminė entropija yra stipri numatytoji reikšmė, tačiau židinio nuostoliai dažnai jį pranoksta nesubalansuotuose duomenų rinkiniuose, o vyrių nuostoliai išlieka konkurencingi atraminių vektorių mašinoms ir tam tikriems paraštėmis pagrįstiems klasifikatoriams.
Mitas
Atitikimo išlaidos taikomos tik kompiuterinio matymo užduotims.
Realybė
Nors atitikimo sąnaudos dažnos regos srityje, jos taip pat pasireiškia natūralios kalbos apdorojime objektų suderinimui, bioinformatikoje sekų suderinimui ir rekomendacijų sistemose vartotojo ir elemento poravimui.
Mitas
Mažesnė kaina visada reiškia geresnį modelį.
Realybė
Atitikimo sąnaudos matuoja porinį panašumą, o ne bendrą modelio kokybę. Modelis gali pateikti mažos sąnaudos atitikmenis, kurie yra sistemingai klaidingi, jei sąnaudų funkcija neapima atitinkamų savybių.
Mitas
Klasifikacijos nuostolių negalima naudoti regresijos uždaviniams spręsti.
Realybė
Griežtai kalbant, klasifikavimo nuostoliams reikalingos diskrečios etiketės. Tačiau ranginė regresija ir kai kurios reitingavimo užduotys pritaiko klasifikavimo stiliaus tikslus prie sutvarkytų tolydžių rezultatų.
Dažnai užduodami klausimai
Kuo skiriasi atitikimo sąnaudų funkcijos ir klasifikavimo nuostolių funkcijos?
Atitikimo kaštų funkcijos įvertina, kaip gerai numatytas atitikimas atitinka tikslą, sukurdamos panašumo arba atstumo reikšmę. Klasifikacijos nuostolių funkcijos matuoja, kaip gerai numatytos klasės tikimybės atitinka tikras etiketes, skatindamos modelius tikslaus kategorizavimo link. Pirmoji atsako į klausimą „koks artimas šis atitikimas?“, o antroji – „ar ši prognozė teisinga?“.
Ar klasifikavimui galima naudoti atitikimo sąnaudų funkcijas?
Ne tiesiogiai. Atitikimo sąnaudos lygina elementų poras, o ne vertina klasės narystę. Tačiau išmokti įterpimai, apmokyti klasifikavimo nuostoliais, vėliau gali būti palyginti naudojant atitikimo sąnaudas paieškos ar tikrinimo užduotyse.
Kuri klasifikavimo nuostolių funkcija naudojama dažniausiai?
Kryžminis entropijos praradimas yra plačiausiai naudojamas klasifikavimo tikslas giliajame mokymesi. Jo dvejetainis ir kategorinis variantai atitinkamai tvarko dviejų ir kelių klasių problemas ir aiškiai integruojasi su „softmax“ rezultatais.
Ar atitikimo sąnaudų funkcijos yra diferencijuojamos?
Daugelis įprastų atitikimo sąnaudų, tokių kaip SAD ir SSD, yra diferencijuojamos, todėl jas galima naudoti mokymosi procesuose nuo galo iki galo. Tačiau kai kurios pažangios atitikimo formuluotės apima diskrečius priskyrimo etapus, kuriems reikalingi aproksimacijos, pavyzdžiui, Sinkhorno algoritmas, kad būtų galima naudoti gradientinį srautą.
Kada turėčiau naudoti židinio nuostolius vietoj kryžminės entropijos?
Židinio praradimas yra pageidautinas, kai jūsų duomenų rinkinyje yra didelis klasių disbalansas, nes jis sumažina lengvų pavyzdžių svorį ir sutelkia dėmesį į sudėtingus atvejus. Subalansuotų duomenų rinkinių atveju standartinė kryžminė entropija paprastai veikia taip pat gerai, be papildomo sudėtingumo.
Ar atitikimo sąnaudų funkcijoms reikalingi pažymėti mokymo duomenys?
Pačios atitikimo sąnaudos yra matematinės formulės, kurioms nereikia mokymo. Tačiau norint išmokti kurti funkcijas, kurias atitikimo sąnaudos gali efektyviai palyginti, dažnai reikia paženklintų duomenų, ypač giliojo mokymosi pagrindu veikiančiose atitikimo sistemose.
Kaip klasifikavimo nuostoliai apdoroja kelias teisingas klases?
Standartinė kryžminė entropija daro prielaidą, kad kiekvienam įėjimui yra tiksliai viena teisinga klasė. Problemoms su keliomis galiojančiomis etiketėmis, pavyzdžiui, daugiaetikečių klasifikacijai, specialistai naudoja sigmoidine verte pagrįstą dvejetainę kryžminę entropiją arba minkštųjų etikečių variantus, kurie leidžia apskaičiuoti tikimybių masę keliose klasėse.
Kokį vaidmenį atlieka vengriškas algoritmas, susijęs su atitikimo sąnaudomis?
Vengriškas algoritmas priskyrimo problemą sprendžia rasdamas optimalius „vienas su vienu“ poravimus, kai yra pateikta sąnaudų matrica. Atitinkamos sąnaudos užpildomos toje matricoje, o algoritmas parenka porų derinį su mažiausia bendra sąnauda.
Ar galiu viename modelyje sujungti atitikimo išlaidas ir klasifikavimo nuostolius?
Taip, hibridinės architektūros dažnai daro būtent tai. Klasifikacijos praradimas gali apmokyti įterptųjų tinklų tinklą, o atitikimo kaina tada palygina tuos įterptuosius darant išvadą. Šis modelis pasireiškia veido atpažinimo, asmens pakartotinio identifikavimo ir metrinio mokymosi sistemose.
Kodėl objektų stebėjime svarbu suderinti išlaidas?
Sekimas reikalauja susieti aptikimus tarp vaizdo kadrų, o tai iš esmės yra priskyrimo problema. Atitikimo išlaidos kiekybiškai įvertina, kokia tikimybė, kad du aptikimai susiję su tuo pačiu objektu, todėl algoritmai gali išlaikyti nuoseklų tapatumą laikui bėgant.
Ar vyrių praradimas vis dar aktualus, palyginti su kryžminiu entropija?
Vyrių praradimas išlieka aktualus, ypač atraminių vektorių mašinoms ir paraštėms pagrįstiems klasifikatoriams. Šiuolaikiniai neuroniniai tinklai dažnai renkasi kryžminę entropiją, nes ji sukuria kalibruotas tikimybes, tačiau vyrių praradimas tam tikrais atvejais gali pasiūlyti geresnes paraščių savybes.
Nuosprendis
Atitikimo sąnaudų funkcijos ir klasifikavimo nuostolių funkcijos sprendžia iš esmės skirtingas problemas, todėl pasirinkimas visiškai priklauso nuo jūsų užduoties. Atitikimo sąnaudas rinkitės, kai reikia įvertinti prognozių ir tikslų atitikmenis sekimo ar derinimo uždaviniuose. Klasifikavimo nuostolius rinkitės, kai mokote modelį suskirstyti įvestis į atskiras žymas, o tai apima daugumą prižiūrimo mokymosi programų.