artipisyal na katalinuhanneuroaghampaningin sa kompyutersikolohiya
Nakakakita gamit ang Emosyon vs Nakakakita gamit ang Datos
Sinusuri ng paghahambing na ito ang pangunahing agwat sa pagitan ng biyolohikal na persepsyon at algorithmic analysis. Habang sinasala ng mga tao ang mundo sa pamamagitan ng lente ng personal na kasaysayan, mood, at mga likas na ugali sa kaligtasan, ang machine vision ay umaasa sa mga mathematical pixel distribution at statistical probability upang ikategorya ang realidad nang walang bigat ng damdamin o konteksto.
Mga Naka-highlight
Nakikita ng mga tao ang 'bakit' sa likod ng isang imahe, habang nakikita naman ng mga makina ang 'ano'.
Ang mga sistemang pinapagana ng datos ay kayang magproseso ng milyun-milyong imahe nang sabay-sabay nang hindi napapagod.
Ang emosyonal na pananaw ay lubos na naiimpluwensyahan ng kultura at personal na pagpapalaki.
Ang mga makina ay maaaring maging mas tumpak sa mga kontroladong kapaligiran na may malinaw na mga sukatan.
Ano ang Emosyonal na Persepsyon?
Ang kakayahan ng tao na bigyang-kahulugan ang biswal na stimuli sa pamamagitan ng mga masalimuot na pansala ng damdamin, memorya, at sosyal na nuance.
Ang paningin ng tao ay malalim na nakaugnay sa amygdala, na nagpapahintulot sa atin na tumugon sa mga banta bago pa natin sinasadyang matukoy ang mga ito.
Nadarama ng ating utak ang 'atmospera' o 'tensyon' sa isang silid sa pamamagitan ng mga mikroskopikong pahiwatig ng mukha at galaw ng katawan.
Kayang baguhin ng mga alaala ang pisikal na pananaw natin sa mga kulay at hugis sa mga pamilyar na kapaligiran.
Ang penomeno ng pareidolia ay nagdudulot sa atin ng pagkakita ng mga makabuluhang padron, tulad ng mga mukha, sa mga random na bagay.
Ang mga emosyonal na estado tulad ng takot o kaligayahan ay maaaring literal na magpalawak o magpaliit sa ating larangan ng peripheral vision.
Ano ang Pananaw na Pinapatakbo ng Datos?
Ang proseso ng pagkalkula ng pagbibigay-kahulugan sa mga imahe sa pamamagitan ng pag-convert ng liwanag sa mga numerical array at pagtukoy ng mga padron.
Nakikita ng mga makina ang mga imahe bilang malalaking grid ng mga numero na kumakatawan sa mga halaga ng intensidad na pula, berde, at asul.
Kayang matukoy ng computer vision ang mga wavelength ng liwanag, tulad ng infrared, na ganap na hindi nakikita ng mata ng tao.
Kinikilala ng mga algorithm ang mga bagay sa pamamagitan ng pagkalkula ng matematikal na probabilidad ng mga oryentasyon at tekstura ng gilid.
Hindi 'nakikita' ng mga artipisyal na sistema ang isang bagay; tinutugma nila ang mga pattern ng datos laban sa isang library ng milyun-milyong halimbawa ng pagsasanay.
Nananatiling perpektong pare-pareho ang paningin ng makina kahit ilang oras na itong gumagana.
Talahanayang Pagkukumpara
Tampok
Emosyonal na Persepsyon
Pananaw na Pinapatakbo ng Datos
Pangunahing Mekanismo
Mga neural network at neurochemistry
Linear algebra at mga tensor
Estilo ng Interpretasyon
Nakabatay sa konteksto at salaysay
Batay sa istatistika at tampok
Bilis ng Pagkilala
Halos agaran para sa mga pamilyar na konsepto
Nag-iiba-iba ayon sa hardware at laki ng modelo
Kahusayan
Napapailalim sa pagkapagod at pagkiling
Mapagparaya sa paulit-ulit ngunit walang 'sentido komun'
Sensitibo
Mataas para sa mga sosyal at emosyonal na pahiwatig
Mataas para sa maliliit na teknikal na paglihis
Pangunahing Layunin
Kaligtasan at koneksyon sa lipunan
Pag-optimize at pag-uuri
Detalyadong Paghahambing
Ang Kapangyarihan ng Konteksto
Ang isang taong tumitingin sa isang magulong kwarto ay maaaring makakita ng 'pagkapagod' o 'isang abalang linggo,' samantalang ang isang makina ay nakakakita ng 'itinapong tela' at 'floor plane.' Natural lamang na hinabi natin ang isang kuwento batay sa ating nakikita, gamit ang ating sariling mga karanasan sa buhay upang punan ang mga puwang. Sa kabaligtaran, ang pananaw na batay sa datos ay tinatrato ang bawat frame bilang isang sariwang palaisipang matematikal, na kadalasang nahihirapang maunawaan kung paano nauugnay ang mga bagay sa isa't isa sa isang makabuluhang paraan.
Obhetibong Matematika vs. Subhetibong Pakiramdam
Ang mga makina ay mahusay sa layunin, tulad ng pagbibilang ng eksaktong 452 katao sa isang siksikang parisukat o pagtukoy ng isang partikular na 12-digit na serial number mula sa malayo. Gayunpaman, hindi nila nararamdaman ang 'vibe' ng karamihang iyon. Maaaring agad na maramdaman ng isang tao ang isang pinagbabatayang kaguluhan sa isang protesta na hindi mapapansin ng isang algorithm dahil ang mga pisikal na paggalaw ay hindi pa tumutugma sa isang nakaprogramang pattern ng 'karahasan'.
Paghawak sa Kalabuan
Kapag nahaharap sa isang malabo o natatakpang imahe, ginagamit ng isang tao ang intuwisyon at lohika upang hulaan kung ano ito, kadalasan nang may mataas na katumpakan. Ang isang sistemang nakabase sa datos ay madaling 'malinlang' ng ilang mga pixel na hindi nailagay sa ibang lugar—na kilala bilang mga adversarial attack—na nagiging sanhi ng kumpiyansa nitong maling matukoy ang isang stop sign bilang isang refrigerator. Ang mga tao ay umaasa sa 'malaking larawan,' habang ang mga makina ay kadalasang labis na nakatuon sa mga granular na data point.
Pagkatuto at Ebolusyon
Ang persepsyon ng tao ay pino sa buong buhay niya ng pisikal na pakikipag-ugnayan sa mundo, na lumilikha ng malalim na pag-unawa sa pisika at mga tuntuning panlipunan. Natututo ang mga makina sa pamamagitan ng pagkakalantad sa mga naka-label na dataset gamit ang 'brute force'. Bagama't mas mabilis na natututo ang isang makina na makilala ang isang pusa kaysa sa pagtingin ng isang tao sa isang libong larawan, kulang ito sa biyolohikal na pag-unawa kung ano talaga ang isang pusa—isang buhay at humihingang nilalang.
Mga Kalamangan at Kahinaan
Emosyonal na Persepsyon
Mga Bentahe
+Napakahusay na kamalayang panlipunan
+Nauunawaan ang mga abstraktong konsepto
+Nangangailangan ng napakakaunting datos
+Mahusay sa improvisasyon
Nakumpleto
−Madaling magambala
−Naimpluwensyahan ng kalooban
−Kulang sa katumpakan sa matematika
−Madaling kapitan ng mga ilusyong optikal
Pananaw na Pinapatakbo ng Datos
Mga Bentahe
+Hindi kapani-paniwalang bilis ng pagproseso
+Walang kinikilingan dahil sa pagkapagod
+Nakakakita ng hindi nakikitang liwanag
+Nasusukat sa iba't ibang hardware
Nakumpleto
−Walang likas na sentido komun
−Mahina sa ingay ng datos
−Nangangailangan ng napakalaking enerhiya
−Kulang sa malikhaing interpretasyon
Mga Karaniwang Maling Akala
Alamat
Nakikita ng AI ang mundo nang eksakto tulad ng nakikita natin.
Katotohanan
Hindi 'nakikita' ng mga algorithm ang mga hugis; nakikita nila ang mga array ng mga numero. Natutukoy nila ang isang upuan nang walang anumang konsepto kung ano ang 'pag-upo' o kung para saan ang isang upuan.
Alamat
Ang mga kamera at AI ay 100% obhetibo.
Katotohanan
Dahil pinipili ng mga tao ang datos ng pagsasanay at itinatakda ang mga parametro, kadalasang nagmamana ang machine vision ng parehong mga pagkiling sa kultura at lahi na umiiral sa totoong mundo.
Alamat
Ang ating mga mata ay gumagana tulad ng isang video camera.
Katotohanan
Ang utak ay talagang 'nagha-hallucinate' ng malaking bahagi ng ating paningin batay sa mga inaasahan. Mayroon tayong blind spot sa bawat mata na palaging tinatakpan ng utak ng tinatayang datos.
Alamat
Ang paningin na batay sa datos ay palaging mas tumpak kaysa sa paningin ng tao.
Katotohanan
Sa mga kumplikado at hindi mahuhulaang kapaligiran tulad ng isang abalang lugar ng konstruksyon, ang kakayahan ng isang tao na mahulaan ang paggalaw batay sa kanyang layunin ay mas nakahihigit pa rin kaysa sa anumang kasalukuyang AI.
Mga Madalas Itanong
Tunay nga bang mauunawaan ng mga makina ang 'kagandahan'?
Kayang tukuyin ng mga makina ang 'kagandahan' batay sa mga mathematical ratio tulad ng Golden Mean o sa pamamagitan ng pagsusuri sa kung ano ang dating tinatawag ng mga tao na kaakit-akit. Gayunpaman, hindi nila nararanasan ang emosyonal na 'pagkamangha' o pisyolohikal na tugon na nararanasan ng isang tao. Para sa isang makina, ang kagandahan ay isa lamang mataas na marka sa isang partikular na estetikong sukat.
Bakit nagbabago ang mood ko sa pananaw ko sa mga bagay-bagay?
Ang kemikal na estado ng iyong utak, tulad ng pagtaas ng dopamine o cortisol, ay talagang nagbabago kung paano pinoproseso ng iyong visual cortex ang impormasyon. Kapag ikaw ay nai-stress, inuuna ng iyong utak ang mga galaw at banta na may mataas na contrast, kadalasang binabalewala ang magaganda o banayad na detalye na mapapansin mo kapag nakarelaks.
Mas ligtas ba ang computer vision kaysa sa paningin ng tao para sa pagmamaneho?
Mas mahusay ang computer vision sa pagpapanatili ng 360-degree na pananaw at pag-react sa bilis ng microsecond. Gayunpaman, mas mahusay pa rin ang mga tao sa pag-unawa sa mga 'edge case,' tulad ng pagkaunawa na ang isang bolang gumulong sa kalye ay malamang na nangangahulugang susundan ito ng isang bata. Ang pinakaligtas na mga sistema ay kasalukuyang gumagamit ng kombinasyon ng pareho.
Magkaiba ba ang pananaw ng iba't ibang kultura sa mundo?
Oo, iminumungkahi ng pananaliksik na ang ilang kultura ay mas nakatuon sa pangunahing bagay ng isang imahe, habang ang iba ay inuuna ang background at ang ugnayan sa pagitan ng mga bagay. Ang 'holistic' laban sa 'analytic' na pagtingin na ito ay isang perpektong halimbawa kung paano hinuhubog ng emosyon at pagpapalaki ang persepsyon.
Paano natutukoy ng mga makina ang mga emosyon kung hindi nila ito nararamdaman?
Gumagamit sila ng prosesong tinatawag na Facial Action Coding. Sa pamamagitan ng pagsukat ng distansya sa pagitan ng mga partikular na punto sa mukha—tulad ng mga sulok ng bibig o kilay—maaari nilang iugnay ang mga galaw na iyon sa mga label tulad ng 'masaya' o 'malungkot' batay sa milyun-milyong reperensyang larawan.
Maaari bang malinlang ng sining ang pananaw na hinihimok ng datos?
Talagang-talaga. Ang mga makatotohanang 'trompe l'oeil' na ipinintang larawan ay madaling makapagpapaniwala sa isang makina na ang isang patag na pader ay isang 3D na pasilyo. Dahil kulang ang mga ito sa pakiramdam ng pisikal na 'presensya,' hindi nila laging mapag-iba ang pagkakaiba ng isang tunay na bagay at isang nakakakumbinsing 2D na representasyon.
Ano ang 'semantic gap' sa machine vision?
Ang semantic gap ay ang kahirapan ng pagsasalin ng low-level pixel data tungo sa high-level human concepts. Maaaring sabihin sa iyo ng isang makina na mayroong 'red circle' (low-level), ngunit maaaring hindi nito maunawaan na ang red circle ay talagang isang 'danger' sign sa isang partikular na kultural na konteksto (high-level).
Makakakita kaya ang AI nang may 'pakiramdam'?
Ang tunay na pakiramdam ay nangangailangan ng isang biyolohikal na katawan at isang sistema ng nerbiyos na nakararanas ng mga kahihinatnan. Bagama't maaari nating gayahin ang mga tugon na ito gamit ang code, nananatili itong isang matematikal na pagtatantya. Hangga't hindi kayang 'matakot' ang isang AI para sa pag-iral nito o 'mahalin' ang isang tagalikha, ang pananaw nito ay mananatiling purong nakabatay sa datos.
Hatol
Gamitin ang emosyonal na persepsyon kapag kailangan mong maunawaan ang layunin, mga nuances, o mga dinamikong panlipunan na nangangailangan ng empatiya. Umasa sa data-driven na pananaw kapag kailangan mo ng high-speed na katumpakan, 24/7 na pagsubaybay, o ang pagtuklas ng mga teknikal na detalye na hindi kayang lutasin ng mata ng tao.