süni intellektnevrologiyakompüter görməpsixologiya
Emosiya ilə Görmə vs Məlumatla Görmə
Bu müqayisə bioloji qavrayış və alqoritmik analiz arasındakı fundamental uçurumu araşdırır. İnsanlar dünyanı şəxsi tarix, əhval-ruhiyyə və yaşamaq instinktləri prizmasından süzgəcdən keçirərkən, maşın görmə qabiliyyəti reallığı hiss və ya kontekstin ağırlığı olmadan təsnif etmək üçün riyazi piksel paylanmalarına və statistik ehtimala əsaslanır.
Seçilmişlər
İnsanlar görüntünün arxasındakı "niyə"ni, maşınlar isə "nə"ni görürlər.
Məlumatlara əsaslanan sistemlər yorulmadan eyni anda milyonlarla təsviri emal edə bilir.
Emosional vizyon mədəniyyətdən və şəxsi tərbiyədən çox təsirlənir.
Maşınlar aydın ölçümlərlə idarə olunan mühitlərdə daha dəqiq ola bilər.
Emosional Qavrayış nədir?
İnsanın vizual stimulları hiss, yaddaş və sosial nüansların mürəkkəb filtrləri vasitəsilə şərh etmək qabiliyyəti.
İnsan görmə qabiliyyəti amigdala ilə dərindən bağlıdır və bu, təhlükələri şüurlu şəkildə müəyyən etməzdən əvvəl onlara reaksiya verməyə imkan verir.
Beynimiz mikroskopik üz ifadələri və bədən dili vasitəsilə otaqdakı "atmosferi" və ya "gərginliyi" qəbul edə bilir.
Xatirələr tanış mühitlərdə rəngləri və formaları necə qavradığımızı fiziki olaraq dəyişdirə bilər.
Pareidolia fenomeni təsadüfi obyektlərdə üzlər kimi mənalı naxışlar görməyimizə səbəb olur.
Qorxu və ya xoşbəxtlik kimi emosional vəziyyətlər, sözün əsl mənasında, periferik görmə sahəmizi genişləndirə və ya daralda bilər.
Məlumatlara Əsaslanan Vizyon nədir?
İşığı ədədi massivlərə çevirmək və nümunələri müəyyən etməklə görüntülərin şərh edilməsinin hesablama prosesi.
Maşınlar şəkilləri qırmızı, yaşıl və mavi intensivlik dəyərlərini təmsil edən rəqəmlərin kütləvi şəbəkələri kimi görür.
Kompüter görmə qabiliyyəti insan gözü üçün tamamilə görünməyən infraqırmızı kimi işıq dalğa uzunluqlarını aşkar edə bilir.
Alqoritmlər, kənar istiqamətlərinin və teksturalarının riyazi ehtimalını hesablamaqla obyektləri müəyyən edir.
Süni sistemlər bir obyekti "görmür"; onlar məlumat nümunələrini milyonlarla təlim nümunəsindən ibarət kitabxana ilə uyğunlaşdırırlar.
Maşın görmə qabiliyyəti, neçə saat işləməsindən asılı olmayaraq, mükəmməl şəkildə sabit qalır.
Müqayisə Cədvəli
Xüsusiyyət
Emosional Qavrayış
Məlumatlara Əsaslanan Vizyon
Əsas Mexanizm
Neyron şəbəkələri və neyrokimya
Xətti cəbr və tensorlar
Təfsir tərzi
Kontekstual və povestə əsaslanan
Statistik və xüsusiyyətə əsaslanan
Tanınma Sürəti
Tanış anlayışlar üçün demək olar ki, dərhal
Avadanlıq və model ölçüsünə görə dəyişir
Etibarlılıq
Yorğunluğa və qərəzə məruz qalır
Təkrarlara dözümlüdür, amma "sağlam düşüncə"dən məhrumdur
Həssaslıq
Sosial və emosional işarələr üçün yüksək
Dəqiqəlik texniki sapmalar üçün yüksək
Əsas Məqsəd
Yaşamaq və sosial əlaqə
Optimallaşdırma və təsnifat
Ətraflı Müqayisə
Kontekstin Gücü
Dağınıq bir yataq otağına baxan bir insan "yorğunluq" və ya "məşğul bir həftə" görə bilər, maşın isə "atılmış parça" və "döşəmə müstəvisi" görür. Biz təbii olaraq gördüklərimiz ətrafında bir hekayə toxuyuruq və boşluqları doldurmaq üçün öz həyat təcrübələrimizdən istifadə edirik. Bunun əksinə olaraq, məlumatlara əsaslanan görmə hər kadrı təzə riyazi tapmaca kimi qəbul edir və tez-tez obyektlərin bir-biri ilə necə mənalı şəkildə əlaqəli olduğunu anlamaqda çətinlik çəkir.
Obyektiv Riyaziyyat və Subyektiv Hiss
Maşınlar izdihamlı bir meydanda tam 452 nəfəri saymaq və ya məsafədən müəyyən bir 12 rəqəmli seriya nömrəsini müəyyən etmək kimi məqsədə çatmaqda üstündürlər. Lakin onlar həmin izdihamın "əhval-ruhiyyəsini" hiss edə bilmirlər. İnsan alqoritmin qaçıracağı bir etirazda gizli bir təşvişi dərhal hiss edə bilər, çünki fiziki hərəkətlər hələ proqramlaşdırılmış "zorakılıq" nümunəsinə uyğun gəlmir.
Qeyri-müəyyənliyin idarə edilməsi
İnsan bulanıq və ya qaranlıq bir görüntü ilə qarşılaşdıqda, onun nə olduğunu təxmin etmək üçün intuisiya və məntiqdən istifadə edir və çox vaxt yüksək dəqiqliklə. Məlumatlara əsaslanan bir sistem, bir neçə səhv yerləşdirilmiş piksel - düşmən hücumları kimi tanınan - tərəfindən asanlıqla "aldana" bilər ki, bu da onun dayanma işarəsini soyuducu kimi inamla səhv təyin etməsinə səbəb olur. İnsanlar "böyük mənzərəyə" güvənirlər, maşınlar isə çox vaxt dənəvər məlumat nöqtələrinə həddindən artıq diqqət yetirirlər.
Öyrənmə və Təkamül
İnsan qavrayışı dünya ilə fiziki qarşılıqlı əlaqənin ömrü boyu təkmilləşdirilir və bu da fizika və sosial qaydaları dərindən anlamağa imkan verir. Maşınlar etiketlənmiş məlumat dəstlərinə "kobud güc" təsiri ilə öyrənirlər. Maşın bir pişiyi minlərlə fotoya baxan insandan daha tez tanıya bilsə də, pişiyin əslində nə olduğunu - canlı, nəfəs alan bir varlıq olduğunu bioloji olaraq anlamır.
Üstünlüklər və Eksikliklər
Emosional Qavrayış
Üstünlüklər
+Üstün sosial maarifləndirmə
+Mücərrəd anlayışları başa düşür
+Çox az məlumat tələb edir
+İmprovizasiyada əladır
Saxlayıcı
−Asanlıqla diqqəti yayındırır
−Əhval-ruhiyyədən təsirlənib
−Riyazi dəqiqlikdən məhrumdur
−Optik illüziyalara meylli
Məlumatlara Əsaslanan Vizyon
Üstünlüklər
+İnanılmaz emal sürəti
+Yorğunluqdan qərəzsiz
+Görünməyən işığı aşkarlayır
+Aparat təminatı üzrə miqyaslana bilən
Saxlayıcı
−Daxili sağlam düşüncə yoxdur
−Məlumat səs-küyünə qarşı həssasdır
−Böyük enerji tələb edir
−Yaradıcı təfsir yoxdur
Yaygın yanlış anlaşılmalar
Əfsanə
Süni intellekt dünyanı bizim gördüyümüz kimi görür.
Həqiqət
Alqoritmlər formaları "görmürlər"; onlar ədədlər massivlərini görürlər. Onlar "oturmağın" nə olduğunu və ya stulun nə üçün istifadə olunduğunu heç bir təsəvvür etmədən bir stulu müəyyən edə bilərlər.
Əfsanə
Kameralar və süni intellekt 100% obyektivdir.
Həqiqət
İnsanlar təlim məlumatlarını seçib parametrləri təyin etdiyindən, maşın görmə qabiliyyəti çox vaxt real dünyada mövcud olan eyni mədəni və irqi qərəzləri miras alır.
Əfsanə
Gözlərimiz videokamera kimi işləyir.
Həqiqət
Beyin əslində görmə qabiliyyətimizin böyük bir hissəsini gözləntilərə əsasən "hallüsinasiya edir". Hər gözümüzdə beynin daim təxmini məlumatlarla doldurduğu bir kor nöqtə var.
Əfsanə
Məlumatlara əsaslanan görmə həmişə insandan daha dəqiqdir.
Həqiqət
Tikinti sahəsi kimi mürəkkəb, gözlənilməz mühitlərdə insanın niyyətə əsaslanaraq hərəkəti proqnozlaşdırmaq qabiliyyəti hələ də mövcud süni intellektdən daha üstündür.
Tez-tez verilən suallar
Maşınlar həqiqətən "gözəlliyi" anlaya biləcəkmi?
Maşınlar "gözəlliyi" Qızıl Orta kimi riyazi nisbətlərə və ya insanların əvvəllər cəlbedici adlandırdıqları şeyləri təhlil etməklə müəyyən edə bilərlər. Lakin, onlar insanın hiss etdiyi emosional "heyranlığı" və ya fizioloji reaksiyanı yaşamırlar. Maşın üçün gözəllik sadəcə müəyyən bir estetik şkala üzrə yüksək baldır.
Niyə əhvalım şeylərə baxışımı dəyişir?
Beyninizin kimyəvi vəziyyəti, məsələn, dopamin və ya kortizolun artması, vizual korteksinizin məlumatları necə emal etdiyini dəyişir. Stressli olduğunuz zaman beyniniz yüksək kontrastlı hərəkətlərə və təhdidlərə üstünlük verir, çox vaxt rahatlandığınız zaman fərq edəcəyiniz gözəl və ya incə detalları görməzdən gəlir.
Kompüter görmə qabiliyyəti maşın sürmək üçün insan görmə qabiliyyətindən daha təhlükəsizdirmi?
Kompüter görmə qabiliyyəti 360 dərəcəlik mənzərəni qorumaqda və mikrosaniyə sürəti ilə reaksiya verməkdə daha yaxşıdır. Bununla belə, insanlar hələ də "kənar halları" anlamaqda daha yaxşıdırlar, məsələn, küçəyə yuvarlanan topun uşağın onu izləmək üzrə olduğunu anlamaqda. Hal-hazırda ən təhlükəsiz sistemlər hər ikisinin kombinasiyasından istifadə edir.
Fərqli mədəniyyətlər dünyanı fərqli görürmü?
Bəli, tədqiqatlar göstərir ki, bəzi mədəniyyətlər daha çox obrazın mərkəzi obyektinə diqqət yetirir, digərləri isə arxa plana və obyektlər arasındakı əlaqəyə üstünlük verir. Bu “vahid” və “analitik” görmə qabiliyyəti emosiya və tərbiyənin qavrayışı necə formalaşdırdığına dair mükəmməl bir nümunədir.
Maşınlar hiss etmədikləri halda onları necə müəyyən edirlər?
Onlar Üz Fəaliyyəti Kodlaşdırması adlanan bir prosesdən istifadə edirlər. Üzdəki müəyyən nöqtələr - məsələn, ağız küncləri və ya qaşlar arasındakı məsafəni ölçməklə, milyonlarla istinad fotoşəklə bu hərəkətləri "xoşbəxt" və ya "kədərli" kimi etiketlərlə əlaqələndirə bilirlər.
Məlumatlara əsaslanan vizyonu incəsənət aldada bilərmi?
Əlbəttə. Yüksək dərəcədə realistik "trompe l'oeil" rəsmləri, maşını asanlıqla düz bir divarın 3D dəhliz olduğunu düşünməyə vadar edə bilər. Fiziki "varlıq" hissi olmadığı üçün həmişə real bir obyektlə inandırıcı 2D təsviri ayırd edə bilmirlər.
Maşın görməsində "semantik boşluq" nədir?
Semantik boşluq, aşağı səviyyəli piksel məlumatlarını yüksək səviyyəli insan anlayışlarına çevirməyin çətinliyidir. Maşın sizə "qırmızı dairə" (aşağı səviyyə) olduğunu deyə bilər, lakin qırmızı dairənin müəyyən bir mədəni kontekstdə (yüksək səviyyə) əslində "təhlükə" işarəsi olduğunu başa düşməyə bilər.
Süni intellekt nə vaxtsa "hisslə" görəcəkmi?
Həqiqi hiss bioloji bir bədən və nəticələr yaşayan sinir sistemi tələb edir. Bu reaksiyaları kodla simulyasiya edə bilsək də, bu, riyazi bir təxmini olaraq qalır. Süni intellekt mövcudluğundan "qorxuya" və ya yaradıcısını "sevməyə" qədər, onun vizyonu tamamilə məlumatlara əsaslanacaq.
Hökm
Empatiya tələb edən niyyəti, nüansları və ya sosial dinamikanı anlamaq lazım olduqda emosional qavrayışdan istifadə edin. Yüksək sürətli dəqiqliyə, 24/7 monitorinqə və ya insan gözünün sadəcə olaraq ayırd edə bilmədiyi texniki detalların aşkarlanmasına ehtiyacınız olduqda məlumatlara əsaslanan görmə qabiliyyətinə etibar edin.