Αυτή η σύγκριση εξετάζει το θεμελιώδες χάσμα μεταξύ της βιολογικής αντίληψης και της αλγοριθμικής ανάλυσης. Ενώ οι άνθρωποι φιλτράρουν τον κόσμο μέσα από ένα πρίσμα προσωπικής ιστορίας, διάθεσης και ενστίκτων επιβίωσης, η μηχανική όραση βασίζεται σε μαθηματικές κατανομές εικονοστοιχείων και στατιστική πιθανότητα για να κατηγοριοποιήσει την πραγματικότητα χωρίς το βάρος του συναισθήματος ή του πλαισίου.
הדגשים
Οι άνθρωποι βλέπουν το «γιατί» πίσω από μια εικόνα, ενώ οι μηχανές βλέπουν το «τι».
Τα συστήματα που βασίζονται σε δεδομένα μπορούν να επεξεργάζονται εκατομμύρια εικόνες ταυτόχρονα χωρίς να κουράζονται.
Η συναισθηματική όραση επηρεάζεται σε μεγάλο βαθμό από τον πολιτισμό και την προσωπική ανατροφή.
Τα μηχανήματα μπορούν να είναι πολύ πιο ακριβή σε ελεγχόμενα περιβάλλοντα με σαφείς μετρήσεις.
מה זה Συναισθηματική Αντίληψη?
Η ανθρώπινη ικανότητα να ερμηνεύει οπτικά ερεθίσματα μέσα από τα πολύπλοκα φίλτρα του συναισθήματος, της μνήμης και των κοινωνικών αποχρώσεων.
Η ανθρώπινη όραση είναι βαθιά συνδεδεμένη με την αμυγδαλή, επιτρέποντάς μας να αντιδρούμε στις απειλές προτού τις εντοπίσουμε συνειδητά.
Ο εγκέφαλός μας μπορεί να αντιληφθεί την «ατμόσφαιρα» ή την «ένταση» σε ένα δωμάτιο μέσω μικροσκοπικών σημαδιών του προσώπου και της γλώσσας του σώματος.
Οι αναμνήσεις μπορούν να αλλάξουν φυσικά τον τρόπο που αντιλαμβανόμαστε τα χρώματα και τα σχήματα σε οικεία περιβάλλοντα.
Το φαινόμενο της παρειδωλίας μας κάνει να βλέπουμε νοήμονα μοτίβα, όπως πρόσωπα, σε τυχαία αντικείμενα.
Συναισθηματικές καταστάσεις όπως ο φόβος ή η ευτυχία μπορούν κυριολεκτικά να διευρύνουν ή να συστέλλουν το πεδίο της περιφερειακής όρασής μας.
מה זה Όραμα που βασίζεται σε δεδομένα?
Η υπολογιστική διαδικασία ερμηνείας εικόνων μετατρέποντας το φως σε αριθμητικούς πίνακες και αναγνωρίζοντας μοτίβα.
Οι μηχανές βλέπουν τις εικόνες ως τεράστια πλέγματα αριθμών που αντιπροσωπεύουν τιμές έντασης κόκκινου, πράσινου και μπλε.
Η υπολογιστική όραση μπορεί να ανιχνεύσει μήκη κύματος φωτός, όπως το υπέρυθρο, που είναι εντελώς αόρατα στο ανθρώπινο μάτι.
Οι αλγόριθμοι αναγνωρίζουν αντικείμενα υπολογίζοντας τη μαθηματική πιθανότητα των προσανατολισμών των ακμών και των υφών.
Τα τεχνητά συστήματα δεν «βλέπουν» ένα αντικείμενο· αντιστοιχίζουν μοτίβα δεδομένων με μια βιβλιοθήκη εκατομμυρίων παραδειγμάτων εκπαίδευσης.
Η μηχανική όραση παραμένει απόλυτα συνεπής ανεξάρτητα από το πόσες ώρες λειτουργεί.
טבלת השוואה
תכונה
Συναισθηματική Αντίληψη
Όραμα που βασίζεται σε δεδομένα
Βασικός Μηχανισμός
Νευρωνικά δίκτυα και νευροχημεία
Γραμμική άλγεβρα και τανσόροι
Στυλ ερμηνείας
Βασισμένο στο πλαίσιο και την αφήγηση
Στατιστικά και βασισμένα σε χαρακτηριστικά
Ταχύτητα Αναγνώρισης
Σχεδόν άμεσα για οικείες έννοιες
Διαφέρει ανάλογα με το υλικό και το μέγεθος του μοντέλου
Αξιοπιστία
Υπόκειται σε κόπωση και προκατάληψη
Ανεκτικό στην επανάληψη αλλά στερείται «κοινής λογικής»
Ευαισθησία
Υψηλό για κοινωνικά και συναισθηματικά ερεθίσματα
Υψηλό για ελάχιστες τεχνικές αποκλίσεις
Πρωταρχικός στόχος
Επιβίωση και κοινωνική σύνδεση
Βελτιστοποίηση και ταξινόμηση
השוואה מפורטת
Η Δύναμη του Συμφραζομένου
Ένας άνθρωπος που κοιτάζει ένα ακατάστατο υπνοδωμάτιο μπορεί να δει «εξάντληση» ή «μια πολυάσχολη εβδομάδα», ενώ μια μηχανή βλέπει «πεταμένο ύφασμα» και «επίπεδο δαπέδου». Φυσικά, υφαίνουμε μια ιστορία γύρω από αυτό που βλέπουμε, χρησιμοποιώντας τις δικές μας εμπειρίες ζωής για να συμπληρώσουμε τα κενά. Αντίθετα, η όραση που βασίζεται σε δεδομένα αντιμετωπίζει κάθε καρέ ως ένα νέο μαθηματικό παζλ, συχνά αγωνιζόμενο να κατανοήσει πώς τα αντικείμενα σχετίζονται μεταξύ τους με ουσιαστικό τρόπο.
Αντικειμενικά Μαθηματικά εναντίον Υποκειμενικού Συναισθήματος
Οι μηχανές υπερέχουν σε αυτόν τον στόχο, όπως το να μετρήσουν ακριβώς 452 άτομα σε μια γεμάτη πλατεία ή να αναγνωρίσουν έναν συγκεκριμένο 12ψήφιο σειριακό αριθμό από απόσταση. Ωστόσο, δεν μπορούν να νιώσουν την «αύρα» αυτού του πλήθους. Ένας άνθρωπος μπορεί να αισθανθεί αμέσως μια υποκείμενη αναστάτωση σε μια διαμαρτυρία που ένας αλγόριθμος θα έχανε επειδή οι φυσικές κινήσεις δεν ταιριάζουν ακόμη με ένα προγραμματισμένο μοτίβο «βίας».
Διαχείριση Ασάφειας
Όταν ένας άνθρωπος βρίσκεται αντιμέτωπος με μια θολή ή σκοτεινή εικόνα, χρησιμοποιεί τη διαίσθηση και τη λογική για να μαντέψει τι μπορεί να είναι, συχνά με υψηλή ακρίβεια. Ένα σύστημα που βασίζεται σε δεδομένα μπορεί εύκολα να «ξεγελαστεί» από μερικά άστοχα εικονοστοιχεία —γνωστά ως επιθέσεις αντιπάλων— που το κάνουν να αναγνωρίζει με σιγουριά ένα σήμα στοπ ως ψυγείο. Οι άνθρωποι βασίζονται στη «συνολική εικόνα», ενώ οι μηχανές συχνά επικεντρώνονται υπερβολικά σε λεπτομερή σημεία δεδομένων.
Μάθηση και Εξέλιξη
Η ανθρώπινη αντίληψη βελτιώνεται κατά τη διάρκεια μιας ζωής φυσικής αλληλεπίδρασης με τον κόσμο, δημιουργώντας μια βαθιά κατανόηση της φυσικής και των κοινωνικών κανόνων. Οι μηχανές μαθαίνουν μέσω της έκθεσης σε «ωμής βίας» σε σύνολα δεδομένων με ετικέτες. Ενώ μια μηχανή μπορεί να μάθει να αναγνωρίζει μια γάτα πιο γρήγορα από ό,τι ένας άνθρωπος μπορεί να δει χίλιες φωτογραφίες, της λείπει η βιολογική κατανόηση του τι είναι στην πραγματικότητα μια γάτα - ένα ζωντανό, αναπνεύσιμο πλάσμα.
יתרונות וחסרונות
Συναισθηματική Αντίληψη
יתרונות
+Ανώτερη κοινωνική συνείδηση
+Κατανοεί αφηρημένες έννοιες
+Απαιτεί πολύ λίγα δεδομένα
+Άριστος στον αυτοσχεδιασμό
המשך
−Αποσπάται εύκολα η προσοχή του
−Επηρεάζεται από τη διάθεση
−Δεν έχει μαθηματική ακρίβεια
−Επιρρεπής σε οπτικές ψευδαισθήσεις
Όραμα που βασίζεται σε δεδομένα
יתרונות
+Απίστευτη ταχύτητα επεξεργασίας
+Αμερόληπτη από την εξάντληση
+Ανιχνεύει μη ορατό φως
+Επεκτάσιμο σε όλο το υλικό
המשך
−Καμία εγγενής κοινή λογική
−Ευάλωτο σε θόρυβο δεδομένων
−Απαιτεί τεράστια ενέργεια
−Στερείται δημιουργικής ερμηνείας
תפיסות מוטעות נפוצות
מיתוס
Η Τεχνητή Νοημοσύνη βλέπει τον κόσμο ακριβώς όπως εμείς.
מציאות
Οι αλγόριθμοι δεν «βλέπουν» σχήματα. Βλέπουν πίνακες αριθμών. Μπορούν να αναγνωρίσουν μια καρέκλα χωρίς να έχουν καμία ιδέα για το τι είναι το «κάθισμα» ή για ποιο σκοπό χρησιμοποιείται μια καρέκλα.
מיתוס
Οι κάμερες και η τεχνητή νοημοσύνη είναι 100% αντικειμενικές.
מציאות
Επειδή οι άνθρωποι επιλέγουν τα δεδομένα εκπαίδευσης και ορίζουν τις παραμέτρους, η μηχανική όραση συχνά κληρονομεί τις ίδιες πολιτισμικές και φυλετικές προκαταλήψεις που υπάρχουν στον πραγματικό κόσμο.
מיתוס
Τα μάτια μας λειτουργούν σαν βιντεοκάμερα.
מציאות
Ο εγκέφαλος στην πραγματικότητα «παραισθάνεται» μεγάλο μέρος της όρασής μας με βάση τις προσδοκίες. Έχουμε ένα τυφλό σημείο σε κάθε μάτι το οποίο ο εγκέφαλος συνεχώς καλύπτει με εκτιμώμενα δεδομένα.
מיתוס
Η όραση που βασίζεται σε δεδομένα είναι πάντα πιο ακριβής από την ανθρώπινη.
מציאות
Σε πολύπλοκα, απρόβλεπτα περιβάλλοντα, όπως ένα πολυσύχναστο εργοτάξιο, η ικανότητα ενός ανθρώπου να προβλέπει την κίνηση με βάση την πρόθεση εξακολουθεί να είναι πολύ ανώτερη από οποιαδήποτε τρέχουσα τεχνητή νοημοσύνη.
שאלות נפוצות
Μπορούν ποτέ οι μηχανές να κατανοήσουν πραγματικά την «ομορφιά»;
Οι μηχανές μπορούν να αναγνωρίσουν την «ομορφιά» με βάση μαθηματικές αναλογίες όπως η Χρυσή Τομή ή αναλύοντας τι οι άνθρωποι έχουν προηγουμένως χαρακτηρίσει ως ελκυστικό. Ωστόσο, δεν βιώνουν το συναισθηματικό «δέος» ή τη φυσιολογική αντίδραση που βιώνει ένας άνθρωπος. Για μια μηχανή, η ομορφιά είναι απλώς μια υψηλή βαθμολογία σε μια συγκεκριμένη αισθητική κλίμακα.
Γιατί αλλάζει η διάθεσή μου στον τρόπο που βλέπω τα πράγματα;
Η χημική κατάσταση του εγκεφάλου σας, όπως μια απότομη αύξηση της ντοπαμίνης ή της κορτιζόλης, αλλάζει στην πραγματικότητα τον τρόπο με τον οποίο ο οπτικός φλοιός σας επεξεργάζεται τις πληροφορίες. Όταν είστε αγχωμένοι, ο εγκέφαλός σας δίνει προτεραιότητα σε κινήσεις υψηλής αντίθεσης και απειλές, αγνοώντας συχνά όμορφες ή ανεπαίσθητες λεπτομέρειες που θα παρατηρούσατε όταν ήσασταν χαλαροί.
Είναι η όραση μέσω υπολογιστή ασφαλέστερη από την ανθρώπινη όραση για οδήγηση;
Η όραση υπολογιστή είναι καλύτερη στη διατήρηση μιας ορατότητας 360 μοιρών και στην αντίδραση με ταχύτητα μικροδευτερολέπτων. Ωστόσο, οι άνθρωποι εξακολουθούν να είναι καλύτεροι στην κατανόηση των «περιπτώσεων που βρίσκονται σε ακραίες συνθήκες», όπως η συνειδητοποίηση ότι μια μπάλα που κυλάει στον δρόμο πιθανότατα σημαίνει ότι ένα παιδί πρόκειται να την ακολουθήσει. Τα ασφαλέστερα συστήματα χρησιμοποιούν σήμερα έναν συνδυασμό και των δύο.
Βλέπουν οι διαφορετικοί πολιτισμοί τον κόσμο διαφορετικά;
Ναι, η έρευνα δείχνει ότι ορισμένοι πολιτισμοί επικεντρώνονται περισσότερο στο κεντρικό αντικείμενο μιας εικόνας, ενώ άλλοι δίνουν προτεραιότητα στο φόντο και τη σχέση μεταξύ των αντικειμένων. Αυτή η «ολιστική» έναντι της «αναλυτικής» θεώρησης είναι ένα τέλειο παράδειγμα του πώς το συναίσθημα και η ανατροφή διαμορφώνουν την αντίληψη.
Πώς οι μηχανές αναγνωρίζουν τα συναισθήματα αν δεν τα αισθάνονται;
Χρησιμοποιούν μια διαδικασία που ονομάζεται Κωδικοποίηση Δράσης Προσώπου. Μετρώντας την απόσταση μεταξύ συγκεκριμένων σημείων σε ένα πρόσωπο — όπως οι γωνίες του στόματος ή τα φρύδια — μπορούν να συσχετίσουν αυτές τις κινήσεις με ετικέτες όπως «χαρούμενος» ή «λυπημένος» με βάση εκατομμύρια φωτογραφίες αναφοράς.
Μπορεί η όραση που βασίζεται σε δεδομένα να ξεγελαστεί από την τέχνη;
Απολύτως. Οι εξαιρετικά ρεαλιστικοί πίνακες με την τεχνική «trompe l'oeil» μπορούν εύκολα να ξεγελάσουν μια μηχανή κάνοντάς την να νομίζει ότι ένας επίπεδος τοίχος είναι ένας τρισδιάστατος διάδρομος. Επειδή δεν έχουν την αίσθηση της φυσικής «παρουσίας», δεν μπορούν πάντα να διακρίνουν μεταξύ ενός πραγματικού αντικειμένου και μιας πειστικής δισδιάστατης αναπαράστασης.
Τι είναι το «σημασιολογικό κενό» στην μηχανική όραση;
Το σημασιολογικό κενό είναι η δυσκολία μετάφρασης δεδομένων pixel χαμηλού επιπέδου σε ανθρώπινες έννοιες υψηλού επιπέδου. Μια μηχανή μπορεί να σας πει ότι υπάρχει ένας «κόκκινος κύκλος» (χαμηλού επιπέδου), αλλά μπορεί να μην καταλάβει ότι ο κόκκινος κύκλος είναι στην πραγματικότητα ένα σημάδι «κινδύνου» σε ένα συγκεκριμένο πολιτισμικό πλαίσιο (υψηλού επιπέδου).
Θα δει ποτέ η Τεχνητή Νοημοσύνη με «αίσθηση»;
Το αληθινό συναίσθημα απαιτεί ένα βιολογικό σώμα και ένα νευρικό σύστημα που βιώνει συνέπειες. Ενώ μπορούμε να προσομοιώσουμε αυτές τις αντιδράσεις με κώδικα, παραμένει μια μαθηματική προσέγγιση. Μέχρι να μπορέσει μια Τεχνητή Νοημοσύνη να «φοβάται» για την ύπαρξή της ή να «αγαπήσει» έναν δημιουργό, το όραμά της θα παραμείνει αποκλειστικά βασισμένο σε δεδομένα.
פסק הדין
Χρησιμοποιήστε τη συναισθηματική αντίληψη όταν χρειάζεται να κατανοήσετε την πρόθεση, τις λεπτές αποχρώσεις ή την κοινωνική δυναμική που απαιτούν ενσυναίσθηση. Βασιστείτε στην όραση που βασίζεται σε δεδομένα όταν χρειάζεστε ακρίβεια υψηλής ταχύτητας, παρακολούθηση 24/7 ή την ανίχνευση τεχνικών λεπτομερειών που το ανθρώπινο μάτι απλά δεν μπορεί να επιλύσει.