Τα μοντέλα μηχανικής όρασης μέσω υπολογιστή που είναι γνωστά ως συνελικτικά νευρωνικά δίκτυα μπορούν να εκπαιδευτούν για την αναγνώριση αντικειμένων με τόση ακρίβεια, σχεδόν όπως και οι άνθρωποι. Ωστόσο, αυτά τα μοντέλα έχουν ένα σημαντικό ελάττωμα: Κάποιες πολύ μικρές αλλαγές σε μια εικόνα, η οποίες θα ήταν σχεδόν ανεπαίσθητες στο ανθρώπινο μάτι, μπορεί να τους εξαπατήσει και να κάνουν τρομερά λάθη, όπως η ταξινόμηση μιας γάτας ως δέντρο.
Μια ομάδα νευροεπιστημόνων από το MIT, το Πανεπιστήμιο του Χάρβαρντ και το ερευνητικό τμήμα της IBM έχουν αναπτύξει έναν τρόπο για την επίλυση αυτής της σοβαρής δυσλειτουργίας, προσθέτοντας σε αυτά τα μοντέλα μία νέα παράμετρο που έχει σχεδιαστεί να μιμείται το ανθρώπινο οπτικό σύστημα επεξεργασίας που είναι συνδεδεμένο με τον εγκέφαλο. Σε μια νέα μελέτη, έδειξαν ότι αυτή η συνισταμένη βελτίωσε σημαντικά το ποσοστό ακριβείας των μοντέλων έναντι αυτού του τύπου λάθους.
Τα συνελικτικά νευρωνικά δίκτυα (convolutional neural networks) χρησιμοποιούνται συχνά σε εφαρμογές τεχνητής νοημοσύνης, όπως οχήματα που λειτουργούν με αυτόνομη οδήγηση χωρίς οδηγό, αυτοματοποιημένες γραμμές συναρμολόγησης σε εργοστάσια και ιατρικά διαγνωστικά κέντρα για τον εντοπισμό διαφόρων ασθενειών. Ο Joel Dapello, ο οποίος είναι κύριος συγγραφέας της μελέτης, ανέφερε ότι «η εφαρμογή της νέας προσέγγισης μας θα μπορούσε ενδεχομένως να καταστήσει αυτά τα συστήματα λιγότερο επιρρεπή σε λάθη και παράλληλα να παρομοιάζουν τις ικανότητες της ανθρώπινης όρασης».
Μίμηση του εγκεφάλου
Η αναγνώριση αντικειμένων είναι μία από τις κυριότερες λειτουργίες του οπτικού μας συστήματος. Όλες οι οπτικές πληροφορίες μεταφέρονται από το μάτι στον εγκέφαλο σε μόλις ένα κλάσμα του δευτερολέπτου, και μετέπειτα οι νευρώνες επεξεργάζονται αυτές τις πληροφορίες για την ταξινόμηση των αντικειμένων μέσα στο μυαλό. Σε κάθε στάδιο αυτών των διεργασιών, ο εγκέφαλος εκτελεί διαφορετικούς τύπους επεξεργασίας έως ότου το άτομο καταλήξει σε κάποιο συμπέρασμα.
Κατά την τελευταία δεκαετία, οι ερευνητές προσπαθούν να δημιουργήσουν μοντέλα υπολογιστών που να μπορούν να αναγνωρίσουν αντικείμενα όπως το ανθρώπινο οπτικό σύστημα. Τα σημερινά κορυφαία συστήματα μηχανικής όρασης καθοδηγούνται από τις τρέχουσες γνώσεις μας για την οπτική επεξεργασία του εγκεφάλου. Ωστόσο, οι νευροεπιστήμονες εξακολουθούν να μην γνωρίζουν αρκετά πράγματα αναφορικά με το πως συνδέεται η οπτική ροή με τον εγκέφαλο για να χτίσουν ένα μοντέλο που να το μιμείται ακριβώς, έτσι δανείζονται τεχνικές από το πεδίο της μηχανικής μάθησης για να εκπαιδεύσουν τα συνελικτικά νευρωνικά δίκτυα σε ένα συγκεκριμένο σύνολο εργασιών. Χρησιμοποιώντας αυτήν τη διαδικασία, ένα μοντέλο μπορεί να μάθει να αναγνωρίζει αντικείμενα, αφού πρώτα εκπαιδευτεί σε εκατομμύρια εικόνες.