Το φθηνότερο σύστημα αναγνώρισης νευμάτων

Το φθηνότερο σύστημα αναγνώρισης νευμάτων

Δύο ερευνητές του MIT δημιούργησαν το φθηνότερο σύστημα αναγνώρισης νευμάτων, δηλαδή, χειρισμού του υπολογιστή όπως έγινε γνωστό κυρίως από την ταινία Minority Report, όπου ο Tom Cruise έλεγχε με κινήσεις των χεριών έναν υπολογιστή.

Μέχρι σήμερα έχουν εμφανιστεί προσεγγίσεις που βασίζονται σε πολλές κάμερες παράλληλα, σε υπερήχους, σε, σε, σε… Για αυτό και φαίνεται αστείο που η δική τους προσέγγιση απαιτεί μια οποιαδήποτε κάμερα, ακόμη και την webcam που υπάρχει εξαρχής στα περισσότερα laptops, και ένα ζευγάρι χρωματιστά γάντια. Αν και έχουμε ξαναδεί παραπλήσιες προσεγγίσεις αναγνώρισης νευμάτων από υπολογιστή, όλες βασίζονταν σε ένα αντικείμενο με ένα έντονο χρώμα, το οποίο ο υπολογιστής μπορούσε μεν να ανιχνεύσει, αλλά η πληροφορία περιοριζόταν σε δύο διαστάσεις: ο υπολογιστής μπορούσε να δει που βρισκόταν ένα χρωματιστό αντικείμενο οριζόντια και κάθετα, αλλά αφού δεν είχε δεύτερο σημείο αναφοράς πέρα από αυτό, δεν μπορούσε να καταλάβει και το “βάθος” – ή, καλύτερα, την απόσταση του από την οθόνη. Για να το κάνει αυτό, “έκλεβε”, υπολογίζοντας το μέγεθος του αντικειμένου. Ακόμη και έτσι, ο υπολογιστής “καταλάβαινε” ένα, και μόνο, “σημείο στο χώρο” – φαντασθείτε το αντίστοιχο του να έχουμε… βγάλει το “βελάκι” από την οθόνη και να μπορούμε να το κουνήσουμε μπροστά στην οθόνη. Καλό, χρήσιμο, αλλά δεν είναι “χειρισμός με νεύματα”.

Η προσέγγιση που είδαμε στο Minority Report, και αυτή που όλοι προσπαθούν να πετύχουν, δεν θα καταλαβαίνει μόνο τη θέση “ενός σημείου” -π.χ. μονάχα… ενός δακτύλου- στο χώρο, αλλά τόσο τη θέση όσο και τη “στάση” του κάθε χεριού. Διαφορετικές θέσεις στα δυο χέρια και στα δάχτυλα θα μπορούν να μεταφράζονται σε διαφορετική εντολή – π.χ. όταν κανείς “δείχνει με το δείκτη του χεριού” προς την οθόνη, ο υπολογιστής θα μπορεί να το ερμηνεύσει ως “ΟΚ”, ενώ όταν… κουνά όλη την παλάμη αριστερά-δεξιά, να αντιστοιχήσει την κίνηση σε “Άκυρο”. Κάτι τέτοιο προϋποθέτει πως ο υπολογιστής θα μπορεί, με κάποιο τρόπο, να καταλάβει τη θέση και στάση όλου του χεριού στο χώρο.

Η αντιστοίχιση των ηθοποιών με εφέ στις μεγάλες παραγωγές του Hollywood γίνεται με τον εξής τρόπο: οι ηθοποιοί φορούν μια στολή που φέρει διαφορετικούς αισθητήρες σε διαφορετικά σημεία του σώματος τους. Κάθε αισθητήρας συνοδεύεται από ξεχωριστή “ταυτότητα”, και η θέση του στο χώρο μεταφέρεται σε έναν υπολογιστή μέσα από πολλές κάμερες. Μια κάμερα μπορεί, π.χ., να μεταφέρει τις διαστάσεις Χ και Ψ, μια άλλη της Χ και Ζ και μια τρίτη τις Ψ και Ζ – έτσι ο υπολογιστής συνδυάζει τις πληροφορίες από όλες τις κάμερες και καταλαβαίνει “που βρίσκεται ο αισθητήρας στις τρεις διαστάσεις” και, άρα, το αντίστοιχο σημείο του σώματος του ηθοποιού στο χώρο. Η προσέγγιση των δυο ερευνητών του MIT απαιτεί, απλά, το προαναφερθέν ζευγάρι χρωματιστών γαντιών.

Αναγνωρίζοντας πως το να χρησιμοποιεί κανείς περισσότερες από δυο κάμερες και ένα σεβαστό σύνολο διαφορετικών αισθητήρων (τουλάχιστον έναν για κάθε… δάχτυλο και άλλους δυο, έναν για κάθε χέρι), ο Robert Wang και ο Jovan Popovic χρησιμοποιούν δυο γάντια, καθένα από τα οποία είναι χωρισμένο σε χρωματιστά κομμάτια. Η άκρη κάθε δαχτύλου έχει διαφορετικό χρώμα από τα υπόλοιπα, και το ίδιο συμβαίνει για το υπόλοιπο δάχτυλο, για το άνω και κάτω τμήμα της παλάμης, για την “πίσω” πλευρά του χεριού… Κάθε γάντι μοιάζει με ένα παζλ από χρώματα.

Το σημείο, λοιπόν, στο οποίο “κλέβουν” είναι πως ο υπολογιστής δεν αναγνωρίζει πραγματικά τη θέση των χεριών: αντίθετα, διαθέτει μια βάση δεδομένων με 40 πιθανές “στάσεις” των χεριών: το ένα δάχτυλο “διπλωμένο”, το χέρι κλειστό σαν γροθιά, ο αντίχειρας και ο δείκτης τεντωμένα κ.λπ. Κάθε “στάση” του χεριού είναι καταγεγραμμένη με χρωματική κωδικοποίηση. Έτσι, όταν ο υπολογιστής “βλέπει” μέσω μιας απλής κάμερας το χέρι, μπορεί με τον κλασσικό τρόπο που είχαν οι παραπλήσιες προσεγγίσεις να αναγνωρίσει τη θέση της σε δυο διαστάσεις. Καταφεύγοντας στη χρωματική βάση δεδομένων του, συγκρίνει τη “στάση” του χεριού και καταλαβαίνει ποια είναι και η… τρίτη διάσταση, δίχως να χρειάζεται να προσπαθεί να την υπολογίσει.

Φυσικά, το όλο σύστημα δεν είναι τέλειο, και έχει και τα μειονεκτήματα του. Πρώτο από αυτά, το ότι η βάση δεδομένων του περιορίζεται (για την ώρα) σε 40 “στάσεις” των χεριών, που αν και πιθανότατα καλύπτουν τις περισσότερες πιθανές κινήσεις, σίγουρα δεν μπορούν να χαρακτηριστούν ως “απόλυτη ελευθερία κίνησης”. Δεύτερον, ακριβώς επειδή πρέπει πάντα να είναι διαθέσιμη μια βάση εικόνων με όλες τις πιθανές “θέσεις” των χεριών, το σύστημα απαιτεί εκατοντάδες MBytes μνήμης – και μπορεί ένα σύγχρονο PC να έχει συνήθως γύρω στα 4GBs, αλλά αν τα… 3,5 από αυτά αναλώνονται από ένα “σύστημα χειρισμού” του, δεν μένουν και πολλά για άλλες ανάγκες, για την εκτέλεση εφαρμογών, παιχνιδιών κ.λπ. Τρίτο, και ίσως σημαντικότερο, όσο… αστείο και αν φαίνεται, πως τα γάντια μοιάζουν σαν κομμάτι στολής… παλιάτσου, αφού για να λειτουργεί το όλο σύστημα πρέπει να αποτελούνται από κομματάκια πολλών, έντονων και πολύ διαφορετικών χρωμάτων.

Έτσι, ακόμη και αν το σύστημα έχει ως συνολικό κόστος παραγωγής το… $1 για την κατασκευή των γαντιών, όπως λένε οι δημιουργοί του, κάτι μου λέει πως αν στη γνωστή σκηνή του Minority Report ο Tom Cruise δεν φορούσε τα ολόμαυρα γάντια με τους τρεις αισθητήρες Led στις άκρες των δαχτύλων του, αλλά τα δεκάχρωμα γάντια από Lycra που προτείνουν οι Wang και Popovic, η χρήση των υπολογιστών “με νεύματα” ίσως να μη μας φαινόταν και τόσο… “cool”!

Προηγούμενο άρθροΒρείτε και κατεβάστε οποιοδήποτε torrent με 1-2 κλικ
Επόμενο άρθροΤι είναι Hotlinking και γιατί το αποφεύγουμε
Κατά γενική ομολογία θεωρούμε ξεγραμμένος ή πιο σωστά αποτυχημένος. Αφού σας συστήθηκα, πάμε παρακάτω. Για εμένα δεν υπάρχουν διλήμματα, γιατί ξέρω τι θέλω και τι αναζητώ στη ζωή μου. Από μικρός έπαψα να συμβιβάζομαι και άρχισα να αγωνίζομαι. Το Μοναδικό μου εργαλείο είναι το γράψιμο και η ουδέτερη σκέψη μου.
ΚΟΙΝΟΠΟΙΗΣΗ

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

Παρακαλώ εισάγετε το σχόλιο σας!
Παρακαλώ εισάγετε το όνομά σας