Η Qualcomm ισχυρίζεται ότι η φωνητική της αναγνώριση είναι ακριβής κατά 95%

26 Μαΐου 2018

387

Η Qualcomm ισχυρίζεται ότι η φωνητική της αναγνώριση είναι ακριβής κατά 95%.

Στο συνέδριο Βαθιάς Μάθησης Re-Work Deep Learning Summit που διεξήχθη στη Βοστώνη, ο Chris Lott, ερευνητής της τεχνητής νοημοσύνης στην Qualcomm, έδωσε μια γεύση από το έργο της ομάδας του σε ένα πρόγραμμα που επικεντρώνεται στη φωνητική αναγνώριση.

Το σύστημα, το οποίο λειτουργεί σε smartphone ή οποιαδήποτε άλλη φορητή συσκευή, και όχι εγκατεστημένο σε κάποιο διακομιστή, περιλαμβάνει δύο είδη νευρωνικών δικτύων που μιμούνται το μοτίβο των νευρώνων στον ανθρώπινο εγκέφαλο. Εν ολίγοις, ο Chris Lott είπε πως το συγκεκριμένο σύστημα είναι σε θέση να αναγνωρίσει λέξεις και φράσεις με 95% επιτυχία (κατά μέσο όρο). Το μεγάλο του πλεονέκτημα είναι πως μπορεί να μαθαίνει από τη χρήση της συσκευής που χρησιμοποιεί ο εκάστοτε χρήστης. Μπορεί επίσης να εξατομικεύσει τη συμπεριφορά ανάλογα με τις συνήθειές σας.

Τα περισσότερα συστήματα φωνητικής αναγνώρισης σήμερα πραγματοποιούν το μεγαλύτερο μέρος της επεξεργασίας τους σε κάποιον διακομιστή στο σύννεφο, εξήγησε ο Lott.

Για για παράδειγμα, τα smartphones, τα έξυπνα ηχεία εσωτερικού χώρου, όπως το Google Home και τα ηχεία Amazon Echo, καθώς και οι υπολογιστές των Windows με τον ψηφιακό βοηθό Cortana της Microsoft, έδωσαν τη δυνατότητα να λειτουργούν βάσει φωνητικών εντολών που δίνει ο χρήστης, όμως δεν αναλύουν αυτές τις εντολές – απλά τις αποστέλλουν σε ισχυρούς απομακρυσμένους διακομιστές που εκτελούν πολύπλοκους αλγορίθμους μηχανικής μάθησης.

Για ορισμένους χρήστες, η αποστολή των φωνητικών τους δεδομένων σε απομακρυσμένους διακομιστές δημιουργεί ανησυχίες για την προστασία της ιδιωτικής ζωής. Τόσο ο βοηθός Alexa της Amazon, όσο και το Google Assistant, διατηρούν αυτά τα φωνητικά αποσπάσματα στη βάση δεδομένων τους μέχρι να διαλέξουν οι χρήστες να τα διαγράψουν. Και οι δύο εταιρείες λένε ότι χρησιμοποιούν τις ηχογραφήσεις για να βελτιώσουν τις υπηρεσίες τους και να δώσουν πιο εξατομικευμένες απαντήσεις στο χρήστη, κάτι όμως που αμφισβητείται άμεσα από το ευρύ κοινό.

Αλλά σε ορισμένες περιπτώσεις, αυτές οι ηχογραφήσεις δεν παραμένουν ιδιωτικές. Το 2016, οι αστυνομικοί στην Αριζόνα που διερεύνησαν μια δολοφονία αναζήτησαν πρόσβαση τα φωνητικά δεδομένα από το έξυπνο ηχείο Amazon Echo, τα οποία τελικά δόθηκαν στις αστυνομικές αρχές με την άδεια του εισαγγελέα.

Η φωνητική επεξεργασία με πρόγραμμα που είναι εγκατεστημένο τοπικά στις συσκευές έχει πολλά πλεονεκτήματα, εκτός από την προστασία της ιδιωτικής ζωής, δήλωσε ο Lott. Προφανώς επειδή δεν χρειάζεται να αφαιρεθούν τα δεδομένα από το σύννεφο, επιπλέον αποκρίνεται άμεσα και ταχύτατα στις εντολές και δεν απαιτεί σύνδεση στο διαδίκτυο, οπότε βάσει των παραπάνω δεδομένων θεωρείται μακράν πιο αξιόπιστο από τα υπόλοιπα συστήματα.

Ωστόσο από την άλλη πλευρά της υπόθεσης, η φωνητική αναγνώριση που είναι εγκατεστημένη ως πρόγραμμα στη συσκευή έχει το δικό της σύνολο περιορισμών. Οι αλγόριθμοι που έχουν σχεδιαστεί για να λειτουργούν σε εργασίες εκτός σύνδεσης δεν μπορούν να συνδεθούν στο διαδίκτυο για να αναζητήσουν απαντήσεις σε ερωτήσεις και χάνετε πολύτιμη δυναμική για την βελτίωση του συστήματος, κάτι που δεν συμβαίνει σε συστήματα που βασίζονται σε σύννεφο.

Προηγούμενο άρθρο

Το Facebook κατασκευάζει ειδικά προσαρμοσμένα τσιπ για να καλύψει τις ανάγκες του

Επόμενο άρθρο

Η Microsoft αναπτύσσει ένα εργαλείο για να βοηθήσει τους μηχανικούς να εξαλείψουν τις προκαταλήψεις από τους αλγόριθμους

Η Qualcomm ισχυρίζεται ότι η φωνητική της αναγνώριση είναι ακριβής κατά 95%

Πρόσφατα άρθρα

Tηλέφωνα έκτακτης ανάγκης

Σχετικά με εμάς

Εργαλεία

Αντιγραφή περιεχομένου

Kοινωνικά δίκτυα

Σύνδεσμοι