Η Google ενημέρωσε το Cloud Speech API της με υποστήριξη για περισσότερες γλώσσες και άλλα σημαντικά καλούδια που θα κάνουν ευκολότερη τη ζωή σας.
Το API του Cloud Speech της Google, το οποίο επέτρεψε στους προγραμματιστές να χρησιμοποιούν τις υπηρεσίες της Google για τη μετάφραση ομιλούμενων λέξεων σε κείμενο από την κυκλοφορία του το 2016, πλέον έρχεται με μια σημαντική ενημέρωση.
Το πιο ενδιαφέρον από αυτά είναι ίσως η προσθήκη υποστήριξης για 30 νέες γλώσσες πάνω από τις 89 γλώσσες που η υπηρεσία είναι ήδη κατανοητή (αν και για να είμαστε δίκαιοι, η Google περιλαμβάνει πολλές περιφερειακές παραλλαγές αγγλικών, ισπανικών και αραβικών στο σύνολο της).
Στις νέες αυτές γλώσσες συγκαταλέγονται οι Μπενγκάλι, Λετονίας και Σουαχίλι και, σύμφωνα με την Google, καλύπτουν περίπου ένα δισεκατομμύριο ομιλητές.
Επιπλέον, η Google εισήγαγε επίσης κάποιες νέες βασικές λειτουργίες στην υπηρεσία. Μεταξύ αυτών είναι η υποστήριξη για timestamps επίπεδο λέξης. Η ιδέα εδώ είναι να επισημάνουμε κάθε λέξη με τη χρονική της σήμανση, έτσι ώστε οι προγραμματιστές να μπορούν, για παράδειγμα, να επιτρέψουν στους χρήστες τους να ακούσουν πώς ακούγεται η συγκεκριμένη λέξηλέξη.
Η παρούσα παράμετρος είναι ιδιαίτερα ενδιαφέρουσα για τις μεταγραφικές και μεταφραστικές υπηρεσίες που συμπληρώνονται από ανθρώπους που χρησιμοποιούν αυτό το API για να επιταχύνουν τις ροές στις εργασίες τους. “Η δυνατότητα χαρτογράφησης του ήχου στο κείμενο με τις σφραγίδες χρόνου μειώνει σημαντικά τον χρόνο που αφιερώνουν τα αντίγραφα διόρθωσης”, λέει ο συνιδρυτής της Happy Scribe André Bastie, της οποίας η εταιρεία χρησιμοποιεί την υπηρεσία για τη συνδρομητική υπηρεσία μεταγραφής, η οποία χρεώνεται 0,10 $ / λεπτό.
Το είδος των αρχείων που ανεβάζουν οι προγραμματιστές στην υπηρεσία μπορεί να είναι μέχρι και 3 ώρες, από 80 λεπτά στην προηγούμενη έκδοση. Οι προγραμματιστές μπορούν επίσης να ζητήσουν μια επέκταση ποσόστωσης για να μεταφορτώσουν αρχεία που είναι ακόμη μεγαλύτερα.
Όπως και πριν, οι προγραμματιστές μπορούν να λάβουν 60 λεπτά ελεύθερης επεξεργασίας ήχου μέσω του API ομιλίας και κάθε επιπλέον 15 δευτερόλεπτα χρεώνεται στα 0,006 $.