Το Amazon Textract πρόσθεσε αναγνώριση γραφής και υποστήριξη για νέες γλώσσες

Το Amazon Textract προσθέτει αναγνώριση γραφής και υποστήριξη για νέες γλώσσες

Η Amazon ανακοίνωσε σήμερα μικρές βελτιώσεις στο Textract, την υπηρεσία που εξάγει έντυπο κείμενο και άλλα δεδομένα από έγγραφα σε ψηφιακό αρχείο, χρησιμοποιώντας μηχανική εκμάθηση (machine learning). Από σήμερα, το Textract υποστηρίζει πλέον την αναγνώριση γραπτού περιεχομένου στα αγγλικά έγγραφα, συμπεριλαμβανομένων και των αρχείων που είναι γραμμένα στα ισπανικά, πορτογαλικά, γαλλικά, γερμανικά και ιταλικά.

Η Amazon ορθώς σημειώνει ότι πολλά έγγραφα, όπως αιτήσεις πρόσληψης στον τομέα της υγειονομικής περίθαλψης, περιέχουν συνδυασμό χειρόγραφου και έντυπου κειμένου. Ενώ η Google και η Amazon έχουν προσφέρει αναγνώριση χειρογράφου ως υπηρεσία για κάποιο χρονικό διάστημα, η Amazon λέει ότι τα μαζικά αιτήματα των πελατών της την ώθησαν στην έναρξη της δικής της λύσης, η οποία λειτουργεί τόσο με κείμενο ελεύθερης μορφής, όσο και με κείμενο ενσωματωμένο σε πίνακες και φόρμες.

Οι πελάτες του Amazon Web Services (AWS) μπορούν να χρησιμοποιήσουν τη δυνατότητα αναγνώρισης γραφής Textract σε συνδυασμό με το Amazon Augmented AI (A2I) για πιο βελτιωμένη απόδοση. Το A2I, μέσω της μηχανικής μάθησης επιτρέπει στους χρήστες να δημιουργούν ροές εργασίας για ανθρώπινη ανασκόπηση, είτε από υπαλλήλους, είτε από ανώτατα στελέχη της εκάστοτε επιχείρησης. Τα έγγραφα μπορούν να φορτωθούν στην κονσόλα Amazon Textract ή να σταλούν χρησιμοποιώντας το AWS Command Line Interface ή τα κιτ ανάπτυξης λογισμικού AWS.

Εκτός από τις νέες δυνατότητες, το Textract παραμένει λιγότερο ολιστικό από την πλατφόρμα Document AI (DocAI) της Google, μια προηγμένη πλατφόρμα για την επεξεργασία εγγράφων που φιλοξενείται στο Google Cloud. Το Textract υποστηρίζει τη δημιουργία και την προσαρμογή της επεξεργασίας ροών εργασίας που έχουν δημιουργηθεί με μια προκαθορισμένη ταξινόμηση χωρίς να χρειάζεται να εκτελούνται επιπλέον χαρτογράφηση δεδομένων ή εκπαίδευση του συστήματος για να λειτουργεί πιο ομαλά. Ενώ το DocAI προσφέρει μία ευρεία γκάμα επεξεργαστών, συμπεριλαμβανομένου ενός προγράμματος ανάλυσης φόρμας, ενός προγράμματος ανάλυσης W9, αναγνώριση οπτικών χαρακτήρων, διαχωριστή εγγράφων και προσαρμοσμένων ροών εργασίας για έγγραφα συγκεκριμένου τομέα. Οι αναλυτές μπορούν να ταξινομήσουν πληροφορίες σε έγγραφα όπως διευθύνσεις, αριθμούς λογαριασμών και υπογραφές, καθώς και εξαγωγή δεδομένων όπως ονόματα προμηθευτών, ημερομηνίες τιμολογίου και όρους πληρωμών.

Οι εταιρείες δαπανούν κατά μέσο όρο 20 δολάρια για να αρχειοθετήσουν και να αποθηκεύσουν ένα μόνο έγγραφο, σύμφωνα με εκτιμήσεις οικονομικών αναλυτών που έχουν εξετάσει προσεκτικά αυτό τον τομέα, και μόνο το 18% των εταιρειών αναφέρουν ότι δεν χρησιμοποιούν καθόλου χαρτί για τη δουλειά τους. Μια έκθεση της IDC αποκάλυψε ότι οι προκλήσεις που σχετίζονται με τα έντυπα έγγραφα αντιστοιχούν σε απώλεια παραγωγικότητας της τάξεως του 21,3%, και μάλιστα οι αμερικανικές εταιρείες σπαταλούν συνολικά 8 δισεκατομμύρια δολάρια ετησίως να διαχειριστούν αυτές τις εργασίες.

Η Amazon ανακοίνωσε επίσης ενημερώσεις για το Amazon Lex και το Amazon Polly νωρίτερα αυτήν την εβδομάδα. Το Lex, είναι μια πλατφόρμα για τη δημιουργία διεπαφών συνομιλίας, υποστηρίζει Γαλλικά, Ισπανικά, Ιταλικά και Γαλλικά του Καναδά. Από την άλλη πλευρά, το Polly, μετατρέπει το κείμενο σε μια ζωντανή ομιλία, και πλέον διαθέτει αυστραλιανή φωνητική βοηθό, την Ολίβια.

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

Παρακαλώ εισάγετε το σχόλιο σας!
Παρακαλώ εισάγετε το όνομά σας