ΑρχικήΔιαδίκτυοΗ Meta παρουσίασε το Llama 3.2: Το νέο AI μοντέλο με οπτικές...

Η Meta παρουσίασε το Llama 3.2: Το νέο AI μοντέλο με οπτικές και φωνητικές δυνατότητες

Η Meta αποκάλυψε το Llama 3.2, το νέο μοντέλο τεχνητής νοημοσύνης ανοιχτού κώδικα, με δυνατότητες οπτικής και φωνητικής αλληλεπίδρασης. Το μοντέλο αυτό φέρνει μια νέα προσέγγιση στην τεχνολογία AI, καθώς επιτρέπει στους χρήστες να επικοινωνούν με το λογισμικό μέσω εικόνων και φωνής, ανοίγοντας νέες προοπτικές στη χρήση του και επί της ουσίας θα είναι έτσι ακόμη πιο χρηστικό σε σχέση με πριν.

Η παρουσίαση του Llama 3.2

Η ανακοίνωση του Llama 3.2 έγινε κατά τη διάρκεια της εκδήλωσης Meta Connect 2024, με την Meta να τονίζει ότι το μοντέλο αυτό είναι δωρεάν και ανοιχτού κώδικα. Το Llama 3.2 ξεχωρίζει γιατί είναι το πρώτο μοντέλο της σειράς που μπορεί να αναλύσει και να επεξεργαστεί εικόνες παράλληλα με το κείμενο, χάρη στη νέα αρχιτεκτονική του που συνδυάζει αναπαραστάσεις από κωδικοποιητές εικόνας.

Αυτή η νέα λειτουργία επιτρέπει στο AI να επεξεργάζεται οπτικά δεδομένα και να παρέχει πληροφορίες με βάση τις εικόνες που λαμβάνει.

Σύμφωνα με τον Mark Zuckerberg, διευθύνοντα σύμβουλο της Meta, η απόφαση να προσφερθεί το Llama 3.2 ως ανοιχτού κώδικα ευθυγραμμίζεται με τη στρατηγική της Meta να ενσωματώσει την τεχνητή νοημοσύνη στις πλατφόρμες της, δίνοντας στους χρήστες και τους προγραμματιστές τη δυνατότητα να εξερευνήσουν νέες εφαρμογές της τεχνολογίας.

Πολυτροπική επεξεργασία: Κείμενο και εικόνες

Ένα από τα σημαντικότερα χαρακτηριστικά του Llama 3.2 είναι η δυνατότητά του να επεξεργάζεται τόσο κείμενο όσο και εικόνες. Αυτή η “πολυτροπική” ικανότητα επιτρέπει στο AI να ερμηνεύει και να ανταποκρίνεται σε οπτικά δεδομένα. Για παράδειγμα, εάν ένας χρήστης ανεβάσει μια φωτογραφία, το Llama 3.2 μπορεί να αναλύσει την εικόνα και να δώσει πληροφορίες, όπως την ταυτοποίηση του είδους ενός ζώου ή την επεξεργασία της εικόνας με τη χρήση εντολών, π.χ. προσθήκη ή αφαίρεση αντικειμένων ή αλλαγή φόντου.

Αυτές οι δυνατότητες είναι ήδη ενσωματωμένες στις πλατφόρμες της Meta, όπως το Instagram και το Facebook, προσφέροντας στους χρήστες περισσότερες δημιουργικές επιλογές κατά την αλληλεπίδραση με το AI.

Φωνητική αλληλεπίδραση και διασημότητες

Εκτός από την οπτική επεξεργασία, το Llama 3.2 προσφέρει και δυνατότητες φωνητικής αλληλεπίδρασης, επιτρέποντας στους χρήστες να δίνουν φωνητικές εντολές στο AI. Η Meta παρουσίασε επίσης μια σειρά από φωνές διασημοτήτων, όπως αυτές των Dame Judi Dench, John Cena και Awkwafina, με στόχο να κάνουν την εμπειρία πιο ελκυστική και διασκεδαστική.

Αυτή η νέα δυνατότητα θα είναι αρχικά διαθέσιμη σε συγκεκριμένες αγορές, όπως οι ΗΠΑ, ο Καναδάς, η Αυστραλία και η Νέα Ζηλανδία, με σχέδια για επέκταση σε περισσότερες χώρες στο μέλλον.

Βελτιστοποίηση για κινητές συσκευές

Ένα άλλο σημαντικό στοιχείο του Llama 3.2 είναι η βελτιστοποίησή του για κινητές συσκευές. Αυτό σημαίνει ότι οι προγραμματιστές μπορούν να δημιουργούν εφαρμογές AI που λειτουργούν σε smartphones, επιτρέποντας πιο άμεσες και πρακτικές εφαρμογές της τεχνητής νοημοσύνης σε καθημερινές δραστηριότητες. Οι εφαρμογές αυτές μπορούν να χρησιμοποιούν την κάμερα της συσκευής ή να βοηθούν τους χρήστες με εργασίες μέσω φωνητικών εντολών, κάνοντας την τεχνολογία πιο προσβάσιμη και εύχρηστη.

Το Meta AI και οι νέες δυνατότητες του Llama 3.2

Το Llama 3.2 δεν περιορίζεται μόνο στην ανάλυση εικόνων και στη φωνητική αλληλεπίδραση, καθώς υποστηρίζει επίσης το Meta AI, έναν ψηφιακό βοηθό chatbot που είναι διαθέσιμος στο WhatsApp, το Messenger και το Instagram. Με την ενσωμάτωση του Llama 3.2, το Meta AI μπορεί πλέον να απαντά σε ερωτήσεις όχι μόνο με βάση κείμενο, αλλά και με οπτικά δεδομένα, όπως προτάσεις προϊόντων που σχετίζονται με εικόνες.

Σύμφωνα με τη Meta, το Meta AI χρησιμοποιείται ήδη από περισσότερους από 180 εκατομμύρια χρήστες εβδομαδιαίως και οι νέες δυνατότητες αναμένεται να αυξήσουν ακόμη περισσότερο τη χρήση του.

Διαφορετικές εκδόσεις για διαφορετικές ανάγκες

Η Meta προσφέρει το Llama 3.2 σε διάφορες εκδόσεις, ανάλογα με την πολυπλοκότητα και το μέγεθος των παραμέτρων. Οι εκδόσεις αυτές κυμαίνονται από 1 δισεκατομμύριο έως 90 δισεκατομμύρια παραμέτρους. Οι μικρότερες εκδόσεις είναι σχεδιασμένες για να λειτουργούν αποτελεσματικά σε κινητές συσκευές, ενώ οι μεγαλύτερες εκδόσεις προορίζονται για πιο απαιτητικές εργασίες, όπως η επεξεργασία μεγάλου όγκου δεδομένων.

Νέες ενημερώσεις στις πλατφόρμες της Meta

Εκτός από το Llama 3.2, η Meta ανακοίνωσε και άλλες βελτιώσεις στις πλατφόρμες της. Μια σημαντική ενημέρωση είναι η δυνατότητα αυτόματων υποτίτλων για τις ιστορίες στο Instagram και το Facebook. Οι υπότιτλοι αυτοί δημιουργούνται από το AI με βάση το περιεχόμενο των εικόνων, προσφέροντας στους χρήστες ευκολότερους τρόπους να προσθέτουν λεζάντες στις αναρτήσεις τους.

Επιπλέον, η Meta παρουσίασε θέματα που δημιουργούνται από το AI για απευθείας μηνύματα στο Instagram και το Messenger, δίνοντας περισσότερες επιλογές εξατομίκευσης στους χρήστες.

Εργαλεία για τους δημιουργούς περιεχομένου

Οι δημιουργοί περιεχομένου θα επωφεληθούν επίσης από τα νέα εργαλεία της Meta. Ένα από αυτά είναι η δυνατότητα ζωντανής μετάφρασης για βίντεο, η οποία επιτρέπει στους δημιουργούς να μεταγλωττίζουν τα βίντεό τους σε διαφορετικές γλώσσες, διατηρώντας τον συγχρονισμό των χειλιών. Αυτό θα βοηθήσει τους δημιουργούς να προσεγγίσουν μεγαλύτερο κοινό, ανεξαρτήτως γλώσσας.

Επιπλέον, η Meta δοκιμάζει νέα πειραματικά εργαλεία, όπως η ζωντανή μετάφραση συνομιλιών μεταξύ ισπανικών και αγγλικών, καθώς και AI avatars για influencers που θέλουν να αλληλεπιδρούν με τους ακόλουθούς τους με πιο καινοτόμους τρόπους.

Συμπεράσματα

Το Llama 3.2 της Meta φέρνει επανάσταση στον τρόπο με τον οποίο οι χρήστες αλληλεπιδρούν με την τεχνητή νοημοσύνη. Οι νέες δυνατότητες οπτικής επεξεργασίας και φωνητικής αλληλεπίδρασης διευρύνουν τις εφαρμογές του AI, ενώ η βελτιστοποίηση για κινητές συσκευές καθιστά την τεχνολογία προσιτή σε όλους. Οι επερχόμενες ενημερώσεις και τα εργαλεία για δημιουργούς περιεχομένου προσφέρουν περισσότερες δυνατότητες, επιβεβαιώνοντας τη δέσμευση της Meta να ενσωματώσει την τεχνητή νοημοσύνη στις πλατφόρμες της με στόχο την καινοτομία και τη δημιουργικότητα.

Στέλιος Θεοδωρίδης
Στέλιος Θεοδωρίδης
Ο ήρωας μου είναι ο γάτος μου ο Τσάρλι και ακροάζομαι μόνο Psychedelic Trance
RELATED ARTICLES

Πρόσφατα άρθρα

Tηλέφωνα έκτακτης ανάγκης

Δίωξη Ηλεκτρονικού Εγκλήματος: 11188
Ελληνική Αστυνομία: 100
Χαμόγελο του Παιδιού: 210 3306140
Πυροσβεστική Υπηρεσία: 199
ΕΚΑΒ 166