Οι LG AI Research, SK Telecom (SKT) και Upstage προχώρησαν στη δεύτερη φάση του νοτιοκορεατικού έργου Sovereign AI Foundational Model, μιας κρατικά υποστηριζόμενης «κούρσας» για τη δημιουργία εγχώριων μεγάλων γλωσσικών μοντέλων (LLMs) που μπορούν να σταθούν ανταγωνιστικά σε παγκόσμιο επίπεδο.
Το Υπουργείο Επιστημών και ΤΠΕ (MSIT) ανακοίνωσε την εξέλιξη την Πέμπτη, ενώ οι Naver Cloud και NC AI αποκλείστηκαν μετά τον πρώτο γύρο, ο οποίος αξιολογήθηκε με βάση την τεχνική αρτιότητα και την πρωτοτυπία του μοντέλου.
Αρχικά, το πλάνο προέβλεπε ότι τέσσερις ομάδες θα περνούσαν στην επόμενη φάση.
Ωστόσο, η Naver Cloud, όπως είχε αναφερθεί νωρίτερα μέσα στον διαγωνισμό, αποκλείστηκε από επιτροπή ειδικών AI, οι οποίοι κατέληξαν ότι το μοντέλο της δεν πληρούσε το απαιτούμενο επίπεδο πρωτοτυπίας σε τεχνικούς και πολιτικούς/κανονιστικούς τομείς.
Τα AI μοντέλα που παρουσιάστηκαν
LG AI Research: Κορυφαίες επιδόσεις για το K-Exaone
Το K-Exaone LLM της LG AI Research έλαβε τις υψηλότερες βαθμολογίες για ακρίβεια, χρηστικότητα και καινοτομία. Κατατάχθηκε πρώτο και στις τρεις κατηγορίες αξιολόγησης, που περιλάμβαναν:
- benchmark testing,
- αξιολόγηση από panel ειδικών,
- feedback χρηστών.
Η LG AI Research ανέφερε ότι θα επικεντρωθεί στην ανάπτυξη εξειδικευμένων AI μοντέλων για βιομηχανική χρήση, με εφαρμογές σε:
- παραγωγή ενέργειας,
- χημική βιομηχανία,
- βιοτεχνολογία.
«Στόχος μας δεν είναι απλώς να εξασφαλίσουμε ένα παγκοσμίως ανταγωνιστικό μοντέλο, αλλά να ηγηθούμε της δημιουργίας ενός ολοκληρωμένου οικοσυστήματος AI, συμπεριλαμβανομένης της βιομηχανικής εφαρμογής και της ανάπτυξης ταλέντου», δήλωσε ο Lim Woo-hyung, συν-επικεφαλής της LG AI Research (σύμφωνα με την Korea JoongAng Daily).
SK Telecom (SKT): Multimodal δυνατότητες και επέκταση γλωσσών
Αντίθετα, η κοινοπραξία της SKT ανακοίνωσε την Παρασκευή ότι σκοπεύει να εφαρμόσει multimodal δυνατότητες, ξεκινώντας από δεδομένα εικόνας.
Αυτό θα επιτρέπει στο μοντέλο να αναγνωρίζει εικόνες από ακαδημαϊκές εργασίες ή επαγγελματικά έγγραφα και να παράγει περιλήψεις σε κείμενο.
Σε ανακοίνωσή της, η SKT ανέφερε ότι:
- από το δεύτερο εξάμηνο του έτους, θα αναβαθμίσει περαιτέρω τις multimodal δυνατότητες ώστε να επεξεργάζεται και φωνή και βίντεο,
- έτσι το σύστημα θα ξεπεράσει την «κατανόηση μόνο κειμένου» και θα μπορεί να επεξεργάζεται ποικιλία τύπων δεδομένων: εικόνες, ήχο και βίντεο.
Το μοντέλο A.X K1 της κοινοπραξίας τράβηξε τα βλέμματα ως το πρώτο hyperscale AI μοντέλο της Νότιας Κορέας, με 519 δισ. παραμέτρους, γεγονός που το καθιστά το πιο προηγμένο AI μοντέλο που έχει αναπτυχθεί τοπικά μέχρι σήμερα.
Στη Φάση 2, η SKT σκοπεύει:
- να αυξήσει σημαντικά τον όγκο των δεδομένων εκπαίδευσης,
- να επεκτείνει τις υποστηριζόμενες γλώσσες σε πέντε: κορεατικά, αγγλικά, κινεζικά, ιαπωνικά και ισπανικά.
Η εταιρεία σκοπεύει να παρουσιάσει και επόμενα μοντέλα με βάση αυτές τις βελτιώσεις, όπως ένα υπό δοκιμαστική ονομασία A.X K2.
Upstage: Προσλήψεις κορυφαίων ερευνητών και κλιμάκωση μεγέθους
Η AI startup Upstage φέρεται να σχεδιάζει να ενισχύσει τις τεχνολογικές της δυνατότητες στη Φάση 2, προσελκύοντας κορυφαίους ακαδημαϊκούς AI από ιδρύματα όπως το Stanford και πανεπιστήμια της Νέας Υόρκης.
Σύμφωνα με τοπικά δημοσιεύματα, η εταιρεία σκοπεύει να αυξήσει σταδιακά το μέγεθος των μοντέλων της από περίπου 100 δισ. σε 200 δισ. και τελικά 300 δισ. παραμέτρους, με στόχο βελτίωση τόσο της κλίμακας όσο και της απόδοσης.
Διαμάχη για την «πρωτοτυπία» των AI μοντέλων
Τις εβδομάδες πριν ανακοινωθούν τα αποτελέσματα της πρώτης φάσης, ξέσπασε αντιπαράθεση για το τι σημαίνει ανάπτυξη μοντέλου «από το μηδέν».
Το βασικό ερώτημα είναι: μέχρι ποιο σημείο μπορεί να ενσωματώνεται εξωτερική τεχνολογία χωρίς να υπονομεύεται η ανεξαρτησία ενός μοντέλου.
Το εθνικό πρόγραμμα AI είχε σχεδιαστεί ώστε να αναπτυχθεί εγχώρια τεχνολογία που δεν εξαρτάται σε μεγάλο βαθμό από ξένα AI μοντέλα.
Η συζήτηση άναψε τον προηγούμενο μήνα, όταν οι ομάδες που είχαν προκριθεί παρουσίασαν τα μοντέλα τους.
Το Solar-Open-100B της Upstage κατηγορήθηκε ότι επαναχρησιμοποίησε inference code από AI μοντέλο κινεζικής εταιρείας.
Αντίστοιχα, τέθηκαν ερωτήματα για την πρωτοτυπία του A.X K1 της SKT, καθώς φέρεται να παρουσιάζει ομοιότητες με το κινεζικό μοντέλο DeepSeek.
Σύμφωνα με την The Korea Times, τόσο η Upstage όσο και η SKT υποστήριξαν ότι η χρήση open-source inference code (κώδικας που «τρέχει» ένα ήδη εκπαιδευμένο μοντέλο σε νέες εισόδους για να παράγει εξόδους) δεν επηρεάζει την πρωτοτυπία, επειδή διαφέρει από τον κώδικα εκπαίδευσης (training code).
Παράλληλα, η Naver Cloud δέχτηκε κριτική για τη χρήση encoders εικόνας και ήχου, καθώς και προ-εκπαιδευμένων weights (παραμέτρων), από το open-source μοντέλο Qwen της Alibaba, κατά την ανάπτυξη των HyperCLOVA X Seed 32B Think και HyperCLOVA X 8B Omni.
Αν και η εταιρεία αναγνώρισε τη χρήση εξωτερικών encoders, φέρεται να δήλωσε ότι ήταν στρατηγική επιλογή για μεγαλύτερη αποδοτικότητα και διεθνή συμβατότητα, όχι για να υπονομεύσει την τεχνολογική κυριαρχία.
Η «τέταρτη θέση» που μένει ανοιχτή
Το MSIT ανέφερε επίσης την περασμένη Πέμπτη ότι σκοπεύει να πραγματοποιήσει επιπλέον διαδικασία επιλογής στο πρώτο εξάμηνο του έτους, ώστε να καλυφθεί η τέταρτη θέση, όπως προέβλεπε ο αρχικός σχεδιασμός στο τέλος της πρώτης φάσης.
Το υπουργείο πρόσθεσε ότι εταιρείες που είχαν αποκλειστεί μπορούν να κάνουν εκ νέου αίτηση για την τέταρτη θέση.
Μέχρι στιγμής, όμως, δεν φαίνεται να υπάρχει ιδιαίτερο ενδιαφέρον:
- Η Naver Cloud δήλωσε ότι δεν σκοπεύει να επανυποβάλει αίτηση.
- Η NC AI ανέφερε ότι θα εστιάσει στην ανάπτυξη foundation AI, AI για τη βιομηχανία και physical AI μαζί με τους εταίρους της κοινοπραξίας της.
- Η Kakao, που είχε αποκλειστεί όταν το πεδίο περιορίστηκε στις πέντε ομάδες, επίσης δεν δείχνει διάθεση να επιστρέψει στο πρόγραμμα.
Άλλοι developers που συμμετείχαν αρχικά στο εθνικό project —μεταξύ αυτών οι KT, Motif Technologies, Konan Technology και κοινοπραξία υπό το KAIST— εξετάζουν ακόμη αν θα επανυποβάλουν αίτηση.
Γιατί το Sovereign AI έχει τόσο μεγάλη σημασία
Τι είναι το «Sovereign AI» και ποια προβλήματα προσπαθεί να λύσει
Το Sovereign AI (κυρίαρχη/εθνικά ελεγχόμενη AI) δεν σημαίνει απλώς «να φτιάχνεις ένα LLM στη χώρα σου».
Στόχος είναι να έχεις έλεγχο σε κρίσιμους κρίκους της αλυσίδας:
- δεδομένα εκπαίδευσης (προέλευση, άδειες, τοπική γλώσσα/κουλτούρα),
- υποδομές (GPU clusters, cloud, ενεργειακό κόστος),
- μοντέλο και weights (πνευματική ιδιοκτησία, δυνατότητα ελέγχου/επιθεώρησης),
- κανόνες ασφάλειας & συμμόρφωσης (privacy, πολιτικές χρήσης, λογοδοσία).
Για χώρες όπως η Νότια Κορέα, αυτό είναι κρίσιμο ώστε να μειωθεί η εξάρτηση από ξένους παρόχους μοντέλων και να διασφαλιστεί ότι εφαρμογές σε δημόσιο τομέα, άμυνα, υγεία ή χρηματοοικονομικά θα βασίζονται σε ελέγξιμη τεχνολογία.
Πού «κολλάει» συνήθως η συζήτηση περί πρωτοτυπίας
Η διαμάχη που εμφανίστηκε (inference code, encoders, pre-trained weights) είναι αναμενόμενη, γιατί τα σύγχρονα LLMs σπάνια χτίζονται 100% χωρίς εξωτερικά στοιχεία. Συνήθως οι επιτροπές πρέπει να ξεκαθαρίσουν:
- Τι θεωρείται επιτρεπτή επαναχρησιμοποίηση open-source λογισμικού;
- Είναι «από το μηδέν» όταν το training γίνεται in-house αλλά χρησιμοποιούνται έτοιμα components;
- Πώς αποδεικνύεται η γενεαλογία των δεδομένων και των weights (provenance);
Μια πρακτική προσέγγιση είναι να αξιολογείται η πρωτοτυπία με βάση το ποιος ελέγχει το training pipeline, τα δεδομένα, τις αποφάσεις αρχιτεκτονικής και τα κρίσιμα σημεία ασφαλείας, όχι μόνο με βάση το αν χρησιμοποιήθηκε open-source κώδικας.
Τι να περιμένουμε στη Φάση 2: ποιότητα, multimodal και εφαρμογές
Στη δεύτερη φάση, το ενδιαφέρον πιθανότατα θα μετατοπιστεί:
- από το «πόσες παραμέτρους έχει» ένα μοντέλο,
- στο πόσο καλά αποδίδει σε πραγματικές εργασίες (εργαλεία παραγωγικότητας, βιομηχανικά σενάρια, κυβερνητικές υπηρεσίες),
- και στο πόσο ώριμο είναι το οικοσύστημα: APIs, αξιοπιστία, κόστη inference, ασφαλείς ρυθμίσεις, αξιολόγηση κινδύνου.
Η στροφή της SKT σε multimodal (εικόνα/ήχος/βίντεο) είναι επίσης ενδεικτική: το επόμενο ανταγωνιστικό πλεονέκτημα δεν θα είναι μόνο η «γλώσσα», αλλά η ικανότητα ενός μοντέλου να κατανοεί πολυτροπικά δεδομένα και να ενσωματώνεται σε επιχειρησιακές ροές εργασίας.
