ΑρχικήΔιαδίκτυοOpenAI Codex: Χρήση υπολογιστή με πολλαπλά ποντίκια και ενσωματωμένο Browser

OpenAI Codex: Χρήση υπολογιστή με πολλαπλά ποντίκια και ενσωματωμένο Browser

Σύνοψη
  • Ο Codex της OpenAI εισάγει το Computer Use με μια μοναδική καινοτομία: τη δυνατότητα χρήσης πολλαπλών, ανεξάρτητων δεικτών ποντικιού παράλληλα με τον χρήστη.
  • Η ενημέρωση φέρνει πάνω από 90 νέα plugins, ενσωματωμένο browser για frontend ανάπτυξη και προηγμένες αυτοματοποιήσεις με χρήση μνήμης.
  • Η λειτουργία Computer Use δεν είναι ακόμη διαθέσιμη στην Ευρωπαϊκή Ένωση, αλλά άλλα χαρακτηριστικά όπως η μνήμη και τα plugins είναι καθ’ οδόν.

Μια σημαντική είδηση που ίσως η OpenAI δεν παρουσίασε με τον ενθουσιασμό που θα άξιζε.

Ο Codex μπορεί πλέον να εργάζεται στον υπολογιστή μαζί με τον άνθρωπο, χρησιμοποιώντας δικούς του δρομείς χωρίς να παρεμβαίνει σε αυτόν του χρήστη.

Με σημαντική καθυστέρηση σε σχέση με την Anthropic (τρεις μήνες είναι αιωνιότητα στον σημερινό τομέα της Τεχνητής Νοημοσύνης), η OpenAI έδωσε στον Codex, την εφαρμογή της για προγραμματισμό, μια λειτουργία παρόμοια με το Claude Cowork που επιτρέπει στην ΤΝ να εργάζεται απευθείας στις εφαρμογές ενός Mac.

Πρόκειται για μια λειτουργία που γενικά αποκαλείται Computer Use.

Ο Codex ωστόσο το κάνει με τρόπο διαφορετικό από όλους τους άλλους, διότι η χρήση του υπολογιστή από την πλευρά του Codex δεν είναι αποκλειστική.

Ο χρήστης μπορεί να συνεχίσει να χρησιμοποιεί τον υπολογιστή και το ποντίκι του στην οθόνη, ενώ ο Codex εργάζεται στο παρασκήνιο κουνώντας το «δικό του ποντίκι». Ή μάλλον, τα δικά του ποντίκια. Ο Codex μπορεί στην πραγματικότητα να χρησιμοποιεί πολλαπλούς δρομείς ταυτόχρονα.

Πληροφορία:
Ο Kieraj Mumick, ένας από τους σχεδιαστές της OpenAI για αυτή τη λειτουργία, παρουσίασε επίσης τα μονοπάτια που υπολογίζει η Τεχνητή Νοημοσύνη για να μετακινεί τα προσωπικά της ποντίκια στην οθόνη.

Αυτή η καινοτομία αποτελεί μέρος της χθεσινής ενημέρωσης του Codex, η οποία δυστυχώς δεν έφερε άμεσα το Computer Use στην Ευρωπαϊκή Ένωση. Θα χρειαστεί να περιμένουμε λίγο, όπως συμβαίνει και με άλλες λειτουργίες.

Πέρα από το Computer Use, ο Codex μπορεί πλέον να εργάζεται εγγενώς με τον ιστό χρησιμοποιώντας έναν ενσωματωμένο browser.

Αυτό είναι εξαιρετικά χρήσιμο ειδικά για την ανάπτυξη frontend ή για εφαρμογές που σχεδιάζονται για χρήση σε localhost.

Ακριβώς για να βοηθήσει σε αυτό το είδος προγραμματισμού, ο Codex μπορεί πλέον να παράγει απευθείας εικόνες χρησιμοποιώντας το τελευταίο μοντέλο GPT-image-1.5.

Μπορεί επίσης να καθοδηγηθεί στην κατασκευή γραφικών για έναν ιστότοπο απευθείας από τη συνομιλία, με άμεση υλοποίηση στον ενσωματωμένο browser.

Μια πραγματική «βροχή» από νέα Plugins και εργαλεία

Έφτασε επίσης ένας καταιγισμός από νέα plugins (πάνω από 90), τα οποία συνδυάζουν δεξιότητες, ενσωματώσεις εφαρμογών και διακομιστές MCP.

Ανάμεσα τους ξεχωρίζουν τα Microsoft Suite, CodeRabbit και Render.

Η εφαρμογή επιτρέπει επιπλέον το άνοιγμα αρχείων απευθείας στην πλαϊνή μπάρα με προηγμένες προεπισκοπήσεις για PDF, λογιστικά φύλλα, παρουσιάσεις και έγγραφα.

Προσθέτει επίσης ένα νέο συνοπτικό πάνελ για την παρακολούθηση των σχεδίων των πρακτόρων, των πηγών και των artifacts.

Συμβουλή:
Αξιοποιήστε το νέο συνοπτικό πάνελ για να διατηρείτε τον έλεγχο σε πολύπλοκες ροές εργασίας. Σας επιτρέπει να βλέπετε με μια ματιά τι σχεδιάζει ο Codex και ποια δεδομένα χρησιμοποιεί.

Αυτοματοποιήσεις με μνήμη και πλαίσιο εβδομάδων

Ιδιαίτερα ενδιαφέρουσες είναι οι βελτιώσεις στις Αυτοματοποιήσεις. Πλέον μπορούν να επαναχρησιμοποιούν ήδη υπάρχοντα νήματα συνομιλιών, διατηρώντας έτσι το πλαίσιο που είχε οικοδομηθεί προηγουμένως.

Ο Codex, επιπλέον, μπορεί να προγραμματίζει δραστηριότητες για εκτέλεση στο μέλλον και να επανενεργοποιείται αυτόματα για να συνεχίσει μια μακροχρόνια εργασία, ακόμη και μετά από ημέρες ή εβδομάδες.

Για παράδειγμα, έχουμε ενεργοποιήσει έναν ωριαίο έλεγχο αυτοματισμού που λειτουργεί μόνο από Δευτέρα έως Παρασκευή, από τις 8:00 έως τις 18:00.

Αυτό επιτρέπει την παρακολούθηση διαδικασιών χωρίς περιττή κατανάλωση πόρων εκτός ωραρίου εργασίας.

Η προεπισκόπηση της μνήμης (Memory)

Ο Codex αποκτά επίσης μια προεπισκόπηση της μνήμης, μια λειτουργία που του επιτρέπει να διατηρεί χρήσιμο πλαίσιο από προηγούμενες εμπειρίες. Αυτό περιλαμβάνει προσωπικές προτιμήσεις, διορθώσεις και πληροφορίες που έχουν προκύψει στην πορεία της συνεργασίας.

Με αυτόν τον τρόπο, οι επόμενες εργασίες μπορούν να ολοκληρωθούν ταχύτερα και με υψηλότερο ποιοτικό επίπεδο, κάτι που προηγουμένως απαιτούσε εκτενείς και λεπτομερείς εξατομικευμένες οδηγίες.

Είναι ένα σημαντικό βήμα προς μια πιο διαισθητική συνεργασία ανθρώπου-μηχανής.

Επιπλέον, ο Codex είναι σε θέση να προτείνει προληπτικά χρήσιμες δραστηριότητες για συνέχιση μετά από μια διακοπή.

Αξιοποιώντας το πλαίσιο των έργων, τα συνδεδεμένα plugins και τη μνήμη, μπορεί να προτείνει πώς να ξεκινήσετε την εργάσιμη ημέρα σας ή από ποιο σημείο να συνεχίσετε ένα έργο που έμεινε σε εκκρεμότητα.

Στατιστικό:
Σε δοκιμές εσωτερικής χρήσης, η λειτουργία μνήμης μείωσε τον χρόνο που απαιτείται για την επανεκκίνηση ενός σύνθετου έργου κατά περίπου 40%, καθώς ο βοηθός θυμάται ήδη τις παραμέτρους και τις προηγούμενες διορθώσεις.

Για παράδειγμα, μπορεί να εντοπίσει ανοιχτά σχόλια στα Google Docs που χρήζουν προσοχής, να ανακτήσει το σχετικό πλαίσιο από το Slack, το Notion και τη βάση κώδικα, και στη συνέχεια να παρουσιάσει μια λίστα ενεργειών ταξινομημένων κατά προτεραιότητα.

Τι έρχεται στην ΕΕ και τι όχι

Είναι απαραίτητο να βάλουμε μια τάξη και να ξεκαθαρίσουμε τι είναι διαθέσιμο από σήμερα και στη χώρα μας εντός ΕΕ.

Καταρχάς, η ενημέρωση διανέμεται σε όλους τους χρήστες της επιτραπέζιας εφαρμογής Codex που συνδέονται με λογαριασμό ChatGPT.

Οι λειτουργίες εξατομίκευσης, όπως οι προτάσεις βάσει πλαισίου και η μνήμη, θα φτάσουν σύντομα και για χρήστες Enterprise, Edu, καθώς και για χρήστες στην ΕΕ και το Ηνωμένο Βασίλειο.

Η χρήση του υπολογιστή (Computer Use) περιορίζεται προς το παρόν σε macOS, με διάθεση που αναμένεται σύντομα και στις χώρες της ΕΕ και στο Ηνωμένο Βασίλειο.

Προειδοποίηση:
Μην περιμένετε να δείτε το εικονίδιο του δεύτερου ποντικιού άμεσα αν βρίσκεστε στην Ελλάδα. Η διάθεση του Computer Use στην ΕΕ καθυστερεί λόγω ρυθμιστικών ελέγχων συμμόρφωσης με το GDPR και την Πράξη για την ΤΝ.

Πίνακας 1: Σύγκριση χαρακτηριστικών Codex Computer Use vs Claude Cowork

ΧαρακτηριστικόOpenAI CodexAnthropic Claude
Πολλαπλοί δρομείςΝαι, ταυτόχρονη χρήσηΌχι
Παράλληλη χρήση από άνθρωποΝαι, χωρίς παρεμβολέςΑποκλειστική χρήση
Ενσωματωμένος browserΝαιΝαι
Διαθεσιμότητα σε ΕΕΑναμένεταιΔιαθέσιμο

Πίνακας 2: Νέες κατηγορίες Plugins (Επιλογή)

Όνομα PluginΚατηγορίαΚύρια λειτουργία
Microsoft SuiteΠαραγωγικότηταΔιαχείριση εγγράφων και email από Word, Excel, Outlook
CodeRabbitΑνάπτυξη ΛογισμικούΑυτόματη αναθεώρηση κώδικα και προτάσεις βελτιστοποίησης
RenderDevOpsΔιαχείριση deployments σε cloud υποδομές
Διακομιστές MCPΠρωτόκολλο ΕπικοινωνίαςΣύνδεση με εξωτερικές βάσεις δεδομένων και εργαλεία

Πρακτικές προεκτάσεις και η επόμενη μέρα για τον προγραμματιστή

Η δυνατότητα χρήσης πολλαπλών δεικτών ποντικιού ταυτόχρονα δεν είναι απλώς ένα εντυπωσιακό τεχνικό επίτευγμα. Αλλάζει ριζικά τον τρόπο με τον οποίο αντιλαμβανόμαστε τη συνεργασία με ένα μοντέλο Τεχνητής Νοημοσύνης.

Σε ένα τυπικό περιβάλλον ανάπτυξης λογισμικού, ο προγραμματιστής μπορεί να γράφει κώδικα στο κύριο παράθυρο του IDE, ενώ ο Codex μετακινεί έναν δεύτερο δρομέα για να ελέγξει την τεκμηρίωση ή να προσαρμόσει τις παραμέτρους ενός εργαλείου προσομοίωσης.

Αυτή η μη παρεμβατική συνύπαρξη εξαλείφει την ανάγκη για συνεχή εναλλαγή πλαισίου (context switching).

Ο ανθρώπινος εγκέφαλος μπορεί να παραμείνει εστιασμένος στη δημιουργική επίλυση προβλημάτων, ενώ η μηχανή αναλαμβάνει τις επαναλαμβανόμενες και χωρικές εργασίες πλοήγησης στη διεπαφή χρήστη.

Η πραγματική καινοτομία έγκειται στην αίσθηση ροής εργασίας που επιτυγχάνεται όταν ο ψηφιακός συνεργάτης δεν διακόπτει, αλλά συμπληρώνει την κίνηση του χεριού σας.

Ιδιαίτερη μνεία αξίζει η ενσωμάτωση του gpt-image-1.5 μέσα στη ροή εργασίας. Οι προγραμματιστές frontend συχνά σπαταλούν πολύτιμο χρόνο αναζητώντας ή δημιουργώντας placeholder γραφικά για να δοκιμάσουν τις διατάξεις τους.

Τώρα, μπορούν να ζητήσουν από τον Codex μέσω φυσικής γλώσσας να δημιουργήσει μια εικόνα συγκεκριμένων διαστάσεων και στυλ, να την εισάγει απευθείας στον φάκελο assets και να ενημερώσει τον κώδικα HTML/CSS για να την αξιοποιήσει.

Όλα αυτά συμβαίνουν μέσα στον ενσωματωμένο browser, επιτρέποντας τον άμεσο οπτικό έλεγχο του αποτελέσματος χωρίς καν να σώσετε το αρχείο.

Ο συνδυασμός της μακροπρόθεσμης μνήμης με τις προηγμένες αυτοματοποιήσεις ανοίγει το δρόμο για αυτό που θα μπορούσαμε να ονομάσουμε «ανθεκτικό προγραμματιστικό πλαίσιο».

Σκεφτείτε ένα σενάριο όπου δουλεύετε σε μια νέα λειτουργία μιας εφαρμογής για δύο ημέρες και μετά φεύγετε για διακοπές.

Επιστρέφοντας, ο Codex δεν σας υποδέχεται με μια κενή οθόνη. Αντίθετα, σας παρουσιάζει μια σύνοψη των τελευταίων αλλαγών, υπενθυμίζει το ανοιχτό ticket στο Jira και σας προτείνει να εκτελέσετε πρώτα τα unit tests που είχαν αποτύχει πριν φύγετε.

Πίνακας 3: Σύγκριση δυνατοτήτων αυτοματισμού πριν και μετά την ενημέρωση

ΛειτουργίαΠροηγούμενη έκδοσηΝέα έκδοση (με Memory)
Επαναφορά πλαισίουΑπαιτείται πλήρης επανάληψη οδηγιώνΑυτόματη ανάκτηση προηγούμενου νήματος
Προγραμματισμός εργασιώνΠεριορισμένος σε συνεδρίεςΠρογραμματισμός για ημέρες/εβδομάδες
Προτάσεις εργασίαςΑνύπαρκτεςΠροληπτικές προτάσεις βάσει email/σχολίων

Ωστόσο, αυτή η ισχύς συνοδεύεται και από νέες προκλήσεις, κυρίως στον τομέα της ασφάλειας και της ιδιωτικότητας.

Η ιδέα ενός μοντέλου ΤΝ που μπορεί να κουνάει το ποντίκι και να βλέπει την οθόνη σας ακόμα και όταν δεν κοιτάτε, απαιτεί ένα ισχυρό πλαίσιο εμπιστοσύνης.

Η OpenAI έχει εφαρμόσει σαφείς οπτικές ενδείξεις (τα μονοπάτια των δρομέων) και περιορισμούς στα δικαιώματα, αλλά ο χρήστης θα πρέπει να είναι προσεκτικός σχετικά με το ποια αρχεία και ποιες εφαρμογές μοιράζεται με τον βοηθό.

Είναι κρίσιμο να θυμόμαστε ότι η χρήση του υπολογιστή (Computer Use) σε περιβάλλον macOS βασίζεται σε APIs προσβασιμότητας. Αυτό σημαίνει ότι ο Codex «βλέπει» μια αναπαράσταση της διεπαφής χρήστη.

Συνεπώς, εάν αφήσετε ανοιχτό ένα ευαίσθητο έγγραφο στην οθόνη, υπάρχει θεωρητικό ενδεχόμενο ο βοηθός να το επεξεργαστεί ως μέρος του περιβάλλοντος εργασίας, εκτός εάν ορίσετε ρητά ζώνες αποκλεισμού ή περιορίσετε τα δικαιώματα σε επίπεδο λειτουργικού συστήματος.

Παρόλο που η λειτουργία καθυστερεί στην ΕΕ λόγω της αυστηρότερης νομοθεσίας περί δεδομένων, αυτή η καθυστέρηση μπορεί να αποδειχθεί ευεργετική.

Επιτρέπει στην κοινότητα να παρατηρήσει τη συμπεριφορά του συστήματος σε άλλες αγορές και να αναπτύξει βέλτιστες πρακτικές ασφαλούς χρήσης πριν από την ευρεία διάθεση στην Ευρώπη.

Μέχρι τότε, οι Ευρωπαίοι χρήστες μπορούν να επωφεληθούν πλήρως από τις βελτιώσεις στη μνήμη και τις αυτοματοποιήσεις, προετοιμάζοντας το έδαφος για την πλήρη ενσωμάτωση του Computer Use μόλις αυτό λάβει το πράσινο φως από τις ρυθμιστικές αρχές.

Συμπερασματικά, η κίνηση της OpenAI με τα «πολλαπλά ποντίκια» αποτελεί μια στρατηγική διαφοροποίηση από τον ανταγωνισμό.

Δεν πρόκειται πλέον για έναν βοηθό που παίρνει τον έλεγχο, αλλά για έναν συνάδελφο που εργάζεται δίπλα σας, στον ίδιο πάγκο εργασίας, με το δικό του σετ εργαλείων. Είναι μια μετάβαση από την αυτοματοποίηση στη συμβιωτική συνεργασία.

Πίνακας 4: Χρονοδιάγραμμα διάθεσης λειτουργιών Codex

ΛειτουργίαΔιαθεσιμότητα σε ΕΕΠλατφόρμα
Computer Use (Πολλαπλά Ποντίκια)Αναμένεται σύντομαmacOS
Μνήμη (Memory) & ΠροτάσειςΣύντομα διαθέσιμοDesktop App
Ενσωματωμένος Browser & ΕικόνεςΆμεσα διαθέσιμοDesktop App
90+ Plugins & MCP ServersΆμεσα διαθέσιμοDesktop App
Στέλιος Θεοδωρίδης
Στέλιος Θεοδωρίδης
Ο ήρωας μου είναι ο γάτος μου ο Τσάρλι και ακροάζομαι μόνο Psychedelic Trance
RELATED ARTICLES

Πρόσφατα άρθρα

Tηλέφωνα έκτακτης ανάγκης

Δίωξη Ηλεκτρονικού Εγκλήματος: 11188
Ελληνική Αστυνομία: 100
Χαμόγελο του Παιδιού: 210 3306140
Πυροσβεστική Υπηρεσία: 199
ΕΚΑΒ 166