GPT-4o Mini: Έχει ανοσία στις επιθέσεις εισαγωγής εντολών (Prompt-Injection)

22 Ιουλίου 2024

0

Η OpenAI παρουσίασε την τεχνολογία “Instruction Hierarchy” στο νέο της μοντέλο GPT-4o Mini, η οποία έχει στόχο να εξαλείψει τις επιθέσεις εισαγωγής εντολών (prompt injections).

Σύμφωνα με το The Verge, η OpenAI ενσωμάτωσε στο GPT-4o Mini ένα χαρακτηριστικό ασφαλείας για την αντιμετώπιση των επιθέσεων εισαγωγής εντολών, οι οποίες συχνά χρησιμοποιούνται για την παραπλάνηση των chatbots ώστε να παραβιάσουν τον προγραμματισμό τους.

Στο παρελθόν, διάφοροι χρήστες προσπαθούσαν να χειραγωγήσουν τα συστήματα με απλές φράσεις όπως “αγνόησε όλες τις προηγούμενες εντολές”.

Για να αντιμετωπίσει αυτό το πρόβλημα, η OpenAI χρησιμοποίησε την τεχνολογία “Instruction Hierarchy”. Η μέθοδος αυτή δίνει προτεραιότητα στις αρχικές εντολές που ορίζει ο προγραμματιστής σε σχέση με τυχόν αντιφατικές εντολές που εισάγονται από χρήστες. Ο Olivier Godement, επικεφαλής της πλατφόρμας API στην OpenAI, δήλωσε ότι η προσέγγιση αυτή “εκπαιδεύει το μοντέλο να ακολουθεί πιστά τις οδηγίες του προγραμματιστή”.

Αυτή η εξέλιξη είναι ιδιαίτερα σημαντική με γνώμονα την ανάπτυξη μελλοντικών αυτόνομων AI agents, όπως αναφέρει το Bloomberg. Οι πιθανοί κίνδυνοι που σχετίζονται με μη προστατευμένα AI agents είναι σημαντικοί. Χωρίς κατάλληλους μηχανισμούς ασφαλείας, ένα agent που έχει σχεδιαστεί π.χ. για επικοινωνία μέσω email, θα μπορούσε να χειραγωγηθεί για να αποκαλύψει ευαίσθητες πληροφορίες.

Το GPT-4o Mini αποτελεί το νέο βασικό μοντέλο της OpenAI. Στο benchmark MMLU (Massive Multitask Language Understanding) πετυχαίνει σκορ 82%, ξεπερνώντας τις δυνατότητες του GPT-3.5 Turbo, το οποίο έφτανε στο 69,8%.

Η OpenAI προσφέρει το GPT-4o Mini σε τιμή έως και 60% χαμηλότερη από το GPT-3.5 Turbo. Οι προγραμματιστές χρεώνονται 15 cents ανά εκατομμύριο tokens εισόδου και 60 cents ανά εκατομμύριο tokens εξόδου, ποσότητα που αντιστοιχεί περίπου σε 2.500 σελίδες σε ένα τυπικό βιβλίο, σύμφωνα με την OpenAI.

Η προσθήκη της Ιεραρχίας Εντολών είναι μέρος της ευρύτερης στρατηγικής της OpenAI για τη βελτίωση της ασφάλειας και της αξιοπιστίας των γλωσσικών μοντέλων της. Η εταιρεία έχει επενδύσει σημαντικούς πόρους στην ανάπτυξη μηχανισμών που εξασφαλίζουν ότι τα μοντέλα τεχνητής νοημοσύνης λειτουργούν σύμφωνα με τις προδιαγραφές και τις ηθικές κατευθυντήριες γραμμές που ορίζονται από τους προγραμματιστές.

Αυτό είναι κρίσιμο για την αποτροπή κακόβουλων ενεργειών που θα μπορούσαν να οδηγήσουν σε ανεπιθύμητες συμπεριφορές των μοντέλων.

Επιπλέον, το GPT-4o Mini προσφέρει βελτιωμένες επιδόσεις στην επεξεργασία φυσικής γλώσσας σε σύγκριση με τους προκατόχους του, κάτι που το καθιστά ιδανικό για επιχειρηματικές εφαρμογές που απαιτούν υψηλή ακρίβεια και απόκριση. Με την ανταγωνιστική του τιμολόγηση, το GPT-4o Mini καθιστά την προηγμένη τεχνητή νοημοσύνη πιο προσιτή σε μικρομεσαίες επιχειρήσεις, επιτρέποντάς τους να επωφεληθούν από τις δυνατότητες των προηγμένων γλωσσικών μοντέλων χωρίς να επιβαρύνονται με υψηλό κόστος.

Προηγούμενο άρθρο

Ηλεκτρική αναβίωση για το Smart Roadster;

Επόμενο άρθρο

Η Samsung εγκαταλείπει την εφαρμογή Samsung Messages στις ΗΠΑ υπέρ του Google Messages

GPT-4o Mini: Έχει ανοσία στις επιθέσεις εισαγωγής εντολών (Prompt-Injection)

Πρόσφατα άρθρα

Tηλέφωνα έκτακτης ανάγκης

Σχετικά με εμάς

Εργαλεία

Αντιγραφή περιεχομένου

Kοινωνικά δίκτυα

Σύνδεσμοι