Στο παρόν εκπαιδευτικό άρθρο εξετάσουμε πως μπορούμε να δημιουργήσουμε ψηφιακές εικόνες χρησιμοποιώντας την τεχνητή νοημοσύνη DALL·E στον Linux διακομιστή (αγγλικά: server) μας, αξιοποιώντας τις API που παρέχονται από την OpenAI.
Τα τελευταία χρόνια, τα μοντέλα τεχνητής νοημοσύνης (AI) και οι συναφείς τεχνολογίες έχουν εξελιχθεί σημαντικά, επιτρέποντας την αυτοματοποίηση πολλών διαδικασιών που προηγουμένως απαιτούσαν εντατική και συχνά επαναλαμβανόμενη χειρωνακτική εργασία.
Τα λογισμικά τύπου AI (Artificial Intelligence) αναμένεται να γίνουν ένα εργαλείο που θα βελτιώσει και θα απλοποιήσει τη ροή εργασίας χιλιάδων επαγγελματιών. Εν τούτοις, δεν σημαίνει ότι οι άνθρωποι θα αντικατασταθούν πλήρως, αλλά ότι αυτού του είδους τα λογισμικά θα ενσωματωθούν σε διάφορα εργαλεία και εφαρμογές, καθιστώντας τη δουλειά μας πιο αποδοτική.
Τι είναι το DALL·E
Το DALL·E είναι μια τεχνητή νοημοσύνη που έχει αναπτυχθεί για να δημιουργεί εικόνες από κείμενες περιγραφές. Η υλοποίησή της σε έναν διακομιστή Linux δεν είναι δωρεάν, αλλά μπορεί να αποδειχθεί χρήσιμη σε επιχειρηματικά περιβάλλοντα όπου απαιτείται η άμεση παραγωγή γραφικών στοιχείων, όπως για μια διαφημιστική καμπάνια.
Οι εφαρμογές του DALL·E είναι πολλές και δεν απαιτείται η χρήση ισχυρού υλικού, καθώς οι περισσότερες διαδικασίες εκτελούνται μέσω ενός συνόλου API στο Cloud της OpenAI. Έτσι, είναι δυνατή η χρήση του DALL·E ακόμη και σε μικρές πλατφόρμες ARM, όπως το Raspberry Pi ή σε NAS.
Απόκτηση του OpenAI API Key
Πριν ξεκινήσουμε τη ρύθμιση του διακομιστή Linux για το DALL·E, είναι απαραίτητο να αποκτήσουμε το OpenAI API Key, ώστε να μπορέσουμε να αλληλεπιδράσουμε με το Cloud της OpenAI και να έχουμε πρόσβαση στη δημιουργία εικόνων. Χωρίς αυτό το κλειδί, η ρύθμιση μας δεν θα λειτουργήσει.
Αρχικά, εγγραφείτε στην ιστοσελίδα της OpenAI. Μετά την πρώτη σύνδεση με τα στοιχεία που δημιουργήσατε, θα έχετε πρόσβαση στην ενότητα “API”. Κάντε κλικ σε αυτήν και στη συνέχεια μεταβείτε στην ενότητα “API keys”, που αναπαρίσταται από ένα εικονίδιο λουκέτου στην αριστερή πλευρά.
Στη συνέχεια, κάντε κλικ στο κουμπί “Create a new Secret key”, δώστε ένα όνομα στη νέα κλειδί και πατήστε το πράσινο κουμπί “Create secret key”. Αντιγράψτε την παραγόμενη αλφαριθμητική συμβολοσειρά σε ένα σημειωματάριο, καθώς θα χρειαστείτε αυτήν αργότερα για να ολοκληρώσετε το σενάριο που απαιτείται για τη δημιουργία εικόνων με το DALL·E.
Ρύθμιση του Διακομιστή Linux για Δημιουργία Εικόνων με DALL·E
Τώρα είμαστε έτοιμοι να ρυθμίσουμε τον διακομιστή Linux μας ώστε να δημιουργεί εικόνες χρησιμοποιώντας τον αλγόριθμο τεχνητής νοημοσύνης του DALL·E. Σε αυτήν την οδηγία θα χρησιμοποιήσουμε το Debian, αλλά τα επόμενα βήματα ισχύουν και για άλλες διανομές.
Αρχικά, ελέγξτε ότι έχετε όλα τα πακέτα ενημερωμένα στην τελευταία τους έκδοση μέσω της γραμμής εντολών του διαχειριστή πακέτων APT:
sudo apt update && sudo apt upgrade -y
Με την επιλογή -y
, ενημερώνουμε το σύστημα να απαντά θετικά σε όλες τις ερωτήσεις του διαχειριστή πακέτων. Ωστόσο, είναι σημαντικό να προσέχετε τα πακέτα που ενημερώνονται με αυτόν τον τρόπο, καθώς μπορεί να απεγκατασταθεί κάποιο πακέτο που είναι χρήσιμο για τη ροή εργασίας μας.
Στη συνέχεια, προχωρήστε στην εγκατάσταση των πακέτων του γλώσσας Python και του διαχειριστή πακέτων Pip:
sudo apt install python3 python3-venv python3-pip
Ρύθμιση του Python Virtual Environment
Τώρα πρέπει να ρυθμίσουμε το Python virtual environment για να εργαστούμε με το DALL·E. Επιστρέφουμε στη γραμμή εντολών και δημιουργούμε έναν κατάλογο:
mkdir ~/dalle
Μεταφερόμαστε μέσα σε αυτόν τον κατάλογο:
cd ~/dalle
και δημιουργούμε το Python virtual environment με την εντολή:
python3 -m venv env
Τώρα, παραμένοντας μέσα στον κατάλογο dalle
, δηλώνουμε στη γραμμή εντολών να χρησιμοποιήσει αυτό το virtual environment:
source env/bin/activate
Στη συνέχεια, προχωρούμε στην εγκατάσταση των βιβλιοθηκών Python που έχει δημιουργήσει η OpenAI για το DALL·E:
python3 -m pip install openai
Δημιουργία Python script για δημιουργία εικόνων με DALL·E
Αυτή τη στιγμή είμαστε έτοιμοι να δημιουργήσουμε ένα Python script που θα παράγει την επιθυμητή εικόνα:
nano generate.py
Ακολουθεί ένα παράδειγμα script για να γεμίσετε το αρχείο:
from openai import OpenAI
import urllib.request
client = OpenAI(
api_key='LANOSTRAKEYGENERATAPRIMA'
)
generation_prompt = "A dark cat"
response = client.images.generate(
model="dall-e-3",
prompt=generation_prompt,
size="1024x1024",
quality="standard",
n=1
)
image_url = response.data[0].url
urllib.request.urlretrieve(image_url, "gattonero.png")
Αποθηκεύστε τις αλλαγές με CTRL+O
και κλείστε τον επεξεργαστή κειμένου nano με CTRL+X
. Ας αναλύσουμε αυτό το script.
Ξεκινάμε με τις πρώτες δύο γραμμές:
from openai import OpenAI
import urllib.request
Αυτές οι γραμμές δηλώνουν στο σύστημα ποιες βιβλιοθήκες θα χρησιμοποιηθούν. Στη συνέχεια, η παρακάτω εντολή:
client = OpenAI(
api_key='LANOSTRAKEYGENERATAPRIMA'
)
ρυθμίζει το OpenAI API Key που δημιουργήσαμε νωρίτερα. Ακολουθεί η μεταβλητή generation_prompt
:
generation_prompt = "A dark cat"
Σε αυτήν την περίπτωση, επιλέγουμε να δημιουργήσουμε την εικόνα ενός μαύρου γάτου. Αφού επιλέξουμε την εικόνα που θέλουμε να δημιουργήσουμε, καθορίζουμε επίσης μια σειρά προδιαγραφών, όπως το μοντέλο που θα χρησιμοποιηθεί (DALL·E 3), η ανάλυση και η ποιότητα της εικόνας:
response = client.images.generate(
model="dall-e-3",
prompt=generation_prompt,
size="1024x1024",
quality="standard",
n=1
)
Η τελική εντολή του σεναρίου ασχολείται με τη δημιουργία του URL όπου μπορούμε να βρούμε την εικόνα, η οποία, όπως θυμόμαστε, επεξεργάζεται στα συστήματα Cloud της OpenAI, καθώς και το όνομα με το οποίο θα αποθηκευτεί το αρχείο:
urllib.request.urlretrieve(image_url, "gattonero.png")
Τώρα που κατανοούμε πώς λειτουργεί το παραγόμενο σενάριο, μπορούμε να το εκτελέσουμε από το τερματικό:
python3 generate.py
Μετά από λίγα λεπτά, θα βρείτε μέσα στον κατάλογο ~/dalle
μια εικόνα σε μορφή PNG με το όνομα gattonero.png
.
Όπως μπορείτε να παρατηρήσετε, αυτό το σενάριο είναι πολύ απλό και κατανοητό. Ανάλογα με τις ανάγκες σας, μπορείτε να δημιουργήσετε την εικόνα που επιθυμείτε με τις επιθυμητές προδιαγραφές.
Αυτό το εκπαιδευτικό μάθημα που σας παρέχουμε αποδεικνύει πόσο εύκολο είναι να χρησιμοποιήσετε το DALL·E και να ενσωματώσετε αυτήν την τεχνολογία στη ροή εργασίας σας χωρίς να χρειάζεται να μελετήσετε σε βάθος τη λειτουργία της.
Συμπέρασμα
Η δημιουργία εικόνων με το DALL·E στον διακομιστή Linux σας είναι μια διαδικασία που μπορεί να γίνει γρήγορα και αποτελεσματικά, ακολουθώντας τα παραπάνω βήματα. Η δυνατότητα παραγωγής γραφικών στοιχείων από απλές περιγραφές κειμένου ανοίγει νέες προοπτικές για επαγγελματίες σε διάφορους τομείς, όπως το μάρκετινγκ, η διαφήμιση και η δημιουργική γραφή.
Η τεχνητή νοημοσύνη, όπως το DALL·E, δεν αντικαθιστά τη δημιουργικότητα και την ανθρώπινη παρέμβαση, αλλά προσφέρει ένα ισχυρό εργαλείο που μπορεί να ενισχύσει τη διαδικασία δημιουργίας και να διευκολύνει την παραγωγή περιεχομένου. Με την κατάλληλη ρύθμιση και χρήση, μπορείτε να αξιοποιήσετε πλήρως τις δυνατότητες αυτής της τεχνολογίας και να βελτιώσετε την αποδοτικότητα της εργασίας σας.
Αν έχετε οποιαδήποτε ερώτηση ή χρειάζεστε βοήθεια κατά τη διάρκεια της διαδικασίας, μη διστάσετε να αναζητήσετε υποστήριξη από την κοινότητα ή να συμβουλευτείτε την τεκμηρίωση της OpenAI. Η τεχνολογία εξελίσσεται συνεχώς, και η εκμάθηση νέων εργαλείων μπορεί να σας δώσει πλεονέκτημα στον τομέα σας.