Σχεδόν σε κάθε άρθρο που σχετίζεται με τα emoticons αναφέρεται η λέξη “Unicode”, ένας όρος που ορίζεται ως “ένα πρότυπο κωδικοποίησης χαρακτήρων που έχει σχεδιαστεί για να διευκολύνει την επεξεργασία, τη μετάδοση και την προβολή κειμένων από πολλές γλώσσες και τεχνικούς κλάδους, καθώς και κειμένων από κλασικές νεκρές γλώσσες”.
Επειδή το “Unicode” είναι κάτι άγνωστο για τον μέσο άνθρωπο, ας δούμε ποια είναι η προέλευση και η ιστορία αυτού του προτύπου κωδικοποίησης που ρυθμίζεται από μια επιτροπή που εγκρίνει τα emojis.
Προέλευση και ιστορία του προτύπου Unicode
Το πρότυπο Unicode δημιουργήθηκε το 1987 από τον Joe Becker, υπάλληλο της Xerox (μια γνωστή μάρκα εκτυπωτών και αναλώσιμων) και τους Lee Collins και Mark Davis, δύο υπαλλήλους της Apple με στόχο να κωδικοποιήσουν και να ενοποιήσουν υπό ένα μοντέλο όλα τα συστήματα γραφής των ομιλούμενων γλωσσών, καθώς αλλιώς θα έρχοταν μια στιγμή που οι υπολογιστές δεν θα μπορούσαν να εμφανίσουν τους χαρακτήρες πολλών γλωσσών.
Ως εκ τούτου, η κύρια αποστολή του προτύπου Unicode ήταν να εκχωρήσει έναν μοναδικό και καθολικό κώδικα σε κάθε χαρακτήρα των γλωσσών που υπήρχαν εκείνη την εποχή.
Μερικά χρόνια αργότερα, το 1991, μετά από διάφορες συναντήσεις των ιδρυτών του προτύπου Unicode, τέθηκε σε εφαρμογή μια διαδικασία που είχε ως στόχο να κάνει γνωστό αυτό το νέο πρότυπο σε όλο τον κόσμο και ως μέρος αυτής της στρατηγικής δημοσιεύτηκε “The Unicode Standard – Worldwide Character Encoding”, το πρώτο βιβλίο στην ιστορία που έχει συλλέξει τους κώδικες που έχουν εκχωρηθεί σε όλες τις γλώσσες του κόσμου.
Τα επόμενα χρόνια, μερικές από τις μεγάλες παγκόσμιες τεχνολογικές εταιρείες όπως η Microsoft, η IBM, η Apple, η Sun, η Adobe ή η HP άρχισαν να υιοθετούν αυτό το νέο πρότυπο αντί για το ASCII, το οποίο μέχρι τότε ήταν το επίσημο πρότυπο στις Ηνωμένες Πολιτείες. Μάλιστα, το 1992 το περιοδικό PC Magazine δημοσίευσε ένα άρθρο με τίτλο Kiss Your ASCII Goodbye στο οποίο υποστηριζόταν ότι “[το Unicode] θα μπορούσε τελικά να σπάσει το γλωσσικό φράγμα στους υπολογιστές”, όπως τελικά και έγινε.
Τι κάνει το πρότυπο Unicode;
Βασικά, αυτό που κάνει το πρότυπο Unicode είναι να μας επιτρέπει να διαβάζουμε τους χαρακτήρες γλωσσών από ξένες περιοχές, καθώς κάθε φορά που πατάμε ένα γράμμα στο πληκτρολόγιο του κινητού μας ή στέλνουμε ένα emoticon σε έναν φίλο, αυτό που εμφανίζεται στην οθόνη είναι επί της ουσίας χαρακτήρες που η συσκευή μας μπορεί να ερμηνεύσει χάρη στο πρότυπο Unicode.
Εάν βλέπετε αυτό το emoticon δεν είναι επειδή σας έρχεται αυτούσιο, με τη μορφή εικόνας, αλλά επειδή ο υπολογιστής σας ερμηνεύει ότι ο κώδικας U+x1F602 που έχει εκχωρήσει το Unicode σε αυτό το emoji αντιστοιχεί στο εικονίδιο του προσώπου που γελάει δυνατά. Επιπλέον, αν κάνετε screenshot σε αυτό το emoji και το μοιραστείτε με χρήστες από άλλες περιοχές του κόσμου, αυτοί θα σας επιβεβαιώσουν ότι βλέπουν ένα εντελώς διαφορετικό εικονίδιο από το δικό σας.
Ποια είναι η αποστολή της κοινοπραξίας Unicode σε σχέση με τα emojis;
Το πρότυπο Unicode ελέγχεται από μια κοινοπραξία η οποία είναι υπεύθυνη για την έγκριση των νέων emojis που φτάνουν στις κινητές μας συσκευές. Εν τούτοις για να μην υπάρχουν παρανοήσεις, αυτή η επιτροπή δεν αποφασίζει τον σχεδιασμό των emoticons, αλλά απλώς παρέχει στις εταιρείες όπως την Samsung ή την Apple τον αριθμητικό κώδικα και την ασπρόμαυρη αναπαράσταση των emojis που λαμβάνουν έγκριση.
Αυτό σημαίνει ότι οι εταιρείες είναι αυτές που δημιουργούν τα σχέδια που θέλουν να εφαρμόσουν στα emojis τους και αυτός είναι ο βασικός λόγος για τον οποίο ένα emoticon ενός χαμογελαστού προσώπου δεν φαίνεται το ίδιο σε ένα κινητό Samsung με ένα iPhone.
Βασικές Αρχές και Λειτουργία του προτύπου Unicode
Κωδικοποίηση:
Το Unicode αναθέτει έναν μοναδικό κωδικό σε κάθε χαρακτήρα, ανεξαρτήτως της πλατφόρμας, του προγράμματος ή της γλώσσας. Η κωδικοποίηση αυτή επιτρέπει στους υπολογιστές να αναγνωρίζουν και να απεικονίζουν χαρακτήρες από όλες τις γλώσσες του κόσμου.
Unicode Transformation Formats (UTF):
Το Unicode υποστηρίζει διάφορες μορφές μετατροπής, όπως το UTF-8, το UTF-16 και το UTF-32. Το UTF-8 είναι η πιο κοινή μορφή, χρησιμοποιώντας 1 έως 4 bytes για την κωδικοποίηση κάθε χαρακτήρα, προσφέροντας συμβατότητα με το ASCII και εξοικονόμηση χώρου.
Σημασία και Εφαρμογές του προτύπου Unicode
Παγκόσμια Επικοινωνία:
Το Unicode διευκολύνει την παγκόσμια επικοινωνία μέσω των ηλεκτρονικών μέσων, επιτρέποντας τη χρήση και την ανταλλαγή κειμένου σε οποιαδήποτε γλώσσα.
Διεθνείς Ιστότοποι και Λογισμικά:
Ιστότοποι και λογισμικά χρησιμοποιούν το Unicode για να υποστηρίζουν πολλαπλές γλώσσες και σύμβολα, παρέχοντας μια ενιαία και συνεπή εμπειρία χρήστη.
Emoji:
Ένα από τα πιο δημοφιλή παραδείγματα εφαρμογής του Unicode είναι τα emoji. Το Unicode Consortium, η επιτροπή που διαχειρίζεται το πρότυπο, εγκρίνει νέους emoji και τους αναθέτει κωδικούς, επιτρέποντας την εμφάνισή τους σε διάφορες πλατφόρμες και συσκευές.
Unicode Consortium
Λειτουργία:
Το Unicode Consortium είναι ένας μη κερδοσκοπικός οργανισμός που διαχειρίζεται την ανάπτυξη του προτύπου Unicode. Αποτελείται από μέλη από την βιομηχανία της τεχνολογίας, ακαδημαϊκά ιδρύματα και άλλους ενδιαφερόμενους.
Εγκρίσεις και Εκδόσεις:
Το κονσόρτσιουμ εκδίδει τακτικά νέες εκδόσεις του προτύπου Unicode, που περιλαμβάνουν νέους χαρακτήρες, σύμβολα και emoji. Η διαδικασία έγκρισης περιλαμβάνει προτάσεις από μέλη και το κοινό, καθώς και αξιολόγηση και συζήτηση από την επιτροπή.
Επέκταση και Βελτίωση του Unicode
Εκδόσεις και Ενημερώσεις:
Το Unicode ενημερώνεται συνεχώς για να καλύπτει τις ανάγκες των χρηστών και να ενσωματώνει νέους χαρακτήρες. Από την πρώτη του έκδοση το 1991, το Unicode έχει φτάσει σε πολλές εκδόσεις, με την πιο πρόσφατη έκδοση (Unicode 15.0) να περιλαμβάνει πάνω από 143.000 χαρακτήρες.
Προσθήκες Χαρακτήρων:
Οι νέες εκδόσεις περιλαμβάνουν προσθήκες από αρχαίες και σύγχρονες γλώσσες, επιστημονικά σύμβολα, μουσικά σύμβολα, και φυσικά, νέα emoji. Η προσθήκη αυτών των χαρακτήρων γίνεται μετά από πρόταση και έγκριση από το Unicode Consortium, λαμβάνοντας υπόψη την πολιτιστική και τεχνική σημασία τους.
Διαλειτουργικότητα και Υποστήριξη
Υποστήριξη Λογισμικού:
Πολλά σύγχρονα λειτουργικά συστήματα, προγράμματα περιήγησης, και λογισμικά υποστηρίζουν το Unicode, επιτρέποντας τη σωστή εμφάνιση και επεξεργασία κειμένων σε διαφορετικές γλώσσες. Για παράδειγμα, λειτουργικά συστήματα όπως τα Windows, macOS, και Linux, καθώς και εφαρμογές όπως το Microsoft Word και το Google Docs, είναι πλήρως συμβατά με το Unicode.
Πρότυπα και Διαλειτουργικότητα:
Το Unicode συνεργάζεται στενά με άλλα πρότυπα κωδικοποίησης και επικοινωνίας, όπως το ISO/IEC 10646, για να διασφαλίσει τη διαλειτουργικότητα μεταξύ διαφορετικών συστημάτων και πλατφορμών. Αυτή η συνεργασία επιτρέπει τη χρήση Unicode χαρακτήρων σε διάφορα δίκτυα και συστήματα χωρίς προβλήματα συμβατότητας.
Το Unicode συμβάλλει στη διατήρηση πολιτιστικών κειμένων και γλωσσών, συμπεριλαμβάνοντας χαρακτήρες από λιγότερο γνωστές ή ακόμη και γλώσσες που βρίσκονται υπό εξαφάνιση. Αυτή η προσπάθεια διασφαλίζει ότι κείμενα και έγγραφα σε αυτές τις γλώσσες μπορούν να διατηρηθούν και να αναπαραχθούν ψηφιακά.
Τεχνικές Πτυχές
UTF-8:
Η UTF-8 είναι η πιο διαδεδομένη μορφή κωδικοποίησης Unicode και χρησιμοποιείται ευρέως στο Διαδίκτυο και τα σύγχρονα συστήματα. Είναι σχεδιασμένη ώστε να είναι συμβατή με το ASCII και μπορεί να κωδικοποιήσει οποιονδήποτε χαρακτήρα Unicode χρησιμοποιώντας από 1 έως 4 bytes, κάνοντάς την αποδοτική και ευέλικτη.
UTF-16 και UTF-32:
Εκτός από την UTF-8, υπάρχουν και άλλες μορφές κωδικοποίησης όπως η UTF-16 και η UTF-32. Η UTF-16 χρησιμοποιεί 2 ή 4 bytes για την κωδικοποίηση κάθε χαρακτήρα, ενώ η UTF-32 χρησιμοποιεί 4 bytes για κάθε χαρακτήρα. Κάθε μία από αυτές τις μορφές έχει τα δικά της πλεονεκτήματα και χρήσεις, ανάλογα με τις απαιτήσεις της εφαρμογής.