Κατά τη διάρκεια της τελευταίας δεκαετίας, το «big data» έχει καταστεί το επίκεντρο πολλών τεχνολογικών κολοσσών στην Silicon Valley. Η εκπαίδευση στα μεγάλα σύνολα δεδομένων και τα μοντέλα μηχανικής μάθησης (ML) μπορούν να αναπτύξουν μια βαθιά κατανόηση ενός τομέα, οδηγώντας σε καινοτομίες για όλες τις κορυφαίες εταιρείες στον χώρο της τεχνολογίας. Η Google, για παράδειγμα, βελτιώνει τους αλγόριθμους κατάταξης των αποτελεσμάτων της παρακολουθώντας και αναλύοντας περισσότερα από ένα τρισεκατομμύρια ερωτήματα αναζήτησης κάθε χρόνο, κάτι που αποδεικνύεται ότι η ανάγκη να απαντά σε όλα τα ερωτήματα των αναζητήσεων θα έχει ως αρνητικό πρόσημο να προκύψουν κενά, λόγω μη επαρκών δεδομένων.
Ωστόσο, υπάρχει ένα πρόβλημα που αφορά σχεδόν όλες τις επιχειρηματικές οντότητες που δραστηριοποιούνται ψηφιακά: Οι περισσότερες εταιρείες περιορίζονται στα «μικρά» δεδομένα. Σε πολλές περιπτώσεις, διαθέτουν μόνο μερικές δεκάδες παραδείγματα των διαδικασιών που θέλουν να αυτοματοποιήσουν χρησιμοποιώντας τη μηχανική μάθηση (ML ). Εάν προσπαθείτε να δημιουργήσετε ένα ισχυρό σύστημα ML για εταιρικούς πελάτες, πρέπει να αναπτύξετε νέες τεχνικές για να ξεπεράσετε αυτήν την έλλειψη δεδομένων.
Ειδικότερα δύο τεχνικές, το transfer learning (μεταφορά μάθησης ) και το collective learning (συλλογική μάθηση) έχουν αποδειχθεί κρίσιμες για τη μετατροπή των μικρών δεδομένων στο big data, επιτρέποντας σε εταιρείες μεσαίου μεγέθους να επωφεληθούν από περιπτώσεις χρήσης ML που κάποτε προορίζονταν μόνο για τους Big Tech. Και επειδή μόλις το 15% των εταιρειών έχουν ήδη αναπτύξει AI ή ML, υπάρχει μια τεράστια ευκαιρία για αυτές τις τεχνικές να μεταμορφώσουν τον επιχειρηματικό κόσμο.
Από DIY έως ανοιχτού κώδικα
Φυσικά, τα δεδομένα δεν είναι η μόνη προϋπόθεση για να λειτουργήσει ομαλά και σωστά ένα μοντέλο μηχανικής μάθησης παγκόσμιας κλάσης. Υπάρχει επίσης το ζήτημα της κατασκευής αυτού του μοντέλου. Δεδομένης της μικρής προσφοράς μηχανικών στη μηχανική μάθηση, η πρόσληψη μιας ομάδας εμπειρογνωμόνων για την κατασκευή ενός συστήματος ML από το μηδέν δεν είναι απλώς επιλογή για τους περισσότερους οργανισμούς, αλλά μία ανοιχτή πληγή που αν δεν κλείσει θα επιφέρει προβλήματα. Αυτή η ιδιομορφία μπορεί να δώσει τα εχέγγυα σε μία εταιρεία να κατανοήσει πως πρέπει να προβεί αμέσως στις απαιτούμενες ενέργειες εάν δεν θέλει να πορεύεται με ελλιπή ή παρωχημένα δεδομένα που δεν είναι κατάλληλα για σοβαρές αποφάσεις, κάτι που το κατάλαβε εδώ και καιρό η Google.
Αλλά τα τελευταία χρόνια, ορισμένα μοντέλα ML ανοιχτού κώδικα, συμπεριλαμβανομένου του διάσημου μοντέλου BERT για κατανόηση γλώσσας, το οποίο κυκλοφόρησε η Google το 2018, έχουν αρχίσει να αλλάζουν το παιχνίδι. Η πολυπλοκότητα της δημιουργίας ενός μοντέλου, του διαμετρήματος του BERT, που όσο κι αν φαίνεται παράξενο έχει εκδώσει περίπου 340 εκατομμύρια παραμέτρους, πράγμα που σημαίνει πως λίγοι οργανισμοί σε όλο τον κόσμο μπορούν ακόμη να εξετάσουν το ενδεχόμενο δημιουργίας τέτοιων πρωτοβουλιών. Ωστόσο, επειδή είναι ανοιχτού κώδικα, οι εταιρείες μπορούν τώρα να τροποποιήσουν αυτό το διαθέσιμο playbook για να αντιμετωπίσουν τις συγκεκριμένες περιπτώσεις χρήσης τους.
Για να κατανοήσετε πως μοιάζουν αυτές οι περιπτώσεις χρήσης, σκεφτείτε μια εταιρεία όπως η Medallia, που είναι πελάτης της Moveworks. Από μόνη της, η Medallia δεν διαθέτει αρκετά δεδομένα για να δημιουργήσει και να εκπαιδεύσει ένα αποτελεσματικό σύστημα ML για εσωτερική χρήση, όπως υποστήριξη στους IT. Και αξιοποιώντας νέες τεχνικές για να συγκεντρώσει αυτές τις γνώσεις, η Medallia έχει γίνει πιο αποτελεσματική, αναγνωρίζοντας ποιες εσωτερικές ροές εργασίας χρειάζονται προσοχή στην κατανόηση της συγκεκριμένης εταιρείας για τη μεθοδολογία που χρησιμοποιούν οι υπάλληλοι της όταν ζητούν τεχνική υποστήριξη. Με το παραπάνω παράδειγμα, οφείλετε να καταλάβετε πως τα μικρά δεδομένα (small data) περιέχουν ένα θησαυρό πληροφοριών που αν εισαχθούν σωστά στο μοντέλο ML θα προκύψουν αντικειμενικά πολλά οφέλη.
Μαζική πρόοδος στα μικρά δεδομένα
Εδώ είναι η ερώτηση του ενός εκατομμυρίου ευρώ: Πως παίρνουμε ένα μοντέλο ML ανοιχτού κώδικα που έχει σχεδιαστεί για να λύσει ένα συγκεκριμένο πρόβλημα και να εφαρμόσουμε έπειτα αυτό το μοντέλο σε ένα διαφορετικό πρόβλημα στην επιχείρηση; Η απάντηση ξεκινά με τη μεταφορά μάθησης, η οποία, αναπάντεχα, συνεπάγεται με τη μεταφορά γνώσεων που αποκτήθηκαν από έναν τομέα σε κάποιο διαφορετικό που έχει λιγότερα δεδομένα.
Για παράδειγμα, παίρνοντας ένα μοντέλο ανοιχτού κώδικα ML όπως το BERT, σχεδιασμένο να κατανοεί τη γενική μεθοδολογία, και να βελτιωθεί με την πάροδο του καιρού, είναι πλέον δυνατό για το ML να κατανοήσει τη μοναδική γλώσσα που χρησιμοποιούν οι υπάλληλοι για να περιγράψουν θέματα πληροφορικής. Και η γλώσσα είναι μόνο η αρχή, αφού μόλις αρχίσαμε να συνειδητοποιούμε το τεράστιο δυναμικό των μικρών δεδομένων.
Γενικότερα, αυτή η πρακτική της τροφοδοσίας ενός μοντέλου ML με μια πολύ μικρή και πολύ συγκεκριμένη επιλογή δεδομένων εκπαίδευσης ονομάζεται few-shot learning (λίγη μάθηση), ένας όρος που έγινε γρήγορα το επίκεντρο στην ευρύτερη κοινότητα του ML. Μερικά από τα πιο ισχυρά μοντέλα ML που δημιουργήθηκαν ποτέ, όπως το μοντέλο GPT-3 με 175 δισεκατομμύρια παραμέτρους, που είναι αρκετές τάξεις μεγέθους πιο πάνω από τον BERT, έχουν δείξει μια άνευ προηγουμένου ικανότητα για την εκμάθηση νέων εργασιών με λίγα μόνο παραδείγματα ως εκπαίδευση.
Με λίγα λόγια, το GPT-3 κατέστη αμέσως ικανό να ανταπεξέλθει σε αυτά τα νέα καθήκοντα και μάλιστα με συνοπτικές διαδικασίες, χτίζοντας ένα ισχυρό θεμέλιο γνώσης για όλους τους ενδιαφερόμενους που ασχολούνται με αυτό το αντικείμενο. Και παρόλο που το GPT-3 δεν είναι ανοιχτού κώδικα, η εφαρμογή παρόμοιων τεχνικών μάθησης θα επιτρέψει νέες περιπτώσεις χρήσης ML στην εκάστοτε επιχείρηση, π.χ. ιδίως σε αυτές που τα δεδομένα εκπαίδευσης είναι σχεδόν ανύπαρκτα.
Η δύναμη της συλλογικής μάθησης (collective learning)
Με την μεταφορά εκμάθησης (transfer learning) και τη λίγη εκμάθηση (few-shot learning) πάνω από ισχυρά μοντέλα ανοιχτού κώδικα, οι απλές επιχειρήσεις μπορούν τελικά να παρέχουν εισιτήρια στην αρένα της μηχανικής μάθησης. Όμως, ενώ η εκπαίδευση ML με μεταφορά εκμάθησης λαμβάνει αρκετές τάξεις μεγέθους λιγότερα δεδομένα, η επίτευξη για ισχυρή απόδοση απαιτεί από τους ενδιαφερόμενους να προχωρήσουν ένα βήμα παραπέρα.
Αυτό το βήμα είναι η συλλογική μάθηση (collective learning), η οποία μπαίνει στο παιχνίδι όταν πολλές μεμονωμένες εταιρείες θέλουν να αυτοματοποιήσουν την ίδια περίπτωση χρήσης. Ενώ κάθε εταιρεία περιορίζεται σε μικρά δεδομένα, οι λύσεις της τεχνητής νοημοσύνης τρίτων μπορούν να χρησιμοποιήσουν τη συλλογική μάθηση για να ενοποιήσουν αυτά τα μικρά σύνολα δεδομένων, δημιουργώντας ένα αρκετά μεγάλο σώμα για εξελιγμένο ML. Στην περίπτωση της κατανόησης της γλώσσας, αυτό σημαίνει αφαίρεση προτάσεων που είναι συγκεκριμένες για μια εταιρεία για να αποκαλύψουν τις υποκείμενες δομές.
Ο συνδυασμός της μεταφοράς εκμάθησης και της συλλογικής μάθησης, μεταξύ άλλων τεχνικών, αναδιατυπώνει γρήγορα τα όρια των εγχειρημάτων στο ML. Για παράδειγμα, η συγκέντρωση δεδομένων πολλαπλών από πολλούς πελάτες μπορεί να βελτιώσει σημαντικά την ακρίβεια των μοντέλων που έχουν σχεδιαστεί για να κατανοήσουν τον τρόπο επικοινωνίας των υπαλλήλων τους. Φυσικά, πέρα από την κατανόηση της γλώσσας, βλέπουμε την εμφάνιση ενός νέου είδους εργασιακού χώρου που τροφοδοτείται από μηχανική μάθηση σε μικρά δεδομένα (small data).