Οι ερευνητές της IBM σχεδίασαν ένα γρήγορο, οικονομικά αποδοτικό τσιπ για την εκπαίδευση AI.
Χάρη στις ισχυρές μονάδες επεξεργασίας γραφικών και τις προόδους που έχουν επιτευχθεί στον κατανεμημένο υπολογισμό, η βελτιστοποίηση των αλγορίθμων στον πυρήνα της τεχνητής νοημοσύνης έχουν γίνει πιο εύκολοι από ποτέ. Ωστόσο αυτά τα στοιχεία δεν είναι ιδιαίτερα αποτελεσματικά για το σημερινό υλικολογισμικό (αγγλικά: hardware) – ακόμη και οι πιο ισχυρές GPU χρειάζονται ημέρες ή εβδομάδες για να εκπαιδεύσουν ένα νευρωνικό δίκτυο τύπου AI.
Σημείωση: Παρακάτω προσπαθήσαμε να εισάγουμε την Ελληνική ορολογία των λέξεων αντί της Αγγλικής.
Αυτό οδήγησε τους ερευνητές στην IBM να αναπτύξουν ένα νέο τσιπ ειδικά σχεδιασμένο για την κατάρτιση του AI. Σε ένα άρθρο που δημοσιεύθηκε στο περιοδικό Nature με τίτλο “Equivalent-accuracy accelerated neural-network training using analog memory”, περιγράφουν ένα σύστημα τρανζίστορ και πυκνωτών που μπορούν να εκπαιδεύσουν νευρωνικά δίκτυα γρήγορα, με ακρίβεια και με καλή ενεργειακή απόδοση.
Τα νευρωνικά δίκτυα αποτελούνται από διασυνδεδεμένες μονάδες που ονομάζονται νευρώνες ή κόμβοι (μια συλλογή κόμβων ονομάζεται στρώμα), οι οποίες λαμβάνουν αριθμητικές εισόδους. Σε ένα βασικό δίκτυο, οι μεμονωμένοι νευρώνες πολλαπλασιάζουν αυτές τις εισόδους με μια τιμή – ένα βάρος – και τις μεταφέρουν σε μια λειτουργία ενεργοποίησης, η οποία καθορίζει την έξοδο του κόμβου. Μέσω μιας στρατηγικής γνωστής ως backpropagation, τα βάρη έχουν την ικανότητα να ρυθμίζονται με την πάροδο του χρόνου, βελτιώνοντας έτσι την ακρίβεια των εξόδων.
Οι μονάδες GPU είναι κατάλληλες για αυτές τις διεργασίες, διότι σε αντίθεση με τον παραδοσιακό επεξεργαστή, ο οποίος καταρρέει με την πάροδο του χρόνου λόγω ανικανότητας να αντεπεξέλθει στις δύσκολες συνθήκες, το νέο τσιπ είναι σε θέση να εκτελέσει παράλληλα πολλούς υπολογισμούς.
«Οι συμβατικοί υπολογιστές καταναλώνουν τεράστια ενέργεια», δήλωσε σε συνέντευξή του ο Stefano Ambrogio, ο ερευνητής στην IBM που ηγήθηκε του έργου.
Η λύση των επιστημόνων αποτελείται από αναλογική μνήμη και παραδοσιακά ηλεκτρονικά εξαρτήματα και μεμονωμένα στοιχεία αποτελούμενα από ένα ζεύγος μονάδων μνήμης αλλαγής φάσης (PCM) σε συνδυασμό με ένα πυκνωτή και τρία τρανζίστορ που αντιστοιχούν σε μεμονωμένους νευρώνες στο δίκτυο. Τα PCM αποθηκεύουν τα δεδομένα βάρους στη μνήμη, τα οποία αντιπροσωπεύονται στα τρανζίστορ και τους πυκνωτές ως ηλεκτρικό φορτίο.