Οι αλγόριθμοι των συστημάτων τεχνητής νοημοσύνης (AI) και μηχανικής μάθησης (ML) έφτασαν σε τόσο προχωρημένο επίπεδο που μπορούν πλέον να εκπαιδεύονται μόνα τους για την επίλυση πολύπλοκων προβλημάτων και γρίφων, αντί να χρησιμοποιούν κανόνες που έχουν θεσπίσει οι προγραμματιστές για αυτά. Εν ολίγοις αυτή η διαδικασία φαίνεται να βοηθάει να εξελιχθεί γρηγορότερα αυτή η τεχνολογία. Ωστόσο υπάρχουν διάφορα ζητήματα που δεν φαίνονται εκ πρώτης όψεως, και απαιτείται ιδιαίτερη προσοχή γιατί επί της ουσίας δεν γνωρίζουμε που βαδίζουμε.
Ένα από τα φλέγοντα θέματα γύρω από αυτή την υπόθεση είναι ότι συνήθως οι προγραμματιστές δεν γνωρίζουν τι κανόνες εφαρμόζουν και ακολουθούν τα συστήματα για να εκπαιδεύσουν τον ίδιο τους τον εαυτό. Ο Peter Koo, Επίκουρος Καθηγητής του Cold Spring Harbour Laboratory (CSHL) ανέπτυξε μια νέα μέθοδο που θέτει ερωτήσεις σε ένα πρόγραμμα μηχανικής μάθησης για να καταλάβει ποιους κανόνες έμαθε μόνο του και εάν είναι οι σωστοί.
Ο Peter Koo λέει: «Οι ερευνητές στον τομέα “Επιστήμης των Υπολογιστών” εκπαιδεύουν ένα σύστημα AI για να προβαίνει σε προβλέψεις, παρουσιάζοντας ένα σύνολο δεδομένων που μετέπειτα αξιοποιούνται για διάφορες διεργασίες. Το εκάστοτε σύστημα δημιουργεί από μόνο του μια σειρά κανόνων και λειτουργιών – που επί της ουσίας πρόκειται για ένα μοντέλο – με βάση τις πληροφορίες που χρησιμοποίησε κατά την εκπαίδευση του».
«Συνήθως τα έξυπνα συστήματα τεχνητής νοημοσύνης αρχικά μαθαίνουν – για παράδειγμα – τους γενικούς κανόνες για τα μαθηματικά, και σε δεύτερη φάση, μέσα από την τριβή της εξάσκησης απομνημονεύουν τις εξισώσεις, για να μπορούν εφόρου ζωής να λύνουν κατευθείαν αυτά τα μαθηματικά προβλήματα».
Ο Koo ανέπτυξε έναν τύπο AI που ονομάζεται Βαθύ Νευρωνικό Δίκτυο (DNN) για να αναζητήσει μοτίβα σε κλώνους RNA που αυξάνουν την ικανότητα μιας πρωτεΐνης να δεσμεύεται σε αυτά. Ο Koo εκπαίδεψε το DNN του, που ονομάζεται Residual Bind (RB), με χιλιάδες αλληλουχίες RNA που αντιστοιχούν στην κωδική περιοχή δέσμευσης των πρωτεϊνών. Όλη αυτή η διαδικασία έχει ως αποτέλεσμα το Residual Bind να γίνει καλό στην πρόβλεψη κωδικής περιοχής για νέες αλληλουχίες RNA. Αλλά ο Koo δεν ήξερε αν το σύστημα επικεντρωνόταν σε μια συγκεκριμένη ακολουθία RNA – δηλαδή σε ένα μοτίβο – που αντικειμενικά θα περίμενε – ή σε κάποιο άλλο δευτερεύον χαρακτηριστικό των κλώνων RNA που τυπικά δεν είναι το ζητούμενο για τη συγκεκριμένη εργασία. (πρακτικά αυτό θα σήμαινε ότι οι αλγόριθμοι λειτουργούν χωρίς τους επιθυμητούς κανόνες)
Ο Koo και η ομάδα του ανέπτυξαν μια νέα μέθοδο, που ονομάζεται Global Importance Analysis, για να δοκιμάσουν τους κανόνες που δημιούργησε το Residual Bind (RB) ώστε να κάνει τις προβλέψεις του. Παρουσίασε στο Βαθύ Νευρωνικό Δίκτυο (DNN) ένα προσεκτικά σχεδιασμένο σύνολο συνθετικών αλληλουχιών RNA που περιέχουν διαφορετικούς συνδυασμούς μοτίβων και χαρακτηριστικών που οι επιστήμονες πίστευαν ότι θα μπορούσαν να επηρεάσουν θετικά τις εκτιμήσεις του RB, ώστε να τους παρέχει ακριβώς εκείνο το στοιχείο που αναζητούν, και όχι διάφορα άλλα άσχετα πράγματα που ο αλγόριθμος κρίνει ως σωστό, και εν τέλει δεν είναι.
«Η βιολογία είναι πραγματικά απέραντη. Μπορείς να βρεις μία ακολουθία ή ένα μοτίβο, αλλά δεν ξέρεις “αν αυτό το μοτίβο είναι σημαντικό για το σκοπό που το χρειάζεσαι”, κάτι που συνεπάγεται ότι πρέπει να κάνεις πολλά πειράματα προκειμένου να διαπιστώσεις αν είναι αυτό που ψάχνεις. Σε αυτήν την περίπτωση, όλα τα πειράματα γίνονται μέσω του νευρωνικού δικτύου που συγκεκριμενοποιεί, συντομεύει και απλοποιεί τις διαδικασίες γλιτώνοντας κόπο και χρόνο στον ερευνητή».
Η ομάδα δημοσίευσε τις νέες μεθόδους και εργαλεία τους στο PLOS Computational Biology. Τα εργαλεία τους είναι πλέον διαθέσιμα σε όλους στο διαδίκτυο.