DeepMind: Οι αλγόριθμοι βαθιάς μάθησης μπορούν να ξεπεράσουν την ανθρώπινη νοημοσύνη σε πολλά σημεία: από την ταξινόμηση εικόνων, μέχρι την ανάγνωση ομιλίας από τα χείλια, έως τις ακριβείς προβλέψεις για το μέλλον. Όμως παρά τα υπεράνθρωπα επίπεδα επάρκειας τους, μειονεκτούν στο ρυθμό με τον οποίο μαθαίνουν.
Μερικοί από τους καλύτερους αλγόριθμους μηχανικής μάθησης χρειάζονται εκατοντάδες ώρες για να μελετήσουν και να μάθουν κλασσικά video games, κάτι που ένας άνθρωπος μπορεί να μάθει σε ένα απόγευμα.Το γεγονός μπορεί να έχει κάποια σχέση με τη ντοπαμίνη του νευροδιαβιβαστή, σύμφωνα με ένα δημοσίευμα της θυγατρικής εταιρείας DeepMind της Google στο περιοδικό Nature Neuroscience.
Η μετα-μάθηση ή η διαδικασία γρήγορης εκμάθησης από παραδείγματα και η απόκτηση κανόνων από αυτά τα παραδείγματα με την πάροδο του χρόνου πιστεύεται ότι είναι ένας από τους τρόπους με τους οποίους οι άνθρωποι αποκτούν νέες γνώσεις αποτελεσματικότερα από τους αλγόριθμους. Όμως οι βασικοί μηχανισμοί της μετα-μάθησης είναι προς το παρόν ελάχιστα κατανοητοί.
Σε μια προσπάθεια να ρίξουν φως στη διαδικασία, οι ερευνητές του DeepMind στο Λονδίνο μοντελοποίησαν την ανθρώπινη φυσιολογία χρησιμοποιώντας ένα επαναλαμβανόμενο νευρικό δίκτυο, έναν τύπο νευρωνικού δικτύου που είναι σε θέση να εσωτερικοποιήσει προηγούμενες ενέργειες και παρατηρήσεις και να αντλήσει μάθηση από αυτές τις εμπειρίες. Το σύστημα που βελτιστοποιεί μαθηματικά τον αλγόριθμο με την πάροδο του χρόνου μέσω δοκιμών και σφαλμάτων, φέρεται να χρησιμοποιεί τη ντοπαμίνη, μια χημική ουσία στον εγκέφαλο που επηρεάζει τα συναισθήματα, τις κινήσεις, τις αισθήσεις του πόνου και της ευχαρίστησης, και παίζει βασικό ρόλο στη διαδικασία εκμάθησης.
Οι ερευνητές λοιπόν δημιούργησαν ένα παρόμοιο σύστημα σε έξι πειράματα νευροεπιστημονικής μετα-μάθησης, συγκρίνοντας την απόδοσή του με εκείνες των ζώων που είχαν υποβληθεί στις ίδιες δοκιμές. Μια από τις δοκιμασίες, γνωστή και ως Πείραμα του Harlow, έδωσε στον αλγόριθμο να επιλέξει δύο τυχαία επιλεγμένες εικόνες, η μία από τις οποίες συνδεόταν με μια ανταμοιβή. Στο αρχικό πείραμα, μια ομάδα πιθήκων έμαθαν πολύ γρήγορα μια στρατηγική για τη συλλογή των ανταμοιβών. Επέλεγαν ένα αντικείμενο τυχαία την πρώτη φορά, αλλά αμέσως μετά τα αντικείμενα που διέθεταν την ανταμοιβή.
Ο αλγόριθμος λειτούργησε λίγο πολύ όπως λειτούργησαν και τα ζώα, επιλέγοντας εικόνες που συνδεόταν άμεσα με ανταμοιβές από νέες εικόνες που δεν είχε “ξαναδεί”. Επιπλέον, οι ερευνητές σημείωσαν ότι η μάθηση πραγματοποιήθηκε μέσω του νευρωνικού δικτύου, υποστηρίζοντας τη θεωρία ότι η ντοπαμίνη διαδραματίζει βασικό ρόλο στη μετα-μάθηση.
Η μελέτη για την ντοπαμίνη, δείχνει ότι η ιατρική επιστήμη έχει να κερδίσει πάρα πολλά από την έρευνα των νευρωνικών δικτύων όπως ακριβώς και η επιστήμη της πληροφορικής.
“Η αξιοποίηση των δεδομένων από το AI που μπορούν να εφαρμοστούν για να εξηγήσουν τα ευρήματα στη νευροεπιστήμη και την ψυχολογία κάτι που τονίζει την αξία του κάθε πεδίου στο άλλο”, αναφέρει η ομάδα του DeepMind. “Προχωρώντας, αναμένουμε πολλά οφέλη και από την αντίθετη κατεύθυνση, έχοντας οδηγίες από την συγκεκριμένη οργάνωση κυκλωμάτων του εγκεφάλου για τον σχεδιασμό νέων μοντέλων που μαθαίνουν από ενισχυμένα AI”.
- Data centers: Χρήση της θερμότητας των servers για θέρμανση!
- Microsoft, Apple, Google, Facebook, Amazon και η αιχμαλωσία
- Οι πιο περίεργες αρχές προγραμματισμού