DeepMind της Google: χρήση ντοπαμίνης από νευρωνικά δίκτυα

DeepMind: Οι αλγόριθμοι βαθιάς μάθησης μπορούν να ξεπεράσουν την ανθρώπινη νοημοσύνη σε πολλά σημεία: από την ταξινόμηση εικόνων, μέχρι την ανάγνωση ομιλίας από τα χείλια, έως τις ακριβείς προβλέψεις για το μέλλον. Όμως παρά τα υπεράνθρωπα επίπεδα επάρκειας τους, μειονεκτούν στο ρυθμό με τον οποίο μαθαίνουν.

Μερικοί από τους καλύτερους αλγόριθμους μηχανικής μάθησης χρειάζονται εκατοντάδες ώρες για να μελετήσουν και να μάθουν κλασσικά video games, κάτι που ένας άνθρωπος μπορεί να μάθει σε ένα απόγευμα.Το γεγονός μπορεί να έχει κάποια σχέση με τη ντοπαμίνη του νευροδιαβιβαστή, σύμφωνα με ένα δημοσίευμα της θυγατρικής εταιρείας DeepMind της Google στο περιοδικό Nature Neuroscience.DeepMind

Η μετα-μάθηση ή η διαδικασία γρήγορης εκμάθησης από παραδείγματα και η απόκτηση κανόνων από αυτά τα παραδείγματα με την πάροδο του χρόνου πιστεύεται ότι είναι ένας από τους τρόπους με τους οποίους οι άνθρωποι αποκτούν νέες γνώσεις αποτελεσματικότερα από τους αλγόριθμους. Όμως οι βασικοί μηχανισμοί της μετα-μάθησης είναι προς το παρόν ελάχιστα κατανοητοί.

Σε μια προσπάθεια να ρίξουν φως στη διαδικασία, οι ερευνητές του DeepMind στο Λονδίνο μοντελοποίησαν την ανθρώπινη φυσιολογία χρησιμοποιώντας ένα επαναλαμβανόμενο νευρικό δίκτυο, έναν τύπο νευρωνικού δικτύου που είναι σε θέση να εσωτερικοποιήσει προηγούμενες ενέργειες και παρατηρήσεις και να αντλήσει μάθηση από αυτές τις εμπειρίες. Το σύστημα που βελτιστοποιεί μαθηματικά τον αλγόριθμο με την πάροδο του χρόνου μέσω δοκιμών και σφαλμάτων, φέρεται να χρησιμοποιεί τη ντοπαμίνη, μια χημική ουσία στον εγκέφαλο που επηρεάζει τα συναισθήματα, τις κινήσεις, τις αισθήσεις του πόνου και της ευχαρίστησης, και παίζει βασικό ρόλο στη διαδικασία εκμάθησης.

Οι ερευνητές λοιπόν δημιούργησαν ένα παρόμοιο σύστημα σε έξι πειράματα νευροεπιστημονικής μετα-μάθησης, συγκρίνοντας την απόδοσή του με εκείνες των ζώων που είχαν υποβληθεί στις ίδιες δοκιμές. Μια από τις δοκιμασίες, γνωστή και ως Πείραμα του Harlow, έδωσε στον αλγόριθμο να επιλέξει δύο τυχαία επιλεγμένες , η μία από τις οποίες συνδεόταν με μια ανταμοιβή. Στο αρχικό πείραμα, μια ομάδα πιθήκων έμαθαν πολύ γρήγορα μια στρατηγική για τη των ανταμοιβών. Επέλεγαν ένα αντικείμενο τυχαία την πρώτη φορά, αλλά αμέσως μετά τα που διέθεταν την ανταμοιβή.

Ο αλγόριθμος λειτούργησε λίγο πολύ όπως λειτούργησαν και τα ζώα, επιλέγοντας εικόνες που συνδεόταν άμεσα με ανταμοιβές από νέες εικόνες που δεν είχε “ξαναδεί”. Επιπλέον, οι ερευνητές σημείωσαν ότι η μάθηση πραγματοποιήθηκε μέσω του νευρωνικού δικτύου, υποστηρίζοντας τη θεωρία ότι η ντοπαμίνη διαδραματίζει βασικό ρόλο στη μετα-μάθηση.

Η μελέτη για την ντοπαμίνη, δείχνει ότι η   επιστήμη έχει να κερδίσει πάρα πολλά από την των νευρωνικών δικτύων όπως ακριβώς και η επιστήμη της πληροφορικής.

“Η αξιοποίηση των δεδομένων από το AI που μπορούν να εφαρμοστούν για να εξηγήσουν τα ευρήματα στη νευροεπιστήμη και την ψυχολογία κάτι που τονίζει την αξία του κάθε πεδίου στο άλλο”, αναφέρει η ομάδα του DeepMind. “Προχωρώντας, αναμένουμε πολλά οφέλη και από την αντίθετη κατεύθυνση, έχοντας οδηγίες από την συγκεκριμένη οργάνωση κυκλωμάτων του εγκεφάλου για τον σχεδιασμό νέων μοντέλων που μαθαίνουν από ενισχυμένα AI”.

iGuRu.gr The Best Technology Site in Greeceggns

Get the best viral stories straight into your inbox!















giorgos

Written by giorgos

Ο Γιώργος ακόμα αναρωτιέται τι κάνει εδώ....

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *

Το μήνυμα σας δεν θα δημοσιευτεί εάν:
1. Περιέχει υβριστικά, συκοφαντικά, ρατσιστικά, προσβλητικά ή ανάρμοστα σχόλια.
2. Προκαλεί βλάβη σε ανηλίκους.
3. Παρενοχλεί την ιδιωτική ζωή και τα ατομικά και κοινωνικά δικαιώματα άλλων χρηστών.
4. Διαφημίζει προϊόντα ή υπηρεσίες ή διαδικτυακούς τόπους .
5. Περιέχει προσωπικές πληροφορίες (διεύθυνση, τηλέφωνο κλπ).