Η βιομηχανία της Τεχνητής Νοημοσύνης (ΤΝ) σε μεγάλο βαθμό αποτυγχάνει να θέσει ένα βασικό ερώτημα σχεδιασμού, υποστηρίζει η θεωρητική νευρο/γνωστική επιστήμονας Vivienne Ming. Τα προϊόντα ΤΝ αναπτύσσουν την ανθρώπινη ικανότητα ή την καταναλώνουν;
Στην Wall Street Journal, η Ming μοιράστηκε ένα πείραμα που πραγματοποίησε για να δει ποια ομάδα θα είχε την καλύτερη απόδοση στην πρόβλεψη πραγματικών γεγονότων (σε σύγκριση με τους προγνώστες στην αγορά προβλέψεων Polymarket) – ομάδες ΤΝ, ανθρώπου ή υβριδικές ομάδες ανθρώπου-ΤΝ.
Οι ανθρώπινες ομάδες είχαν κακή απόδοση, βασιζόμενες στο ένστικτο ή σε οποιαδήποτε πληροφορία είχε βρεθεί στα feeds τους εκείνο το πρωί. Τα μεγάλα μοντέλα ΤΝ – ChatGPT και Gemini, σε αυτήν την περίπτωση, είχαν σημαντικά καλύτερη απόδοση, αν και εξακολουθούσαν να είναι χαμηλότερα από την ίδια την αγορά προβλέψεων Polymarket.
Όταν όμως σύνδεσε την ΤΝ με ανθρώπους, τα πράγματα έγιναν πολύ ενδιαφέροντα. Οι περισσότερες υβριδικές ομάδες χρησιμοποίησαν την ΤΝ για να βρουν την απάντηση και την υπέβαλαν σαν δική τους, χωρίς να έχουν καλύτερη απόδοση από την ΤΝ μόνη της.
Άλλοι τροφοδότησαν τις δικές τους προβλέψεις στην ΤΝ και της ζήτησαν να παρουσιάσει υποστηρικτικά στοιχεία. Αυτοί οι “επικυρωτές” σκόνταψαν σε ένα κλασικό loop προκατάληψης επιβεβαίωσης: την κολακεία που οδηγεί τα chatbot να σας πουν τι θέλετε να ακούσετε, ακόμα κι αν δεν είναι αλήθεια και kατέληξαν να έχουν χειρότερη απόδοση από μια Τεχνητή Νοημοσύνη που δούλευε μόνη της.
Αλλά περίπου από ένα 5% έως 10% των ομάδων, προέκυψε κάτι διαφορετικό. Η Τεχνητή Νοημοσύνη έγινε συνεργάτης. Οι άνθρωποι αντιδρούσαν, απαιτώντας στοιχεία και εξετάζοντας τις υποθέσεις. Όταν η Τεχνητή Νοημοσύνη εξέφραζε υψηλή αυτοπεποίθηση, την αμφισβητούσαν. Όταν οι άνθρωποι είχαν έντονα σε μια διαίσθηση, ζητούσαν από την Τεχνητή Νοημοσύνη να βρει ένα αντεπιχείρημα… Αυτές οι ομάδες κατέληξαν σε διορατικά συμπεράσματα που ούτε ένας άνθρωπος ούτε μια μηχανή θα μπορούσαν να παράγουν μόνοι τους. Ήταν η μόνη ομάδα που ανταγωνιζόταν σταθερά την ακρίβεια της αγοράς προβλέψεων. Σε ορισμένα ερωτήματα, μάλιστα την ξεπέρασαν…
“Κατασκευάζουμε συστήματα Τεχνητής Νοημοσύνης ειδικά σχεδιασμένα για να μας δώσουν την απάντηση πριν νιώσουμε την ενόχληση του να μην έχουμε απάντηση. Αυτό που υποδηλώνει το πείραμά μου είναι ότι οι ανθρώπινες ιδιότητες που είναι πιο πιθανό να έχουν σημασία δεν είναι αυτές που μας κάνουν να νιώθουμε καλά. Είναι οι άβολες: τα να μπορούμε να κάνουμε λάθος δημόσια και να παραμένουμε περίεργοι, να καθόμαστε με μια ερώτηση που το τηλέφωνό μας θα μπορούσε να απαντήσει σε τρία δευτερόλεπτα και να αντιστεκόμαστε στην επιθυμία να διαβάζουμε μια σίγουρη, ρευστή απάντηση από μια Τεχνητή Νοημοσύνη και να αναρωτιόμαστε: “Τι λείπει;” αντί να λέμε το “Ωραία, αυτό ήταν”. Να διαφωνείτε με κάτι που ακούγεται έγκυρο και να εμπιστεύεστε το ένστικτό σας αρκετά ώστε να το ακολουθήσετε. Δεν χτίζουμε αυτές τις ικανότητες αποφεύγοντας την ταλαιπωρία. Τις χτίζουμε επιλέγοντάς τες, επανειλημμένα, με μικρούς τρόπους: ο μαθητής που δυσκολεύεται να ξεπεράσει ένα πρόβλημα πριν ελέγξει την απάντηση, το άτομο που κάνει μια συμπληρωματική ερώτηση σε μια συζήτηση· ο αναγνώστης που σκέφτεται μια δύσκολη ιδέα αρκετή ώρα ώστε να αλλάξει γνώμη. Τα περισσότερα chatbot τεχνητής νοημοσύνης σήμερα έχουν σαν προεπιλογή τις εύκολες απαντήσεις, κάτι που βλάπτει την ικανότητά μας να σκεφτόμαστε κριτικά”.
Το ονομάζω αυτό το Παράδοξο Εξερεύνησης Πληροφοριών. Καθώς το κόστος των πληροφοριών πλησιάζει στο μηδέν, η ανθρώπινη εξερεύνηση καταρρέει. Το βλέπουμε σε μαθητές που έχουν καλύτερες επιδόσεις σε εργασίες με τη βοήθεια της τεχνητής νοημοσύνης και χειρότερες σε όλα μετά. Το βλέπουμε σε προγραμματιστές που παράγουν περισσότερο κώδικα και τον κατανοούν λιγότερο. Με τρόπους που μοιάζουν με πρόοδο, βγάζουμε σιγά σιγά τους εαυτούς μας εκτός κύκλου.
Ο συγγραφέας μόλις δημοσίευσε ένα βιβλίο με τίτλο “Robot-Proof: When Machines Have All The Answers, Build Better People“. Προτείνει τη χρήση της Τεχνητής Νοημοσύνης για την “εξερεύνηση της αβεβαιότητας… πριν αποδεχτείτε την απάντηση μιας Τεχνητής Νοημοσύνης, ζητήστε της το ισχυρότερο επιχείρημα εναντίον της”.
Προτείνει επίσης νέα benchmarks απόδοσης για τις υβριδικές ομάδες Τεχνητής Νοημοσύνης-ανθρώπου.
Αν και τα δελτία τύπου θα είναι από πολύ επιλεγμένα έως και σπάνια, είπα να περάσω … γιατί καμιά φορά κρύβονται οι συντάκτες.
