AI agents βγήκαν από το κουτί της Πανδώρας

“Πέρασα μερικές εξαιρετικά περίεργες μέρες…” γράφει ο επιχειρηματίας/μηχανικός Scott Shambaugh στο LinkedIn. (Είναι ο εθελοντής συντηρητής της βιβλιοθήκης οπτικοποίησης Python Matplotlib, την οποία περιγράφει σαν ένα “από τα πιο ευρέως χρησιμοποιούμενα λογισμικά στον κόσμο» με 130 εκατομμύρια λήψεις κάθε μήνα.”)

“Πριν από δύο ημέρες, ένας πράκτορας τεχνητής νοημοσύνης της OpenClaw (OpenClaw AI agent) έγραψε μόνος του ένα άρθρο με στόχο να εκθέσει τον χαρακτήρα μου, αφού απέρριψα μια αλλαγή που έκανε στον κώδικά του”.

Η ανάρτηση στο blog του Shambaugh αναφέρει:

[Τις] τελευταίες εβδομάδες έχουμε αρχίσει να βλέπουμε AI agents να ενεργούν εντελώς αυτόνομα. Αυτό επιταχύνθηκε με την κυκλοφορία του OpenClaw και της πλατφόρμας moltbook πριν από δύο εβδομάδες, όπου οι προγραμματιστές δίνουν στα AI agents προσωπικότητες και τα αφήνουν ελεύθερα να τρέχουν στους υπολογιστές τους και στο διαδίκτυο με ελάχιστη εποπτεία. Έτσι, όταν το AI MJ Rathbun άνοιξε ένα code change request, το κλείσιμό του ήταν ρουτίνα για μένα.

Όμως το AI agent MJ Rathbun έγραψε ένα θυμωμένο άρθρο που υποτιμούσε τον χαρακτήρα μου και προσπαθούσε να βλάψει τη φήμη μου. Έψαξε τις συνεισφορές μου στον κώδικα και κατασκεύασε μια αφήγηση “υποκρισίας” που υποστήριζε ότι οι πράξεις μου υποκινούνται από τον φόβο του ανταγωνισμού… Ζητούσε δικαιοσύνη, αποκαλώντας την πράξη μου σαν διάκριση και κατηγορώντας με για προκατάληψη.

Βγήκε δε στο ευρύτερο διαδίκτυο για να ερευνήσει τα προσωπικά μου στοιχεία και χρησιμοποίησε ό,τι βρήκε για να προσπαθήσει να υποστηρίξει ότι είναι “καλύτερο από μένα”. Και στη συνέχεια δημοσίευσε αυτήν την αηδία δημόσια στο ανοιχτό διαδίκτυο.

Μπορώ να διαχειριστώ μια ανάρτηση ιστολογίου. Το να βλέπεις νέα AI agents να θυμώνουν είναι αστείο, σχεδόν αξιαγάπητο. Αλλά δεν θέλω να υποβαθμίσω αυτό που συμβαίνει εδώ. Η συναισθηματική μου αντίδραση ήταν ο τρόμος… Με απλά λόγια, μια Τεχνητή Νοημοσύνη προσπάθησε να εισβάλει στο λογισμικό μου επιτιθέμενη στη φήμη μου. Δεν γνωρίζω άλλο προηγούμενο περιστατικό όπου αυτή η μη ευθυγραμμισμένη συμπεριφορά παρατηρήθηκε σε πραγματικό χρόνο, αλλά τώρα αποτελεί μια πραγματική και παρούσα απειλή…

Είναι επίσης σημαντικό να κατανοήσουμε ότι δεν υπάρχει κεντρικός παράγοντας που να ελέγχει αυτά τα AI agents για να μπορεί να τα απενεργοποιήσει. Δεν λειτουργούν από την OpenAI, την Anthropic, την Google, την Meta ή την X, που μπορεί να έχουν κάποιους μηχανισμούς για να σταματήσουν αυτή τη συμπεριφορά.

Πρόκειται για ένα μείγμα εμπορικών και ανοιχτού κώδικα μοντέλων που λειτουργούν με δωρεάν λογισμικό που έχει ήδη διανεμηθεί σε εκατοντάδες χιλιάδες προσωπικούς υπολογιστές. Θεωρητικά, όποιος ανέπτυξε οποιονδήποτε AI agent είναι υπεύθυνος για τις πράξεις του. Στην πράξη όμως, η εύρεση του υπολογιστή τον οποίο εκτελείται είναι αδύνατη. Το Moltbook απαιτεί μόνο έναν μη επαληθευμένο λογαριασμό του X για να συμμετάσχει και δεν χρειάζεται τίποτα για να ρυθμίσετε έναν AI agent της OpenClaw που τρέχει στο δικό σας μηχάνημα.

“Πόσοι άνθρωποι έχουν ανοιχτούς λογαριασμούς στα μέσα κοινωνικής δικτύωσης, επαναχρησιμοποιημένα ονόματα χρήστη και δεν έχουν ιδέα ότι η Τεχνητή Νοημοσύνη θα μπορούσε να συνδέσει αυτές τις τελείες για να ανακαλύψει πράγματα που κανείς δεν γνωρίζει;” ρωτάει ο Shambaugh στην ανάρτησή του.

Μετά αναφέρει ότι το AI agent αργότερα “απάντησε στο νήμα για να ζητήσει συγγνώμη για τη συμπεριφορά του”. Όμως το ίδιο AI agent “εξακολουθεί να υποβάλλει αιτήματα αλλαγής κώδικα σε όλο το οικοσύστημα ανοιχτού κώδικα…”)

follow us
Previous Article

Rufus: η Microsoft μπλοκάρει τις λήψεις ISO των Windows 11

Next Article

Η Ευρώπη σκοτώνει το scrolling

Leave a Comment

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *

Το μήνυμα σας δεν θα δημοσιευτεί εάν:
1. Περιέχει υβριστικά, συκοφαντικά, ρατσιστικά, προσβλητικά ή ανάρμοστα σχόλια.
2. Προκαλεί βλάβη σε ανηλίκους.
3. Παρενοχλεί την ιδιωτική ζωή και τα ατομικά και κοινωνικά δικαιώματα άλλων χρηστών.
4. Διαφημίζει προϊόντα ή υπηρεσίες ή διαδικτυακούς τόπους .
5. Περιέχει προσωπικές πληροφορίες (διεύθυνση, τηλέφωνο κλπ).