Αν πιστεύετε τον Mark Zuckerberg, που αναφέρει ότι το μοντέλο τεχνητής νοημοσύνης Llama 3 της Meta (LLM) είναι ανοιχτού κώδικα, κάνετε λάθος.
Δεν είναι, μόνο επειδή το λέει. Η Πρωτοβουλία Ανοιχτού Κώδικα (OSI από το Open Source Initiative) το διευκρινίζει στον Ορισμό Ανοιχτού Κώδικα και απορρίπτει την άδεια του Llama 3 για διάφορους λόγους.
Η Meta, βέβαια δεν είναι μοναδική που θέλει να ισχυρίζεται ότι ορισμένα από το λογισμικό και τα μοντέλα της είναι ανοιχτού κώδικα. Η ιδέα που χρησιμοποιούν όλες αυτές οι εταιρείες, έχει το δικό της όνομα: ανοιχτό πλύσιμο ή open washing .
Πρόκειται για μια παραπλανητική πρακτική κατά την οποία εταιρείες ή οργανισμοί παρουσιάζουν τα προϊόντα, τις υπηρεσίες ή τις διαδικασίες τους σαν “ανοιχτές” αν και δεν είναι ανοιχτές στο πνεύμα της διαφάνειας, της πρόσβασης στις πληροφορίες, της συμμετοχής και της ανταλλαγής γνώσεων. Αυτός ο όρος έχει διαμορφωθεί με βάση το “greenwashing” και επινοήθηκε από την Michelle Thorne, μελετήτρια της πολιτικής του Διαδικτύου το 2009.
Με την άνοδο της τεχνητής νοημοσύνης, το open washing είναι συνηθισμένο, όπως φαίνεται σε μια πρόσφατη μελέτη. Ο Andreas Liesenfeld και ο Mark Dingemanse του Κέντρου Γλωσσικών Σπουδών του Πανεπιστημίου Radboud εξέτασαν 45 μοντέλα κειμένου και κειμένου σε εικόνα που ισχυρίζονται ότι είναι ανοιχτά.
Οι ερευνητές διαπίστωσαν ότι αν και ορισμένα λιγότερο γνωστά LLM, όπως το OLMo του AllenAI και το BigScience Workshop + HuggingFace με το BloomZ μπορούσαν να θεωρηθούν ανοιχτά, τα περισσότερα δεν είναι. Φυσικά δεν θα σας εκπλήξει αν μάθετε ότι σύμφωνα με τη μελέτη, τα μεγάλα ονόματα της Google, της Meta και της Microsoft δεν είναι…
Γιατί όμως οι εταιρείες το κάνουν αυτό;
Μια φορά κι έναν καιρό, οι εταιρείες απέφευγαν τον ανοιχτό κώδικα σαν την πανούκλα. Ο Steve Ballmer διακήρυξε το 2001 το διάσημο πια “το Linux είναι καρκίνος“, επειδή: “Με τον τρόπο που γράφεται η άδεια χρήσης, εάν χρησιμοποιείτε οποιοδήποτε λογισμικό ανοιχτού κώδικα, πρέπει να κάνετε το υπόλοιπο λογισμικό σας ανοιχτό”.
Αυτό ήταν όμως πολλά χρόνια πριν. Σήμερα, ο ανοιχτός κώδικας θεωρείται κάτι καλό. Το open washing επιτρέπει στις εταιρείες να επωφεληθούν από τη θετική αντίληψη του ανοιχτού κώδικα και των ανοιχτών πρακτικών χωρίς να δεσμεύονται πραγματικά. Αυτό μπορεί να βοηθήσει στη βελτίωση της δημόσιας εικόνας τους και να απευθυνθεί στους καταναλωτές που εκτιμούν τη διαφάνεια.
Ορισμένες εταιρείες χρησιμοποιούν το open washing για να προστατεύσουν τα μοντέλα και τις πρακτικές τους από τον επιστημονικό ή και ρυθμιστικό έλεγχο, ενώ επωφελούνται από την “ανοιχτή” ετικέτα.
Ένας άλλος σημαντικός παράγοντας είναι ότι ο νόμος της ΕΕ για την τεχνητή νοημοσύνη προβλέπει ειδικές εξαιρέσεις για μοντέλα “ανοικτού κώδικα”. Αυτό δημιουργεί ένα ισχυρό κίνητρο για το open washing: εάν τα μοντέλα τους θεωρούνται ανοιχτά, θα έχουν πολύ λιγότερες περιοριστικές απαιτήσεις. Αυτό, με τη σειρά του, σημαίνει ότι θα χρειαστούν λιγότερα χρήματα για να ανταποκριθούν στις ρυθμιστικές απαιτήσεις ή θα πρέπει να καθαρίσουν τα σύνολα δεδομένων τους από θέματα πνευματικών δικαιωμάτων και άλλων ζητημάτων πνευματικής ιδιοκτησίας.
Ωστόσο, η ΕΕ εξακολουθεί να μην έχει σαφή ορισμό της τεχνητής νοημοσύνης ανοιχτού κώδικα. Κανείς δεν τον έχει ακόμα. Το OSI θα κυκλοφορήσει τον ορισμό AI ανοιχτού κώδικα τις επόμενες ημέρες.
Αυτό δεν σημαίνει ότι όλες οι μεγάλες εταιρείες τεχνητής νοημοσύνης λένε ψέματα. Για παράδειγμα, τα Granite 3.0 LLM της IBM φαίνεται να είναι πραγματικά ανοιχτού κώδικα με άδεια Apache 2.
Τελικά, ο OSI είναι ένας κυβερνητικός ή ρυθμιστικός οργανισμός; Δεν είναι. Είναι ένας μη κερδοσκοπικός οργανισμός που έχει δημιουργήσει μερικές πολύ χρήσιμες οδηγίες.