Η Google ανακοίνωσε ένα νέο φιλόδοξο project για την ανάπτυξη ενός ενιαίου μοντέλου γλώσσας τεχνητής νοημοσύνης που θα υποστηρίζει τις “1.000 πιο ομιλούμενες γλώσσες” στον κόσμο.
Σαν πρώτο βήμα προς αυτόν τον στόχο, η εταιρεία αποκαλύπτει ένα μοντέλο AI εκπαιδευμένο σε περισσότερες από 400 γλώσσες, το οποίο περιγράφει σαν “τη μεγαλύτερη γλωσσική κάλυψη που υπάρχει σε μοντέλο ομιλίας σήμερα”.
Η “Πρωτοβουλία των 1.000 Γλωσσών” (1,000 Languages Initiative) της Google δεν θα εστιάζει σε κάποια συγκεκριμένη λειτουργικότητα, αλλά στη δημιουργία ενός ενιαίου συστήματος με τεράστιο εύρος γνώσης σε όλες τις γλώσσες του κόσμου.
Μιλώντας στο The Verge, ο Zoubin Ghahramani, αντιπρόεδρος έρευνας στο Google AI, δήλωσε ότι η εταιρεία πιστεύει ότι η δημιουργία ενός μοντέλου αυτού του μεγέθους θα διευκολύνει τη μεταφορά διαφόρων λειτουργιών τεχνητής νοημοσύνης σε γλώσσες που παρουσιάζονται ελάχιστα σε διαδικτυακούς χώρους και σε σύνολα δεδομένων εκπαίδευσης AI (επίσης γνωστές και ως “γλώσσες χαμηλών πόρων”).
“Έχοντας ένα ενιαίο μοντέλο που είναι εκτεθειμένο και εκπαιδευμένο σε πολλές διαφορετικές γλώσσες, θα έχουμε πολύ καλύτερη απόδοση σε γλώσσες με χαμηλούς πόρους”, ανέφερε ο Ghahramani.
“Ο τρόπος με τον οποίο θα φτάσουμε στις 1.000 γλώσσες δεν θα είναι χτίζοντας 1.000 διαφορετικά μοντέλα. Οι γλώσσες είναι σαν οργανισμοί, έχουν εξελιχθεί η μία από την άλλη και έχουν ορισμένες ομοιότητες. Μπορούμε να έχουμε αρκετά θεαματικές προόδους σε αυτό που ονομάζουμε μάθηση μηδενικής λήψης όταν ενσωματώνουμε δεδομένα από μια νέα γλώσσα στο μοντέλο των 1.000 γλωσσών μας και θα έχουμε τη δυνατότητα να μεταφράσουμε [ό,τι έμαθε] μια γλώσσα με υψηλούς πόρους σε μια άλλη γλώσσα χαμηλών πόρων.”
Η εταιρεία αναφέρει ότι δεν έχει άμεσα σχέδια για το πού θα εφαρμόσει τη λειτουργικότητα αυτού του μοντέλου, μόνο ότι αναμένει ότι θα έχει μια σειρά χρήσεων στα προϊόντα της Google, από τη Μετάφραση Google, τους υπότιτλους του YouTube και πολλά άλλα.
“Ένα από τα πραγματικά ενδιαφέροντα πράγματα σχετικά με τα μεγάλα γλωσσικά μοντέλα και την γλωσσική έρευνα γενικά είναι ότι μπορούν να κάνουν πολλές και διαφορετικές εργασίες”, αναφέρει ο Ghahramani.
“Το ίδιο μοντέλο γλώσσας μπορεί να μετατρέψει εντολές για ένα ρομπότ σε κώδικα, μπορεί να λύσει μαθηματικά προβλήματα, μπορεί να κάνει μετάφραση. Τα πραγματικά ενδιαφέροντα πράγματα στα γλωσσικά μοντέλα είναι ότι γίνονται αποθήκες πολλών γνώσεων και εξετάζοντάς τα με διαφορετικούς τρόπους μπορείτε να φτάσετε σε διαφορετικές λειτουργικότητες.”