Οι ερευνητές τεχνητής νοημοσύνης στην Meta Platforms βρίσκονται σε κατάσταση πανικού.
Τις τελευταίες ημέρες, αρκετές ομάδες εταιρειών τεχνητής νοημοσύνης ανησυχούσαν ανοιχτά για το ότι η νέα τεχνητή νοημοσύνη που φτιάχτηκε από ένα κινεζικό hedge fund (High-Flyer) τους άφησε πίσω.
Μεγάλα στελέχη, όπως ο διευθυντής υποδομής τεχνητής νοημοσύνης, Mathew Oldham, δήλωσαν ότι ανησυχούν για το ότι η επόμενη έκδοση του Llama της Meta δεν θα έχει τόσο καλή απόδοση όσο η κινεζική τεχνητή νοημοσύνη, DeepSeek.
Έτσι λοιπόν η Meta δημιούργησε τέσσερα war rooms για να αναλύσει την τεχνολογία του DeepSeek. Δύο από αυτά επικεντρώνονται στο πώς η High-Flyer μείωσε το κόστος εκπαίδευσης και ένα στα δεδομένα που μπορεί να χρησιμοποιούσε η High-Flyer, αναφέρουν οι Kalley Huang και Stephanie Palazzolo του The Information.
Το DeepSeek της Κίνας είναι ένα μοντέλο large-language ανοιχτού κώδικα που ισχυρίζεται ότι ανταγωνίζεται τις αντίστοιχες πλατφόρμες της Meta της OpenAI και της Google, ενώ χρησιμοποιεί πολύ μικρότερους προϋπολογισμούς.
Το DeepSeek V3, το πιο πρόσφατο large-language μοντέλο, έχει ξεπεράσει αρκετά μοντέλα αμερικανικών εταιρειών σε δημόσια προσβάσιμα benchmarks.
Το Chatbot Arena, ένας ιστότοπος κατάταξης που συνδέεται με το UC Berkeley, έχει δύο μοντέλα του DeepSeek στην πρώτη δεκάδα. Ενώ το ChatGPT και το Gemini βρίσκονται πάνω από αυτό στον πίνακα κατάταξης, ανταγωνιστές όπως το Grok του xAI το Claude του Anthropic δεν έχουν καταφέρει να εμφανιστούν, όπως βλέπετε στην παραπάνω εικόνα.