Η Alibaba αποκάλυψε μια νέα έκδοση του μοντέλου AI, που ονομάζεται Qwen2.5-Max, διεκδικώντας βαθμολογίες benchmark που ξεπερνούν τόσο το μοντέλο R1 που κυκλοφόρησε πρόσφατα η DeepSeek όσο και τα βιομηχανικά πρότυπα όπως το GPT-4o και το Claude-3.5-Sonnet.
Qwen2.5-Max: Exploring the Intelligence of Large-scale MoE Model
Το μοντέλο επιτυγχάνει αυτά τα αποτελέσματα χρησιμοποιώντας μια mixture-of-experts αρχιτεκτονική που απαιτεί σημαντικά λιγότερη υπολογιστική ισχύ από τις παραδοσιακές προσεγγίσεις.
Η κυκλοφορία έρχεται εν μέσω αυξανόμενων ανησυχιών σχετικά με τις δυνατότητες τεχνητής νοημοσύνης της Κίνας, μετά την κυκλοφορία του μοντέλου R1 της DeepSeek την περασμένη εβδομάδα που οδήγησε τη μετοχή της Nvidia να πέσει 17%.
Το Qwen2.5-Max σημείωσε 89,4% στο Arena-Hard benchmark και έδειξε ισχυρή απόδοση σε εργασίες δημιουργίας κώδικα και μαθηματικών συλλογισμών.
Σε αντίθεση με τις αμερικανικές εταιρείες που βασίζονται σε μεγάλο βαθμό σε τεράστια συμπλέγματα GPU – η OpenAI φέρεται να χρησιμοποιεί πάνω από 32.000 GPU υψηλής τεχνολογίας για τα τελευταία της μοντέλα – η προσέγγιση της Alibaba εστιάζει στην αρχιτεκτονική απόδοση.
Η εταιρεία ισχυρίζεται ότι αυτό επιτρέπει συγκρίσιμες επιδόσεις AI, ενώ μειώνει το κόστος υποδομής κατά 40-60% σε σύγκριση με τις παραδοσιακές μεθόδους.