Μετά το σοκ της DeepSeek, η Alibaba σπάει τα benchmarks

Η Alibaba αποκάλυψε μια νέα έκδοση του μοντέλου AI, που ονομάζεται Qwen2.5-Max, διεκδικώντας βαθμολογίες που ξεπερνούν τόσο το μοντέλο R1 που κυκλοφόρησε πρόσφατα η DeepSeek όσο και τα βιομηχανικά πρότυπα όπως το GPT-4o και το Claude-3.5-Sonnet.

Qwen2.5-Max: Exploring the Intelligence of Large-scale MoE Model

Το μοντέλο επιτυγχάνει αυτά τα αποτελέσματα χρησιμοποιώντας μια mixture-of-experts αρχιτεκτονική που απαιτεί σημαντικά λιγότερη υπολογιστική ισχύ από τις παραδοσιακές προσεγγίσεις.

Η κυκλοφορία έρχεται εν μέσω αυξανόμενων ανησυχιών σχετικά με τις δυνατότητες τεχνητής νοημοσύνης της Κίνας, μετά την κυκλοφορία του μοντέλου R1 της DeepSeek την περασμένη εβδ που οδήγησε τη μετοχή της Nvidia να πέσει 17%.

Το Qwen2.5-Max σημείωσε 89,4% στο Arena-Hard benchmark και έδειξε ισχυρή απόδοση σε εργασίες δημιουργίας και μαθηματικών συλλογισμών.

Σε αντίθεση με τις αμερικανικές εταιρείες που βασίζονται σε μεγάλο βαθμό σε τεράστια συμπλέγματα GPU – η φέρεται να χρησιμοποιεί πάνω από 32.000 GPU υψηλής τεχνολογίας για τα τελευταία της – η προσέγγιση της Alibaba εστιάζει στην αρχιτεκτονική απόδοση.

Η εταιρεία ισχυρίζεται ότι αυτό επιτρέπει συγκρίσιμες επιδόσεις AI, ενώ μειώνει το κόστος υποδομής κατά 40-60% σε σύγκριση με τις παραδοσιακές μεθόδους.

iGuRu.gr The Best Technology Site in Greeceggns

Get the best viral stories straight into your inbox!















giorgos

Written by giorgos

Ο Γιώργος ακόμα αναρωτιέται τι κάνει εδώ....

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *

Το μήνυμα σας δεν θα δημοσιευτεί εάν:
1. Περιέχει υβριστικά, συκοφαντικά, ρατσιστικά, προσβλητικά ή ανάρμοστα σχόλια.
2. Προκαλεί βλάβη σε ανηλίκους.
3. Παρενοχλεί την ιδιωτική ζωή και τα ατομικά και κοινωνικά δικαιώματα άλλων χρηστών.
4. Διαφημίζει προϊόντα ή υπηρεσίες ή διαδικτυακούς τόπους .
5. Περιέχει προσωπικές πληροφορίες (διεύθυνση, τηλέφωνο κλπ).