Το DeepSeek έχει κάνει ήδη πάταγο στο Διαδίκτυο όταν άρχισαν να κυκλοφορούν στο αναφορές που ισχυρίζονται ότι ξεπερνά τα πιο προηγμένα μοντέλα τεχνητής νοημοσύνης παγκοσμίως. Είναι αξιοσημείωτο ότι η DeepSeek ξόδεψε λιγότερα από 6 εκατομμύρια δολάρια για να εκπαιδεύσει τα μοντέλα της με τεχνητή νοημοσύνη, σε σύγκριση με 100 εκατομμύρια δολάρια που επένδυσε η OpenAI για να κάνει το ίδιο.
Αυτό είχε ως αποτέλεσμα όχι μόνο το DeepSeek να γίνει η νούμερο ένα δωρεάν εφαρμογή στο App Store, αλλά προκάλεσε και μια ιστορική “εξαφάνιση” άνω των 400 δισεκατομμυρίων δολαρίων στην αγορά της NVIDIA στις ΗΠΑ.
Αμέσως μετά το chatbot AI απέκτησε μια τεράστια επισκεψιμότητα που προκαλούσε διακοπές λειτουργίας του διακομιστή της DeepSeek και προβλήματα στην απόδοση.
Παρά τις προκλήσεις όμως, το κινεζικό εργαστήριο τεχνητής νοημοσύνης προχώρησε αποκαλύπτοντας ένα πρωτοποριακό μοντέλο τεχνητής νοημοσύνης ανοιχτού κώδικα που ονομάζεται Janus-Pro. Το νέο μοντέλο δημιουργίας εικόνας σύμφωνα με αναφορές, το μοντέλο Janus-Pro ξεπερνά σε αρκετά benchmarks το DALL-E του OpenAI, το Stable Diffusion του Stability AI και άλλα μοντέλα παραγωγής εικόνας.
Το Janus-Pro είναι μια ενημέρωση σε σχέση του Janus, που κυκλοφόρησε στα τέλη του περασμένου έτους.
Το Janus-Pro διατίθεται σε διάφορα μεγέθη, compact 1 δισεκατομμυρίου παραμέτρων μέχρι την έκδοση 7 δισεκατομμυρίων παραμέτρων, κοντά στο μέγεθος του SD 3,5L. Το μεγαλύτερο μοντέλο, το Janus-Pro-7B, υπερέχει τόσο στη δημιουργία εικόνων όσο και στην ανάλυση, ξεπερνώντας τους κορυφαίους ανταγωνιστές του PixArt-alpha, Emu3-Gen και SDXL στα benchmarks της βιομηχανίας GenEval και DPG-Bench, σύμφωνα με πληροφορίες που κοινοποίησε το DeepSeek.
Το μοντέλο Janus-Pro-7B είναι διαθέσιμο για δωρεάν λήψη από το Huggingface, ένα δημοφιλές μέρος για τεχνητή νοημοσύνη και μηχανική εκμάθηση.