Alibaba predstavlja novi Qwen AI model i tvrdi da nadmašuje DeepSeek-V3
Kineski gigant Alibaba izdao je najnoviju verziju svog vodećeg AI modela, Qwen, ovu srijedu. Tvrtka tvrdi da može bolje performirati od popularnog DeepSeek-V3.
U žurbi? Evo brzih činjenica!
- Alibaba je ovu srijedu objavila svoj najnoviji model razmišljanja Qwen 2.5-Max.
- Kineski div tvrdi da nadmašuje popularne modele kao što su DeepSeek-V3, GPT-4o i Llama-3.1-405B.
- Kompanija je također ove tjedna lansirala Qwen2.5-VL, model umjetne inteligencije sposoban za obradu slika i djelovanje kao AI agent koristeći računala i mobitele za izvršavanje zadataka.
Prema Reutersu, Alibaba je tijekom praznika Lunarnog Nove godine u Kini pokrenula novi Qwen 2.5-Max, kako je nazvan novi model razmišljanja, da bi se pridružila masovnim razvojima AI-a posljednjih dana i dodala domaću konkurenciju.
U ponedjeljak, DeepSeek je zauzeo prvo mjesto na Appleovoj App trgovini u Sjedinjenim Američkim Državama, pretekavši ChatGPT, što je zabrinulo ostale tvrtke u AI industriji i uzburkalo investitore—dionice Nvidije pale su za 17% u samo jednom danu.
Sada je Alibaba najavio najnovije verzije svog Qwen modela—prošle godine u rujnu objavio je 100 otvorenih AI modela za Qwen skupinu —obećavajući bolje rezultate od popularnih pionirskih modela.
“Qwen 2.5-Max nadmašuje (…) gotovo na svim područjima GPT-4o, DeepSeek-V3 i Llama-3.1-405B,” napisala je tvrtka na svom službenom WeChat računu.
API novog modela za logičko zaključivanje Qwen 2.5-Max dostupan je putem Alibaba clouda, a korisnici mogu također testirati model na njegovoj stranici za chat.
“Razvijamo Qwen2.5-Max, veliki MoE model koji je unaprijed treniran na više od 20 trilijuna tokena i dodatno post-treniran kroz metodologije Supervised Fine-Tuning (SFT) i Reinforcement Learning from Human Feedback (RLHF),” napisala je Qwen ekipa na Githubu.
Kineski gigant je u ponedjeljak također objavio Qwen2.5-VL, seriju multimodalnih AI modela koji također mogu obraditi slike i pristupiti mobitelima i računalima za izvršavanje zadataka. OpenAI najavio je sličnu značajku, Operator, koja omogućuje ChatGPT da autonomno izvršava zadatke preuzimajući kontrolu nad računalom korisnika.
Prema timu Alibabe, svi Qwen modeli nadmašuju slične verzije iz OpenAI, Microsofta, Googlea, Mete i DeepSeek-a.
Ostavite komentar
Otkaži