Alibaba predstavlja novi Qwen AI model i tvrdi da nadmašuje DeepSeek-V3

Photo by John Schnobrich on Unsplash

Alibaba predstavlja novi Qwen AI model i tvrdi da nadmašuje DeepSeek-V3

Vrijeme čitanja: 2 minuta

Kineski gigant Alibaba izdao je najnoviju verziju svog vodećeg AI modela, Qwen, ovu srijedu. Tvrtka tvrdi da može bolje performirati od popularnog DeepSeek-V3.

U žurbi? Evo brzih činjenica!

  • Alibaba je ovu srijedu objavila svoj najnoviji model razmišljanja Qwen 2.5-Max.
  • Kineski div tvrdi da nadmašuje popularne modele kao što su DeepSeek-V3, GPT-4o i Llama-3.1-405B.
  • Kompanija je također ove tjedna lansirala Qwen2.5-VL, model umjetne inteligencije sposoban za obradu slika i djelovanje kao AI agent koristeći računala i mobitele za izvršavanje zadataka.

Prema Reutersu, Alibaba je tijekom praznika Lunarnog Nove godine u Kini pokrenula novi Qwen 2.5-Max, kako je nazvan novi model razmišljanja, da bi se pridružila masovnim razvojima AI-a posljednjih dana i dodala domaću konkurenciju.

U ponedjeljak, DeepSeek je zauzeo prvo mjesto na Appleovoj App trgovini u Sjedinjenim Američkim Državama, pretekavši ChatGPT, što je zabrinulo ostale tvrtke u AI industriji i uzburkalo investitore—dionice Nvidije pale su za 17% u samo jednom danu.

Sada je Alibaba najavio najnovije verzije svog Qwen modela—prošle godine u rujnu objavio je 100 otvorenih AI modela za Qwen skupinu —obećavajući bolje rezultate od popularnih pionirskih modela.

“Qwen 2.5-Max nadmašuje (…) gotovo na svim područjima GPT-4o, DeepSeek-V3 i Llama-3.1-405B,” napisala je tvrtka na svom službenom WeChat računu.

API novog modela za logičko zaključivanje Qwen 2.5-Max dostupan je putem Alibaba clouda, a korisnici mogu također testirati model na njegovoj stranici za chat.

“Razvijamo Qwen2.5-Max, veliki MoE model koji je unaprijed treniran na više od 20 trilijuna tokena i dodatno post-treniran kroz metodologije Supervised Fine-Tuning (SFT) i Reinforcement Learning from Human Feedback (RLHF),” napisala je Qwen ekipa na Githubu.

Kineski gigant je u ponedjeljak također objavio Qwen2.5-VL, seriju multimodalnih AI modela koji također mogu obraditi slike i pristupiti mobitelima i računalima za izvršavanje zadataka. OpenAI najavio je sličnu značajku, Operator, koja omogućuje ChatGPT da autonomno izvršava zadatke preuzimajući kontrolu nad računalom korisnika.

Prema timu Alibabe, svi Qwen modeli nadmašuju slične verzije iz OpenAI, Microsofta, Googlea, Mete i DeepSeek-a.

Svidio vam se ovaj članak? Ocijenite ga!
Nije mi se uopće svidjelo Baš mi se i nije svidjelo U redu je Poprilično je dobro! Oduševilo me!

Drago nam je da vam se svidio naš rad!

Kao naš cijenjeni čitatelj, biste li nas pohvalili na Trustpilotu? Kratko je i puno nam znači. Hvala što ste sjajni!

Ocijenite nas na Trustpilotu
0 Ocijenilo 0 korisnika
Naslov
Komentiraj
Zahvaljujemo na povratnoj informaciji
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Ostavite komentar

Loader
Loader Prikaži više...