
Image by Matheus Bertelli, from Pexels
AI DeepSeeka uči kako razmišljati sam za sebe
Kineski startup DeepSeek, u partnerstvu s Tsinghua Sveučilištem, tvrdi da je razvio pametniji način za poboljšanje razmišljanja modela umjetne inteligencije brže i efikasnije, bez potrebe za ogromnim računalima ili skupim resursima.
U žurbi? Evo brzih činjenica:
- DeepSeek je stvorio samopoboljšavajuću AI koristeći metodu Samostalne Kritike na temelju Principa (SPCT).
- SPCT uči AI da ocjenjuje vlastiti rad koristeći samostvorena pravila.
- Ova metoda pojačava performanse bez potrebe za masivnom računalnom snagom.
Proboj dolazi od nove tehnike pod nazivom Self-Principled Critique Tuning (SPCT). SPCT se razlikuje od jednostavnog povećanja veličine AI modela kako bi se poboljšala performansa – SPCT ne zahtijeva puno energije i računalne snage kako bi se AI podučio procjenjivati svoj rad koristeći skup pravila koje je sam kreirao.
Način na koji to funkcionira je preko ugrađenog “sudca” koji provjerava da li AI odgovor pridržava svojim unutrašnjim pravilima razmišljanja, te izgleda prikladno za ljudski izlaz. Kada AI pruži čvrst odgovor, dobiva pozitivnu povratnu informaciju, što mu pomaže poboljšati svoju sposobnost odgovaranja na slična pitanja u budućim situacijama.
DeepSeek primjenjuje ovu metodu kao dio svog DeepSeek-GRM sustava koji označava Generative Reward Modeling. GRM funkcionira drugačije od tradicionalnih metoda jer provodi paralelne provjere kako bi poboljšao točnost i konzistentnost.
“Predlažemo Samo-Principijelno Kritičko Usklađivanje (SPCT) kako bismo potaknuli ponašanje generiranja skalabilnih nagrada”, napisali su istraživači u svom radu. “SPCT omogućuje [modelu] da adaptivno postavlja principe i kritike na temelju ulaznog upita i odgovora, što rezultira boljim ishodima nagrada.”
S ovim sustavom, DeepSeek tvrdi da njegova AI sada može bolje izvesti od konkurenata poput Googleovog Geminija, Metinog Llame i OpenAI-ovog GPT-4o, posebno kada je riječ o složenim zadacima poput rasuđivanja ili donošenja odluka, kako je primijetila Euronews.
Važno je napomenuti, DeepSeek tvrdi da planira izdati ove nove alate kao open-source softver, iako datum izdanja još nije objavljen.
Ostavite komentar
Otkaži