AI DeepSeeka uči kako razmišljati sam za sebe

Image by Matheus Bertelli, from Pexels

AI DeepSeeka uči kako razmišljati sam za sebe

Vrijeme čitanja: 2 minuta

Kineski startup DeepSeek, u partnerstvu s Tsinghua Sveučilištem, tvrdi da je razvio pametniji način za poboljšanje razmišljanja modela umjetne inteligencije brže i efikasnije, bez potrebe za ogromnim računalima ili skupim resursima.

U žurbi? Evo brzih činjenica:

  • DeepSeek je stvorio samopoboljšavajuću AI koristeći metodu Samostalne Kritike na temelju Principa (SPCT).
  • SPCT uči AI da ocjenjuje vlastiti rad koristeći samostvorena pravila.
  • Ova metoda pojačava performanse bez potrebe za masivnom računalnom snagom.

Proboj dolazi od nove tehnike pod nazivom Self-Principled Critique Tuning (SPCT). SPCT se razlikuje od jednostavnog povećanja veličine AI modela kako bi se poboljšala performansa – SPCT ne zahtijeva puno energije i računalne snage kako bi se AI podučio procjenjivati svoj rad koristeći skup pravila koje je sam kreirao.

Način na koji to funkcionira je preko ugrađenog “sudca” koji provjerava da li AI odgovor pridržava svojim unutrašnjim pravilima razmišljanja, te izgleda prikladno za ljudski izlaz. Kada AI pruži čvrst odgovor, dobiva pozitivnu povratnu informaciju, što mu pomaže poboljšati svoju sposobnost odgovaranja na slična pitanja u budućim situacijama.

DeepSeek primjenjuje ovu metodu kao dio svog DeepSeek-GRM sustava koji označava Generative Reward Modeling. GRM funkcionira drugačije od tradicionalnih metoda jer provodi paralelne provjere kako bi poboljšao točnost i konzistentnost.

“Predlažemo Samo-Principijelno Kritičko Usklađivanje (SPCT) kako bismo potaknuli ponašanje generiranja skalabilnih nagrada”, napisali su istraživači u svom radu. “SPCT omogućuje [modelu] da adaptivno postavlja principe i kritike na temelju ulaznog upita i odgovora, što rezultira boljim ishodima nagrada.”

S ovim sustavom, DeepSeek tvrdi da njegova AI sada može bolje izvesti od konkurenata poput Googleovog Geminija, Metinog Llame i OpenAI-ovog GPT-4o, posebno kada je riječ o složenim zadacima poput rasuđivanja ili donošenja odluka, kako je primijetila Euronews.

Važno je napomenuti, DeepSeek tvrdi da planira izdati ove nove alate kao open-source softver, iako datum izdanja još nije objavljen.

Svidio vam se ovaj članak? Ocijenite ga!
Nije mi se uopće svidjelo Baš mi se i nije svidjelo U redu je Poprilično je dobro! Oduševilo me!

Drago nam je da vam se svidio naš rad!

Kao naš cijenjeni čitatelj, biste li nas pohvalili na Trustpilotu? Kratko je i puno nam znači. Hvala što ste sjajni!

Ocijenite nas na Trustpilotu
0 Ocijenilo 0 korisnika
Naslov
Komentiraj
Zahvaljujemo na povratnoj informaciji
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Ostavite komentar

Loader
Loader Prikaži više...