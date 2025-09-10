Cilj nije izgraditi robota za brbljanje kao što je ChatGPT, već ga koristiti za specifične primjene u područjima poput matematike i znanosti

Sveučilište za umjetnu inteligenciju Mohamed bin Zajed (MBZUAI), čiji su osnivač Ujedinjeni Arapski Emirati (UAE), objavilo je izlazak novog, jeftinog modela zaključivanja koji će konkurirati OpenAI-u i DeepSeeku. Sa samo 32 milijarde parametara, MBZUAI-jev model K2 Think znatno je manji od konkurentskih sustava OpenAI-a i DeepSeeka. Izgrađen je na Alibabinom modelu otvorenog računalnog koda Qwen 2.5 te radi i testira se na hardveru proizvođača čipova za umjetnu inteligenciju Cerebas. Usporedbe radi, DeepSeekov R1 ima ukupno 671 milijardu parametara, što je u biti drugi naziv za varijable koje jezični model uči kako bi razumio i generirao jezik. OpenAI ne otkriva broj parametara svojih modela.

Sustav, ne model K2 Think razvijen je u partnerstvu s G42, tvrtkom sa sjedištem u UAE-u, koju podržava Microsoft. Istraživači koji stoje iza njega kažu da pruža performanse na razini vodećih modela zaključivanja OpenAI-a i DeepSeeka, unatoč tome što je znatno manji. To su izmjerili koristeći mjerila AIME24, AIME25, HMMT25 i OMNI-Math-HARD, koja se odnose na matematiku, mjerilo kodiranja LiveCodeBenchv5 i mjerilo znanosti GPQA-Diamond. Takve su performanse postignute korištenjem niza metoda, a one su uključivale nadzirano fino ugađanje dugog lanca misli (CoT) - metodu postupnog zaključivanja - kao i takozvano skaliranje vremena testiranja, što je tehnika za poboljšanje performansi dodjeljivanjem dodatnih računalnih resursa tijekom 'zaključivanja' - ili primjene naučenog znanja na podatke koji prije nisu viđeni. Razlika je, kažu, u tome što tretiraju K2 Think više kao sustav nego kao model - implementiraju ga i potom gledaju kako ga mogu poboljšati tijekom vremena. Cilj nije izgraditi robota za brbljanje kao što je ChatGPT, već ga koristiti za specifične primjene u područjima poput matematike i znanosti. Umjesto da 1000-2000 ljudskih bića pet godina razmišlja o određenom pitanju ili prođu kroz određeni skup kliničkih ispitivanja, to bi bilo povjereno robotu, a on bi taj posao obavio u uvelike kraćem razdoblju. Također bi se moglo dogoditi proširenje dosega naprednih tehnologija u regijama koje nemaju pristup vrsti kapitala i infrastrukture što ga posjeduju američke tvrtke.