Dva modela - gpt-oss-120b i gpt-oss-20b-two – navodno su nadmašila modele slične veličine u zadacima zaključivanja
OpenAI je bacio rukavicu u lice Meti i DeepSeeku lansiranjem vlastitih besplatno dostupnih modela umjetne inteligencije. Najavili su dva 'otvorena' velika jezična modela koje je moguće preuzeti besplatno i koje programeri mogu prilagoditi.
Dva modela - gpt-oss-120b i gpt-oss-20b-two – navodno su nadmašila modele slične veličine u zadacima zaključivanja, pri čemu je veći, 120b model postigao gotovo jednake performanse kao i model o4-mini kad je riječ o temeljnom zaključivanju.
Tijekom procesa testiranja stvorili su 'zlonamjerno fino ugođene' inačice modela za simulaciju bioloških i kibernetičkih prijetnji, ali je otkrila kako 'nisu u stanju postići visoke razine sposobnosti'. Metini modeli Llama dostupni su na sličnoj osnovi. OpenAI je dosad objavljivao samo zatvorene jezične modele, koje nije moguće prilagođavati izvan te tvrtke.
Sam Altman, glavni izvršni direktor OpenAI-ja, rekao je kako će njihovi besplatni modeli biti 'temeljeni na demokratskim vrijednostima... i za široku korist'. Ti bi modeli mogli biti temelj za agenta s umjetnom inteligencijom koji radi autonomno jer su dizajnirani za takvo korištenje.
Šef Mete Mark Zuckerberg je ranije rekao kako će besplatno dostupni i prilagodljivi modeli 'osigurati većem broju ljudi diljem svijeta pristup prednostima i mogućnostima umjetne inteligencije', kako moć ne bi bila koncentrirana u rukama malog broja tvrtki.
Međutim, Meta je objavila kako bi trebala biti oprezna u pogledu sličnog pristupa s vrlo naprednim modelima umjetne inteligencije. Kineski DeepSeek također je objavio modele koje je moguće slobodno preuzeti i prilagoditi. Postojanje slobodno dostupnih, moćnih AI modela koje programeri mogu prilagoditi uznemirilo je pojedine stručnjake, koji su upozorili kako bi ih se moglo prilagoditi za nanošenje ozbiljne štete – primjerice, razvojem biološkog oružja.
Ne baš posve otvoreni računalni kod
Meta je svoje Llama modele definirala kao otvoreni računalni kod, što znači kako je moguće slobodno ih preuzeti i prilagođavati, a dostupni su i njihovi skupovi podataka za obuku, arhitektura i kod za obuku. Međutim, Open Source Initiative, industrijska organizacija sa sjedištem u SAD-u, upozorila je kako ograničenja koja Meta postavlja na korištenje svojih modela znače kako ih se ne može kvalificirati kao potpuno otvoreni kod.
OpenAI je koristio izraz 'otvorena težina', što je zapravo stupanj niže od otvorenog koda, što znači kako je model moguće fino ugađati, ali njegov rad nije u potpunosti transparentan programeru. Ta bi tvrtka uskoro mogla objaviti GPT-5, novo izdanje modela za ChatGPT.
U međuvremenu, Google je predstavio svoj najnoviji korak prema općoj umjetnoj inteligenciji s novim modelom koji sustavima s umjetnom inteligencijom omogućuje interakciju s uvjerljivom simulacijom stvarnog svijeta. Genie 3 mogao bi biti korišten za obuku robota i autonomnih vozila dok se bave realističnim rekreacijama okruženja poput skladišta.
U Google DeepMindu tvrde kako modeli svijeta ključni korak prema postizanju opće umjetne inteligencije, hipotetske razine na kojoj sustav može obavljati većinu zadataka ravnopravno s ljudima, pa i potencijalno obavljati nečiji posao. Takvi modeli vjerojatno će igrati važnu ulogu u razvoju agenata, sustava koji autonomno obavljaju zadatke, piše Guardian.