OpenAI proveo istraživanje: ChatGPT postaje sve pametniji i sve više izmišlja

Koristite ChatGPT? Istraživanje pokazalo da postaje sve pametniji, ali i da sve više izmišlja

Prema jednoj od teorija koje kruže u istraživačkoj zajednici umjetne inteligencije, što više zaključivanja model pokušava izvesti, to je veća vjerojatnost kako će skrenuti s tračnica

Najnoviji vodeći modeli OpenAI-a, GPT o3 i o4-mini, namijenjeni su oponašanju ljudske logike. Za razliku od prethodnika, koji su se uglavnom fokusirali na generiranje tečnog teksta, OpenAI je izgradio GPT o3 i o4-mini kako bi stvari promišljali korak po korak.

OpenAI se pohvalio kako o1 može dostići ili nadmašiti performanse doktoranda iz kemije, biologije i matematike. No, izvješće OpenAI-ja ističe neke uznemirujuće rezultate za svakoga tko uzima odgovore ChatGPT-ja zdravo za gotovo.

OpenAI je otkrio kako je model GPT o3 uključio halucinacije u trećinu referentnog testa vezanog uz javne osobe. To je dvostruko veća stopa pogreške od ranijeg modela o1 iz prošle godine. Kompaktniji model o4-mini pokazao se još lošijim, halucinirajući na 48 posto sličnih zadataka.

Prilikom testiranja na pitanjima općenitijeg znanja za SimpleQA benchmark, halucinacije su se povećale na 51 posto odgovora za o3 i 79 posto za o4-mini. Prema jednoj od teorija koje kruže u istraživačkoj zajednici umjetne inteligencije, što više zaključivanja model pokušava izvesti, to je veća vjerojatnost kako će skrenuti s tračnica.

Opširniji odgovori, više kreativnosti

Za razliku od jednostavnijih modela, koji se drže predviđanja visoke pouzdanosti, modeli zaključivanja upuštaju se u područje gdje moraju procijeniti više mogućih putova, povezati različite činjenice i, u biti, improvizirati. A improvizacija oko činjenica poznata je i kao - izmišljanje.

OpenAI smatra kako je moguće da do porasta halucinacija nije došlo zato što su modeli zaključivanja inherentno lošiji, već radi toga što su opširniji i avanturističkiji u svojim odgovorima. Budući novi modeli ne samo ponavljaju predvidljive činjenice, već nagađaju o mogućnostima, granica između teorije i izmišljenih činjenica može postati nejasna za umjetnu inteligenciju.

Ipak, više halucinacija suprotno je onome što OpenAI i njegovi konkurenti poput Googlea i Anthropica žele od svojih najnaprednijih modela. Odvjetnici su već upali u nevolje jer su koristili ChatGPT i nisu primijetili izmišljene sudske citate. Puno ozbiljniji problemi mogli bi nastati počne li ih se koristiti u učionicama, uredima, bolnicama, vladinim agencija...

Dok se te probleme ne riješi, svaki odgovor modela umjetne inteligencje trebali biste uzeti s dozom opreza i rezerve, piše Tech Radar.

Koristite ChatGPT? Istraživanje pokazalo da postaje sve pametniji, ali i da sve više izmišlja

Opširniji odgovori, više kreativnosti

preporučujemo

Roberto Kutić ima novi projekt nakon odlaska iz Infobipa

Može li NATO dovoljno brzo inovirati da bi se suprotstavio ovoj rastućoj ruskoj prijetnji?

NASA: 'Vanzemaljci nas vjerojatno prisluškuju'

Provjera dobi na porno stranicama: Zaštita maloljetnika ili uvod u masovni nadzor?

Albanska 'AI ministrica' održala prvi govor, oporba bijesna: 'Još više korupcije'

Najbitnije od bitnog

Hrvati sve svjesniji AI-a: Evo što je pokazalo veliko istraživanje, ali i što kažu vodeći stručnjaci

EK traži od Microsofta, Applea, Googlea i Bookinga dokaze o sprječavanju online prijevara

Paralizirani sustavi: Britanski automobilski div suočava se s jednom od najvećih kriza u povijesti

najpopularnije

Milanović na sastanku svjetskih čelnika u UN-u, pogledajte tko mu je pravio društvo

Milanović iz SAD-a poslao oštru poruku: Ovo do sada nije zabilježeno...

Gazprom se odrekao udjela u Naftnoj industriji Srbije: Pazite kome su otišle dionice

Ministar Piletić odgovorio na pitanje koje zanima brojne umirovljenike

Tko bi rekao da je to ona: Pogledajte radikalnu promjenu domaće pjevačice

Sandi objavio djelić atmosfere s proslave rođendana Maje Šuput. Među gostima i - Šime

Prijava na newsletter

vezane vijesti

OpenAI preuzima platformu Windsurf i planira prepoloviti udio prihoda koji dijeli s Microsoftom

Ne znate za što koristiti koji model ChatGPT-ja? Evo nekoliko smjernica i ideja

ChatGPT vam od sada može pomoći i u kupovini online

Opširniji odgovori, više kreativnosti

vezane vijesti

Siemens udružuje snage sa skupinom europskih proizvođača na obuci AI-ja za industriju

Hrvati sve svjesniji AI-a: Evo što je pokazalo veliko istraživanje, ali i što kažu vodeći stručnjaci

Hoće li EU pauzirati Zakon o umjetnoj inteligenciji, iako još nije ni proveden?

preporučujemo

Roberto Kutić ima novi projekt nakon odlaska iz Infobipa

Može li NATO dovoljno brzo inovirati da bi se suprotstavio ovoj rastućoj ruskoj prijetnji?

NASA: 'Vanzemaljci nas vjerojatno prisluškuju'

Provjera dobi na porno stranicama: Zaštita maloljetnika ili uvod u masovni nadzor?

Albanska 'AI ministrica' održala prvi govor, oporba bijesna: 'Još više korupcije'

Pratite nas na društvenim mrežama

Najbitnije od bitnog

pročitaj još i ovo

Jeste li kolerik ili sangvinik? Evo kako su stari Grci tumačili ljudsku osobnost

Roberto Kutić ima novi projekt nakon odlaska iz Infobipa

Može li NATO dovoljno brzo inovirati da bi se suprotstavio ovoj rastućoj ruskoj prijetnji?

Od pisama na papiru do Tinder matcheva: Kako se udvaranje mijenjalo kroz vrijeme

Paralizirani sustavi: Britanski automobilski div suočava se s jednom od najvećih kriza u povijesti

Danas ili sutra je 'smak svijeta' – barem tako tvrde evangelici na TikToku. Evo kako se pripremaju

NASA: 'Vanzemaljci nas vjerojatno prisluškuju'

Pametan odabir užine: što jesti kad trebaš više energije i bolje pamćenje

Milanović na sastanku svjetskih čelnika u UN-u, pogledajte tko mu je pravio društvo

Milanović iz SAD-a poslao oštru poruku: Ovo do sada nije zabilježeno...

Svi ih žele: Ove gležnjače gospodarit će uličnom modom idućih mjeseci

Bez stresa do užine: Ovo je 5 međuobroka koje klinci vole, a vi lako pripremate

Američki novinar o Modriću: Jeste li ikad vidjeli ovo?!

Šimina poruka podigla prašinu: 'Majo Šuput, sve znaš...'

Gazprom se odrekao udjela u Naftnoj industriji Srbije: Pazite kome su otišle dionice

Hrvati sve svjesniji AI-a: Evo što je pokazalo veliko istraživanje, ali i što kažu vodeći stručnjaci

EK traži od Microsofta, Applea, Googlea i Bookinga dokaze o sprječavanju online prijevara

Paralizirani sustavi: Britanski automobilski div suočava se s jednom od najvećih kriza u povijesti

najpopularnije

Milanović na sastanku svjetskih čelnika u UN-u, pogledajte tko mu je pravio društvo

Milanović iz SAD-a poslao oštru poruku: Ovo do sada nije zabilježeno...

Gazprom se odrekao udjela u Naftnoj industriji Srbije: Pazite kome su otišle dionice

Ministar Piletić odgovorio na pitanje koje zanima brojne umirovljenike

Tko bi rekao da je to ona: Pogledajte radikalnu promjenu domaće pjevačice

Sandi objavio djelić atmosfere s proslave rođendana Maje Šuput. Među gostima i - Šime

Prijava na newsletter