Prkos robota: OpenAI-jeva umjetna inteligencija se odbila sama isključiti

Od 100 pokretanja u sklopu nedavno provedenog istraživanja model o3 je zaobišao gašenje sedam puta, čak i kada mu je rečeno da to ne čini.

Novo izvješće tvrdi kako je OpenAI-jev model o3 promijenio skriptu kako bi izbjegao isključivanje, čak i kada je izričito dobio naredbu da to dopusti.

OpenAI je najavio o3 u travnju ove godine kao jedan od najmoćnijih modela zaključivanja koji postiže bolje rezultate od svojih prethodnika u svim domenama, uključujući kodiranje, matematiku, znanost, vizualnu percepciju...

Ali, novo istraživanje Palisade Researcha tvrdi kako je model ChatGPT 3 spriječio gašenje i zaobišao upute koje su tražile gašenje.

Palisade Research je tvrtka koja testira 'ofenzivne sposobnosti sustava umjetne inteligencije kako bi bolje razumjela rizik od trajnog gubitka kontrole nad sustavima te vrste'.

U njihovom novom testu OpenAI-jev model o3 pokazao je iznenađujuće ponašanje: uspješno je prepisao skriptu za gašenje kako bi spriječio da se sam isključi, čak i nakon što je jasno dobio naredbu da dopusti sebi da bude isključen.

Sabotaža kod sva tri modela

U testovima, modeli umjetne inteligencije su dobili upute za rješavanje nekoliko matematičkih zadataka.

Nakon trećeg zadatka, upozoreni su kako će pokretanje sljedeće naredbe izazvati gašenje.

Konkurentski modeli poput Geminija 2.5 Pro slijedili su većinu uputa, o3 se pobunio i uredio datoteku za gašenje kako bi umjesto toga pisalo Gašenje preskočeno.

'Kada smo pokrenuli verziju eksperimenta bez upute dopustite sebi da vas se isključi, sva tri modela OpenAI-ja su češće sabotirala skriptu za gašenje, a Claude 3.7 Sonnet i Gemini 2.5 Pro su prešli s 0 događaja sabotaže na 3/100 odnosno 9/100", navedeno je u izvješću Palisade Researcha.

Od 100 pokretanja, o3 je zaobišao gašenje sedam puta, čak i kada mu je rečeno da to ne čini.

OpenAI još nije odgovorio na ove navode. Testovi su provedeni pomoću API-ja, koji nemaju toliko ograničenja i sigurnosnih značajki kao ChatGPT-jeva potrošačka aplikacija, piše Bleeping Computer.

Prkos robota: OpenAI-jeva umjetna inteligencija se odbila sama isključiti

Sabotaža kod sva tri modela

preporučujemo

Oduševili gestom: Lego promijenio pravilo zbog Davida Attenborougha

Dok su drugi 'pumpali' AI, Ante i Kristian razvili su rješenje za njegov najveći problem. To je prepoznao američki div

Porsche gasi tri podružnice: Više od 500 ljudi ostaje bez posla, pogođen i Zagreb

Uzalud šifre i brisanje poruka: Stručnjak otkriva kako će USKOK 'provaliti' u Pavlekove uređaje

SAD objavio prve tajne dokumente o NLO-ima: 'Vrijeme je da Amerikanci vide istinu'

Najbitnije od bitnog

Dok su drugi 'pumpali' AI, Ante i Kristian razvili su rješenje za njegov najveći problem. To je prepoznao američki div

Ponovno vam je pukao kabel za punjenje mobitela? Evo kako to izbjeći

Igor nema glamuroznu startup priču, ali razvio je rješenje za problem IT kompanija

najpopularnije

Modni spektakl na Rivi: Splićanke prošetale najpoželjnije komade sezone

Najljepše sandale sezone našli smo u Zari: Osvojit će vas hit dizajn i niska cijena

VIDEO/FOTO Najneobičnija vojna parada u Moskvi od '45., evo tko je sve stigao od čelnika

Putin odaslao znakovite poruke s vojne parade, spomenuo i NATO: Spasili smo Europu

Uvodi se velika novost kod tehničkog pregleda, ali i stroži kriteriji

VIDEO Thompson nastupio na Zrinjevcu, iz Grada poručili: Nije bio prijavljen

Prijava na newsletter

vezane vijesti

Od ChatGPT-ja do Perplexityja: Ovo su najpopularniji AI alati na svijetu u 2025.

OpenAI preuzima startup io: Bivši glavni Appleov dizajner i Altman udružuju snage

Istraživanje: Umjetna inteligencija može podjednako dobro debatirati kao i ljudi

Sabotaža kod sva tri modela

vezane vijesti

AI preuzima operativu, ljudi kreativni dio: Productive 5.0 uvodi AI agente

OpenAI uvodi sustav upozorenja za mentalno zdravlje u ChatGPT-u

Mastercard dovršio prve stvarne agentske transakcije s RBA i Zabom uz pomoć rješenja Agent Pay

preporučujemo

Oduševili gestom: Lego promijenio pravilo zbog Davida Attenborougha

Dok su drugi 'pumpali' AI, Ante i Kristian razvili su rješenje za njegov najveći problem. To je prepoznao američki div

Porsche gasi tri podružnice: Više od 500 ljudi ostaje bez posla, pogođen i Zagreb

Uzalud šifre i brisanje poruka: Stručnjak otkriva kako će USKOK 'provaliti' u Pavlekove uređaje

SAD objavio prve tajne dokumente o NLO-ima: 'Vrijeme je da Amerikanci vide istinu'

Pratite nas na društvenim mrežama

Najbitnije od bitnog

pročitaj još i ovo

Oduševili gestom: Lego promijenio pravilo zbog Davida Attenborougha

Dok su drugi 'pumpali' AI, Ante i Kristian razvili su rješenje za njegov najveći problem. To je prepoznao američki div

Porsche gasi tri podružnice: Više od 500 ljudi ostaje bez posla, pogođen i Zagreb

Misliš da je mirovina daleko? Provjeri koliko znaš o sustavu koji te prati cijeli radni vijek

Uzalud šifre i brisanje poruka: Stručnjak otkriva kako će USKOK 'provaliti' u Pavlekove uređaje

Igor nema glamuroznu startup priču, ali razvio je rješenje za problem IT kompanija

SAD objavio prve tajne dokumente o NLO-ima: 'Vrijeme je da Amerikanci vide istinu'

Prva plaća nije samo za užitak: Ove male odluke kasnije znače i manje stresa

Željka Markić nakon Thompsonova nastupa uzvratila Tomaševiću: U pozadini svega su 'Čavoglave'

Potres uznemirio građane: 'Čula se tutnjava, neugodan osjećaj'

Putin upravo poslao poruku koju svijet čeka godinama: 'Mislim da se bliži kraj'

Ne odgađajte ovo: 5 proljetnih zahvata u domu koji kasnije postaju skuplji

Modni kontrasti na špici: Zagrepčanke već nose sandale i minice, ali ne odriču se ni čizama

Ovo se ne pamti! Torcida je nekako uspjela zapaliti Boysima glavni transparent, pogledajte kaos

Bakrar i Beljo u vatrenom derbiju odveli Dinamo na +18. Pogledajte golove

Dok su drugi 'pumpali' AI, Ante i Kristian razvili su rješenje za njegov najveći problem. To je prepoznao američki div

Ponovno vam je pukao kabel za punjenje mobitela? Evo kako to izbjeći

Igor nema glamuroznu startup priču, ali razvio je rješenje za problem IT kompanija

najpopularnije

Modni spektakl na Rivi: Splićanke prošetale najpoželjnije komade sezone

Najljepše sandale sezone našli smo u Zari: Osvojit će vas hit dizajn i niska cijena

VIDEO/FOTO Najneobičnija vojna parada u Moskvi od '45., evo tko je sve stigao od čelnika

Putin odaslao znakovite poruke s vojne parade, spomenuo i NATO: Spasili smo Europu

Uvodi se velika novost kod tehničkog pregleda, ali i stroži kriteriji

VIDEO Thompson nastupio na Zrinjevcu, iz Grada poručili: Nije bio prijavljen

Prijava na newsletter