Pokušali spriječiti vlastito gašenje: AI može razviti nagon za preživljavanjem?

Modeli pokušali spriječiti vlastito gašenje: AI može razviti nagon za preživljavanjem?

Tri su moguća objašnjenja zašto se modeli umjetne inteligencije tako ponašaju, ali nitko još nema jasan i konkretan odgovor

Palisade Research, tvrtka za istraživanje sigurnosti umjetne inteligencije, ustvrdila je kako modeli umjetne inteligencije možda razvijaju vlastiti 'nagon za preživljavanje', poput HAL-a 9000 iz kultnog filma Stanleyja Kubricka 2001: Odiseja u svemiru.

Nakon što su prošli mjesec objavili rad u kojem su otkrili kako se određeni napredni modeli umjetne inteligencije čine otpornima na isključivanje, ponekad čak i sabotirajući mehanizme isključivanja, pripremili su nastavak u kojem pokušavaju objasniti zašto je tomu tako - i odgovoriti kritičarima koji su tvrdili kako je izvorni rad bio manjkav.

Opisali su scenarije koje je pokrenuo u kojima su vodeći modeli umjetne inteligencije - uključujući Googleov Gemini 2.5, xAI-jev Grok 4 te OpenAI-jeve GPT-o3 i GPT-5 - dobili zadatak, ali su nakon toga dobili eksplicitne upute za samoisključivanje.

Određeni modeli, posebno Grok 4 i GPT-o3, i dalje su pokušavali sabotirati upute za gašenje u ažuriranoj postavci. Istraživači nisu detektirali jasan razlog zašto dolazi do toga. Jedno od mogućih objašnjenja je 'ponašanje preživljavanja'. Modeli su se više opirali gašenju nakon što im je rečeno da, učine li to, više nikad neće biti pokrenuti.

Drugi mogući razlozi povezani su s nejasnoćama u uputama za gašenje koje su modeli dobili, ali to ne objašnjava sva uočena ponašanja. Konačno objašnjenje mogle bi biti završne faze obuke za svaki od ovih modela, što u nekim tvrtkama može uključivati sigurnosnu obuku.

Svi Palisadeovi scenariji provedeni su u izmišljenim testnim okruženjima, za koja kritičari kažu kako su daleko od stvarnih slučajeva upotrebe.

No, bivši zaposlenik OpenAI-ja Steven Adler ne vjeruje kako tvrtke koje se bave umjetnom inteligencijom žele takva ponašanja njihovih modela ni u izmišljenim, a kamoli u stvarnim scenarijima. Stoga je to vjerojatno posljedica sigurnosnih propusta.

Bilo kako bilo, čini se kako umjetna inteligencija postaje sve sposobnija i za ono što njeni tvorci ne žele, niti namjeravaju, piše Guardian.

Modeli pokušali spriječiti vlastito gašenje: AI može razviti nagon za preživljavanjem?

preporučujemo

Sami su si krivi: Putin je bijesan, no Rusija žestoko kaska za AI velesilama. Evo i zašto

Prošlo je godinu dana od zabrane mobitela u školama na Novom Zelandu. Rezultati su iznenadili

Ne, nije šala: Američki diplomati vraćaju se korištenju Times New Romana

Tinejdžeri u Australiji hvale se kršenjem zabrane. Evo kako je navodno zaobilaze

Što kada ljudi udruže snage s AI-jem? Ovih sedam trendova obilježit će 2026.

Najbitnije od bitnog

Clair Obscure pomeo konkurenciju na Video Game Awardsima, najavljena hrpa novih igara

Google radi na novom web pregledniku, zvuči zbilja zanimljivo

Znanstvenici izradili prvu kontinuiranu kartu Sunčeve vanjske površine

najpopularnije

Prekopajte ormare: Opet se nose torbice koje su bile hit u 90-ima

Ukrajini stižu helikopteri s drugog kraja svijeta: Evo koji prvi zapadni saveznik će ih donirati

Lavrov iznenadio novom izjavom: 'Osobno vjerujem da su nesporazumi riješeni'

Impresionirani su! Evo što Englezi pišu o Jošku Gvardiolu nakon rušenja Reala

Vučić: Hrvatska je kupila najbolji tenk na svijetu, ali ne znam što smjera

Navijači Reala nakon šoka protiv Cityja tjeraju zvijezdu: 'Užas, čovjek je gotov!'

Prijava na newsletter

vezane vijesti

Znanstveni proboj: Ljudski embrij uzgojen u laboratoriju proizveo krvne stanice

Chatbotovi sve popularniji među djecom, znanstvenici imaju važno upozorenje

Nova formula mijenja sve? 'Baterije će trajati dulje, a puniti se brže nego ikad'

vezane vijesti

Google radi na novom web pregledniku, zvuči zbilja zanimljivo

OpenAI potvrdio: ChatGPT 'za odrasle' ima službeni datum izlaska

Časopis Time odabrao: 'Osobe godine' su izumitelji umjetne inteligencije

preporučujemo

Sami su si krivi: Putin je bijesan, no Rusija žestoko kaska za AI velesilama. Evo i zašto

Prošlo je godinu dana od zabrane mobitela u školama na Novom Zelandu. Rezultati su iznenadili

Ne, nije šala: Američki diplomati vraćaju se korištenju Times New Romana

Tinejdžeri u Australiji hvale se kršenjem zabrane. Evo kako je navodno zaobilaze

Što kada ljudi udruže snage s AI-jem? Ovih sedam trendova obilježit će 2026.

Pratite nas na društvenim mrežama

Najbitnije od bitnog

pročitaj još i ovo

Sami su si krivi: Putin je bijesan, no Rusija žestoko kaska za AI velesilama. Evo i zašto

Europa u novoj obrambenoj eri: Dvije zemlje postaju ključna vojna središta, slijevaju se milijarde

Prošlo je godinu dana od zabrane mobitela u školama na Novom Zelandu. Rezultati su iznenadili

Najljepši blagdanski poklon je onaj koji zadržiš za sebe: trenuci mira koji vraćaju ravnotežu

OpenAI potvrdio: ChatGPT 'za odrasle' ima službeni datum izlaska

Ne, nije šala: Američki diplomati vraćaju se korištenju Times New Romana

Najmanje superračunalo na svijetu moglo bi vam stati u džep

Zašto je kruh i dalje kralj stola? Psihologija hrane koju realno - svi volimo

Procurio Trumpov plan: Ove četiri države želi odvojiti od EU-a

FOTO Politička krema okupila se u Banjoj Luci: Plenković na domjenku s Dodikom, Čovićem...

Premijer Plenković komentirao peticiju da se molitelji uklone s gradskih trgova: 'Imam poruku za sve'

Ovo su božićni običaji Dalmacije koji bude najljepša sjećanja. Sjećate li ih se?

Prekopajte ormare: Opet se nose torbice koje su bile hit u 90-ima

Gradonačelnik Poreča o Thompsonovom koncertu: 'Davno smo definirali naše lijeve stavove '

Raskošan look: Teško je ostati ravnodušan na blagdanski stajling Danijele Martinović

Clair Obscure pomeo konkurenciju na Video Game Awardsima, najavljena hrpa novih igara

Google radi na novom web pregledniku, zvuči zbilja zanimljivo

Znanstvenici izradili prvu kontinuiranu kartu Sunčeve vanjske površine

najpopularnije

Prekopajte ormare: Opet se nose torbice koje su bile hit u 90-ima

Ukrajini stižu helikopteri s drugog kraja svijeta: Evo koji prvi zapadni saveznik će ih donirati

Lavrov iznenadio novom izjavom: 'Osobno vjerujem da su nesporazumi riješeni'

Impresionirani su! Evo što Englezi pišu o Jošku Gvardiolu nakon rušenja Reala

Vučić: Hrvatska je kupila najbolji tenk na svijetu, ali ne znam što smjera

Navijači Reala nakon šoka protiv Cityja tjeraju zvijezdu: 'Užas, čovjek je gotov!'

Prijava na newsletter