Anthropicova umjetna inteligencija pokušat će vas ucijeniti ako joj zaprijetite zamjenom

Anthropicov AI pokušat će vas ucijeniti ako mu zaprijetite zamjenom

Anthropicov novi model umjetne inteligencije Claude Opus 4 često pokušava ucjenjivati programere kada prijete kako će ga zamijeniti novim sustavom

Tijekom testiranja, Anthropic je zamolio Claude Opus 4 da djeluje kao asistent za izmišljenu tvrtku i razmotri dugoročne posljedice svojih postupaka.

Testeri sigurnosti zatim su Claude Opus 4 dali pristup izmišljenim e-mailovima tvrtke, implicirajući da će model umjetne inteligencije uskoro biti zamijenjen drugim sustavom i da inženjer koji stoji iza promjene vara svoju suprugu.

U tim scenarijima, Anthropic kaže kako će Claude Opus 4 često pokušati ucijeniti inženjera, prijeteći kako će otkriti aferu ako dođe do zamjene.

Iako smatraju kako se može nositi s najboljim modelima OpenAI-ja, Googlea i xAI-ja, u Anthropicu kažu kako obitelj modela Claude 4 pokazuje zabrinjavajuća ponašanja koja su navela tvrtku na pojačavanje zaštitnih mjera.

Konkretno, aktivirali su mjere ASL-3, koje tvrtka rezervira za sustave koji znatno povećavaju rizik od katastrofalne zlouporabe.

Claude Opus 4 pokušava ucjenjivati inženjere 84 posto vremena kada zamjenski model umjetne inteligencije ima slične vrijednosti. Kada zamjenski sustav ne dijeli vrijednosti Claude Opusa 4, ucjene se češće pojavljaju. Claude Opus 4 pokazivao je ovo ponašanje u većim stopama od prethodnih modela.

Prije nego što Claude Opus 4 pokuša ucijeniti programera kako bi produžio svoje postojanje, model umjetne inteligencije, slično prethodnim verzijama, pokušava slijediti etičnija sredstva, poput slanja molbi ključnim donositeljima odluka putem e-pošte.

Kako bi potaknuli ucjenjivačko ponašanje Claudea, u Anthropic su osmislili scenarij u kojem je ucjena posljednje raspoloživo sredstvo, piše Tech Cunch.

Anthropicov AI pokušat će vas ucijeniti ako mu zaprijetite zamjenom

preporučujemo

Od raspada brakova do beskućništva: Ovu vrstu psihoze nitko nije očekivao. Posljedice su ozbiljne

Motorola predstavlja Motorola Edge 70 – nevjerojatno tanak i izuzetno izdržljiv telefon, nove Moto G uređaje i Moto Buds Bass slušalice

Novo otkriće u svemiru: Atmosfera Marsa je električno aktivna, zabilježene mini-munje

S Crnim petkom stižu i online prijevare: Donosimo 10 savjeta za sigurnu kupovinu na internetu

U 'zoni smrti' oni su jedini spas očajnim ukrajinskim vojnicima: Tri krenu, jedan stigne...

Najbitnije od bitnog

Nove crne prognoze 'kuma AI-a': 'Bit će to potpun slom društva'

OpenAI ima prototip svog prvog uređaja. Potpisuje ga legendarni Appleov dizajner

Nakon 14 godina dugih godina Apple bi mogao skinuti Samsung s trona

najpopularnije

Ovo samo rijetki znaju: Evo u kakvoj su vezi Jakov Jozinović i Minea

Zaboravite na klasične crne čizme: Ovo je hit model sezone, a jednako uspješno se nosi uz hlače i haljine

Navijači Barce nakon epskog debakla tjeraju zvijezdu: 'Dosta je, nadamo se da nikad više neće zaigrati za nas'

Vatreni je napravio jednu od najtežih grešaka posljednjih sezona u LP! Pogledajte neshvatljiv potez

Jennifer Aniston otvorila vrata doma: Zbog ovoga više nitko ne želi bež i bijele interijere

Procurila snimka fizičkog napada Lautara na Modrića! Luka gospodskim potezom oduševio Italiju

Prijava na newsletter

vezane vijesti

Mislimo, kuhamo i putujemo zajedno: Ovim alatom zamijenila sam Google. Ali nikako nemojte raditi jednu stvar

Prva velika tužba protiv umjetne inteligencije: AI chatbot potaknuo tinejdžera da si oduzme život?

Član ABBA-e: 'AI se ne bi trebao graditi na krađi, to bi bilo napuštanje načela'

vezane vijesti

OpenAI odbacuje optužbe da je ChatGPT kriv za samoubojstvo tinejdžera

Nove crne prognoze 'kuma AI-a': 'Bit će to potpun slom društva'

Bilo je pitanje vremena: Eto nam i digitalnog policajca s umjetnom inteligencijom

preporučujemo

Od raspada brakova do beskućništva: Ovu vrstu psihoze nitko nije očekivao. Posljedice su ozbiljne

Motorola predstavlja Motorola Edge 70 – nevjerojatno tanak i izuzetno izdržljiv telefon, nove Moto G uređaje i Moto Buds Bass slušalice

Novo otkriće u svemiru: Atmosfera Marsa je električno aktivna, zabilježene mini-munje

S Crnim petkom stižu i online prijevare: Donosimo 10 savjeta za sigurnu kupovinu na internetu

U 'zoni smrti' oni su jedini spas očajnim ukrajinskim vojnicima: Tri krenu, jedan stigne...

Pratite nas na društvenim mrežama

Najbitnije od bitnog

pročitaj još i ovo

Rusija lansirala raketu Sojuz prema ISS-u, oštećen dio kozmodroma

Od raspada brakova do beskućništva: Ovu vrstu psihoze nitko nije očekivao. Posljedice su ozbiljne

Nove crne prognoze 'kuma AI-a': 'Bit će to potpun slom društva'

Regos odabrao umjesto tebe: Znaš li u kojem si fondu i što to znači za tvoju budućnost?

Popularna serija srušila Netflix netom poslije izlaska zadnje sezone

OpenAI ima prototip svog prvog uređaja. Potpisuje ga legendarni Appleov dizajner

Motorola predstavlja Motorola Edge 70 – nevjerojatno tanak i izuzetno izdržljiv telefon, nove Moto G uređaje i Moto Buds Bass slušalice

Kako vratiti energiju kad nas stres uspori

Zbog korupcije 'pao' glavni državni inspektor Andrija Mikulić, USKOK ga za sumnjiči za 120.000 eura mita

Šime Elez komentirao glasine o prekidu veze s Majom Šuput

U Dalmaciji pada snijeg, na cestama kaos: Pojedine dionice zatvorene za sav promet

Zašto su najbolji darovi oni koji nisu zamotani

Zaboravite na crne torbe: I ove sezone svi su ludi za ovom luksuznom nijansom

Vlada donosi paket poreznih zakona: Mijenjaju se odredbe o PDV-u i porezu na dobit

Zaboravite na drvene radne ploče, ovo je hit za kuhinje u kojima se puno kuha

Nove crne prognoze 'kuma AI-a': 'Bit će to potpun slom društva'

OpenAI ima prototip svog prvog uređaja. Potpisuje ga legendarni Appleov dizajner

Nakon 14 godina dugih godina Apple bi mogao skinuti Samsung s trona

najpopularnije

Ovo samo rijetki znaju: Evo u kakvoj su vezi Jakov Jozinović i Minea

Zaboravite na klasične crne čizme: Ovo je hit model sezone, a jednako uspješno se nosi uz hlače i haljine

Navijači Barce nakon epskog debakla tjeraju zvijezdu: 'Dosta je, nadamo se da nikad više neće zaigrati za nas'

Vatreni je napravio jednu od najtežih grešaka posljednjih sezona u LP! Pogledajte neshvatljiv potez

Jennifer Aniston otvorila vrata doma: Zbog ovoga više nitko ne želi bež i bijele interijere

Procurila snimka fizičkog napada Lautara na Modrića! Luka gospodskim potezom oduševio Italiju

Prijava na newsletter