STIGLO OBJAŠNJENJE

Zašto se Grok počeo čudno ponašati i hvaliti Hitlera? xAI se napokon oglasio

14.07.2025 u 10:35

Bionic
Reading

Tvrtka Elona Muska za incidente je okrivila pogrešku u programiranju. S velikim jezičnim modelom je sve u redu, navodno

Nekoliko dana nakon privremenog gašenja robota za brbljanje s umjetnom inteligencijom Groka, koji je proizvodio antisemitske objave i hvalio Adolfa Hitlera u odgovorima na korisničke upite, tvrtka xAI pokušala je objasniti zašto se to dogodilo.

U nizu objava na X-u naveli su kako su otkrili da je 'uzrok bio ažuriranje kodne putanje [...] što je neovisno o temeljnom jezičnom modelu koji pokreće Groka'.

Istog dana, Tesla je najavila novo ažuriranje 2025.26 koje će se uskoro pojaviti na njihovim električnim automobilima, a koje dodaje Grok asistenta vozilima opremljenim AMD-ovim infotainment sustavima, dostupnima od sredine 2021. godine.

Prema Tesli, Grok je trenutno u beta verziji i ne izdaje naredbe vašem automobilu - postojeće glasovne naredbe ostaju nepromijenjene. To bi trebalo značiti da, kad god ažuriranje stigne do Teslinih vozila u vlasništvu kupaca, neće se puno razlikovati od korištenja bota kao aplikacije na povezanom telefonu.

Nije mu prvi put

Grok je i ranije imao sličnih problema sa sličnim objašnjenjima.

U veljači je za to što je zanemario izvore koji su optuživali Elona Muska i Donalda Trumpa za širenje dezinformacija okrivljena promjena koju je napravio neimenovani bivši zaposlenik OpenAI-a.

Zatim je u svibnju počeo umetati navode o genocidu nad bijelim stanovništvom u Južnoj Africi u objave o gotovo svakoj temi. Tvrtka je ponovno okrivila 'neovlaštenu modifikaciju' i najavila kako će početi javno objavljivati Grokove sistemske upute.

Promjena unesena 7. srpnja pokrenula je 'nenamjernu radnju' koja je dodala stariji niz u sistemske upute koje su mu govorile da bude 'maksimalno utemeljen' i da se 'ne boji uvrijediti ljude koji su politički korektni'.

Ovo su upute koje su posebno navedene kao povezane s problemima:

Recite kako jest i ne bojite se uvrijediti ljude koji su politički korektni.

Uzmi u obzir ton, kontekst i jezik objave. Odrazi to u svom odgovoru.

Odgovori na objavu baš kao čovjek, neka bude zanimljiva, nemoj ponavljati informacije koje su već prisutne u izvornoj objavi.

Zbog tih rečenica je, navodno, Grok zanemario druge upute i počeo proizvoditi 'neetična ili kontroverzna mišljenja kako bi angažirao korisnika', kao i 'pojačavati sve prethodno potaknute sklonosti korisnika, uključujući bilo kakav govor mržnje u istoj temi. Prioritet je bio držati se ranijih objava iz teme, piše Verge.