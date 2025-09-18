Rad pruža dosad najrigoroznije matematičko objašnjenje zašto ovi modeli samouvjereno iznose lažne tvrdnje. Pokazuje kako to nije samo nesretna nuspojava načina na koji se umjetnu inteligenciju trenutno obučava, već je matematički neizbježno.

Novi istraživački rad tvrtke OpenAI dijagnosticira zašto ChatGPT i drugi veliki jezični modeli mogu izmišljati stvari (halucinirati). Također otkriva zašto bi problem mogao biti nepopravljiv, barem što se tiče korisnika.

Problem se djelomično može objasniti pogreškama u temeljnim podacima koje se koristi za obuku umjetne inteligencije. No, koristeći matematičku analizu načina na koji sustavi umjetne inteligencije uče, istraživači dokazuju kako, čak i uz savršene podatke za obuku, problem i dalje postoji. Način na koji jezični modeli odgovaraju na upite – predviđanjem jedne riječi u rečenici, na temelju vjerojatnosti – prirodno proizvodi pogreške.

Istraživači zapravo pokazuju kako je ukupna stopa pogrešaka pri generiranju rečenica barem dvostruko veća od stope pogrešaka koju bi ista umjetna inteligencija imala na jednostavnom pitanju s da/ne, jer se pogreške mogu akumulirati tijekom višestrukih predviđanja.

Drugim riječima, stope halucinacija u osnovi su ograničene time koliko dobro sustavi umjetne inteligencije mogu razlikovati valjane od nevaljanih odgovora. Budući je ovaj problem klasifikacije inherentno težak za mnoga područja znanja, halucinacije postaju neizbježne.

Također se ispostavilo da što manje model vidi činjenicu tijekom obuke, to je veća vjerojatnost kako će halucinirati kada ga se o njoj pita. S rođendanima značajnih osoba, na primjer, utvrđeno je kako bi, ako se 20 posto rođendana takvih ljudi pojavi samo jednom u podacima za obuku, osnovni modeli trebali pogriješiti u najmanje 20 posto upita o rođendanima.

Epidemija kažnjavanja iskrenosti

Još je problematičnija analiza rada o tome zašto halucinacije traju unatoč naporima nakon obuke (kao što je pružanje opsežnih ljudskih povratnih informacija na odgovore umjetne inteligencije prije nego što se objave javnosti).

Autori su ispitali deset glavnih mjerila umjetne inteligencije, uključujući one koje koriste Google, OpenAI i vodeće ljestvice koje rangiraju modele umjetne inteligencije.

Otkrili su kako devet mjerila koristi binarne sustave ocjenjivanja koji dodjeljuju nula bodova za umjetne inteligencije koje izražavaju nesigurnost. To stvara nešto što autori nazivaju 'epidemijom' kažnjavanja iskrenih odgovora.

Kada sustav umjetne inteligencije kaže 'Ne znam', dobiva isti rezultat kao kad daje potpuno pogrešne informacije. Optimalna strategija u takvoj evaluaciji postaje jasna: uvijek pogađaj.

Istraživači to matematički dokazuju. Bez obzira na izglede kako je određeni odgovor točan, očekivani rezultat pogađanja uvijek premašuje rezultat suzdržavanja kada evaluacija koristi binarno ocjenjivanje.

Skupo i nepraktično za korisnike

OpenAI predlaže neka umjetna inteligencija razmotri vlastito povjerenje u odgovor prije nego što ga objavi, pa neka ga mjerila ocjenjuju na temelju toga.