'PEAK DATA'

AI-u ponestaje podataka za trening? 'Istraživači su gotovo iscrpili internet'

06.10.2025 u 10:41

Bionic
Reading

Umjetna inteligencija je progutala skoro sve informacije koje su dostupne na internetu, no AI kompanijama ih treba još više

AI modeli poput OpenAI-jevog ChatGPT-a i Googleovog Geminija suočavaju se s ozbiljnim ograničenjem - ponestaje im korisnih podataka za treniranje, upozorio je glavni podatkovni direktor Goldman Sachsa Neema Raphael i sada više nemaju dovoljno 'hrane' za daljnje učenje.

Na podcastu Exchanges Raphael je rekao da bi taj problem mogao usporiti daljnji razvoj umjetne inteligencije. ‘Već smo ostali bez podataka’, izjavio je Raphael, objašnjavajući da se modeli sada sve više oslanjaju na sintetičke podatke, odnosno one koje generira sama umjetna inteligencija.

‘Zanimljivo je razmisliti o mogućem kreativnom zasićenju... Ako svi podaci postanu sintetički, koliko ljudskih podataka uopće možemo još uključiti? To će biti filozofski vrlo zanimljivo promatrati.’

Ovo nije prvi put da stručnjaci upozoravaju na fenomen poznat kao peak data, trenutak kada su AI sustavi iscrpili većinu sadržaja dostupnog na internetu. Članak objavljen u časopisu Nature u prosincu predvidio je da će se taj ‘krizni trenutak’ dogoditi do 2028. godine.

'Internet je golemi ocean ljudskog znanja, ali nije beskonačan', naveli su autori. 'Istraživači umjetne inteligencije gotovo su ga iscrpili.' Na slično je prošle godine upozorio Ilya Sutskever, suosnivač OpenAI-ja, koji je izjavio da će nedostatak novih podataka neizbježno usporiti razvoj AI-ja.

'Dostigli smo peak data i novih podataka više neće biti', rekao je Sutskever. ‘Moramo se nositi s onim što imamo. Postoji samo jedan internet.' Usporedio je ljudski sadržaj s fosilnim gorivima - ograničen resurs koji se ne može beskonačno crpiti.

Ograničena količina svježih ljudskih podataka mogla bi natjerati tvrtke poput OpenAI-ja, Googlea i Anthropica da se odmaknu od klasičnih velikih jezičnih modela i usmjere prema AI agentima. Ti agenti funkcioniraju kao autonomni sustavi koji mogu samostalno obavljati zadatke i donositi odluke na internetu bez izravnog nadzora čovjeka.

Većina velikih AI kompanija već razvija takve sustave što bi, prema nekim analitičarima, mogao biti sljedeći korak u evoluciji umjetne inteligencije nakon 'peak data', piše. Independent. Drugi analitičari predlažu da će OpenAI ovaj problem pokušati riješiti proizvodnjom hardvera koji će, kako bi funkcionirao, nepresatno sakupljati svježe podatke iz korisnikove neposredne okoline. Sličnu igru igra i Meta sa svojim naočalama za proširenu stvarnost.