Eksplozivan rast umjetne inteligencije počinje dolaziti na naplatu. Industrija koja je posljednjih godina rasla gotovo bez ograničenja sada se suočava s ozbiljnim problemom – ponestaje joj računalne snage, ključnog resursa bez kojeg daljnji razvoj nije moguć. Posljedice su već vidljive: učestali padovi sustava, ograničenje korištenja i odgađanje proizvoda. Prvi je to ozbiljan signal da bi AI bum mogao naići na granice upravo u trenutku u kojem ga sve više korisnika počinje svakodnevno koristiti za povećanje produktivnosti
U središtu problema nalazi se nagli rast potražnje za tzv. AI agentima, alatima koji samostalno izvršavaju složene zadatke, od pisanja programskog koda do organizacije poslovnih procesa. Takvi sustavi troše višestruko više računalnih resursa od klasičnih chatbotova, piše Wall Street Journal.
'Svi pričaju o nafti, ali mislim da svijetu zapravo najviše nedostaju tokeni', kaže Ben Pouladian, inženjer i investitor iz Los Angelesa. Token je naime osnovna jedinica kojom se mjeri potrošnja računalnih resursa u AI sustavima. 'AI više nije chatbot kojem postavljamo pitanja dok stojimo pred hladnjakom. On sada orkestrira zadatke i postaje sve pametniji', dodaje.
Ovakav razvoj ukazuje na klasičan problem koji se ponavlja kroz povijest tehnoloških revolucija – od željeznica u 19. stoljeću do internetskog buma početkom 2000-ih – jer potražnja raste znatno brže nego što se može izgraditi potrebna infrastruktura.
Cijene rastu, kapaciteti se ograničavaju
Jedan od najvidljivijih pokazatelja krize je nagli rast cijena računalnih resursa. GPU-ovi, specijalizirani čipovi koji pokreću AI modele, značajno su poskupjeli u posljednjim mjesecima. Prema podacima s tržišta, najnapredniji čipovi kompanije Nvidia iz generacije Blackwell sada se iznajmljuju po cijeni od 4,08 dolara po satu, što je čak 48 posto više nego prije samo dva mjeseca.
Kompanije stoga počinju uvoditi ograničenja. Anthropic, koji stoji iza popularnog modela Claude, posljednjih mjeseci suočava s čestim padovima sustava i počeo je ograničavati korištenje računalnih resursa u vršnim satima, no korisnici se žale da dosežu limite znatno brže nego prije.
'Nisam tjednima dosegnuo limit, a ovaj tjedan sam ga dosegao za 45 minuta', napisao je jedan od korisnika na društvenim mrežama.
Problemi nisu zaobišli ni OpenAI. Tvrtka je, prema dostupnim informacijama, odustala od razvoja aplikacije za generiranje videa Sora da bi oslobodila računalne resurse za ključne projekte, uključujući razvoj novih modela za poslovne korisnike.
Potrošnja na njihovim API sustavima eksplodirala je sa šest milijardi tokena u minuti u listopadu na njih čak 15 milijardi krajem ožujka. 'Provodim puno vremena pokušavajući pronaći bilo kakav slobodan računalni kapacitet u zadnji čas', rekla je Sarah Friar, financijska direktorica OpenAI-a, dodajući: 'Trenutno donosimo vrlo teške odluke o projektima koje nećemo razvijati jer nemamo dovoljno računalne snage za njih.'
'Kriza kapaciteta kakvu nisam dugo vidio'
Situacija se komplicira jer se infrastruktura ne može brzo proširiti. 'Ovo je kriza kapaciteta kakvu nisam vidio u više od pet godina poslovanja', upozorava J.J. Kardwell, direktor cloud kompanije Vultr.
Problem nije samo u čipovima, već i u vremenu potrebnom za izgradnju podatkovnih centara i osiguravanje energije. 'Zašto jednostavno ne postavimo više opreme? Zato što to traje. Podatkovni centri se dugo grade, a energija za 2026. godinu unaprijed je rezervirana', kaže Kardwell.
Osim cijene i dostupnosti, problem postaje pouzdanost. U IT industriji standard pouzdanosti često se mjeri pomoću tzv. četiri devetke – 99,99 posto dostupnosti. No AI sustavi još su daleko od toga. Primjerice, Claude API imao je dostupnost od 98,95 posto u posljednja tri mjeseca.
'To nije normalno', upozorava Amir Haghighat iz tvrtke Baseten. 'Servisi poput AWS-a, baza podataka ili Stripea moraju biti iznimno pouzdani. No to nije razina na kojoj je AI danas.' Zbog toga neki korisnici već prelaze konkurenciji – ne zbog kvalitete modela, nego zbog stabilnosti.
David Hsu iz platforme Retool kaže da je, unatoč tome što mu odgovara Anthropicov model, bio prisiljen prijeći na konkurenciju. 'Anthropic jednostavno stalno pada', kaže.
Eksplozivan rast, ali i sve veći pritisak
Paradoksalno, ti problemi dolaze u trenutku rekordnog rasta. Anthropic je krajem 2025. imao procijenjeni godišnji prihod od devet milijardi dolara, do veljače je taj iznos narastao na 14 milijardi, a već dva mjeseca kasnije udvostručio se na čak 30 milijardi dolara.
Unatoč tome, tvrtka je krajem ožujka uvela ograničenja potrošnje tokena u vršnim satima (od 5 do 11 sati po pacifičkom vremenu radnim danom). 'Kapacitet je resurs kojim pažljivo upravljamo i dajemo prioritet korisnicima naših proizvoda i API-ja', poručio je Boris Cherny, voditelj Claude Codea.
Umjetna inteligencija tako više nije ograničena idejama ili algoritmima, već fizičkom infrastrukturom. Ako industrija ne uspije ubrzano povećati kapacitete – od proizvodnje čipova do izgradnje podatkovnih centara – daljnji rast mogao bi se usporiti. A to je ozbiljan izazov za tehnologiju koja se sve češće opisuje kao temelj buduće globalne ekonomije.