Tvrtke koje su se početkom 2025. prenakrcale pretplatama na sve i svašta sada se bore kako bi otkrile na što troše novac, smanjile potrošnju i otkrile mogu li spasiti dio ulaganja
Diljem industrije tvrtke se počinju protiviti cijenama korištenja umjetne inteligencije.
Uber je do travnja potrošio cijeli svoj proračun za AI za 2026. godinu, Microsoft je opozvao licence za Claude Code svojim programerima nekoliko mjeseci nakon što ih je ponudio, a u Pricelineu kažu da im je rutinska obnova ugovora za Cursor bila četiri do pet puta skuplja.
Iako su cijene po tokenu pale, poticaj za veće usvajanje umjetne inteligencije i sve autonomniji agenti doveli su do sve veće potrošnje tokena. Tvrtke koje su se početkom 2025. godine prenakrcale pretplatama na sve i svašta sada se bore kako bi otkrile na što troše novac, smanjile potrošnju i otkrile mogu li spasiti dio ulaganja iz ruševina svojih proračuna.
U međuvremenu se tržište priprema za njih. Startupovi, etablirani dobavljači i novo tijelo za standarde utrkuju se kako bi tvrtkama dali alate i jezik za praćenje onoga što troše. U tom kontekstu Zaklada Linux (Linux Foundation) je predstavila planove za Zakladu tokenomija (Tokenomics Foundation), novo tijelo za standarde koje ima cilj usaditi istu disciplinu troškova oko AI tokena kao što je to FinOps učinio za potrošnju u računalnom oblaku.
Raste potrošnja, a produktivnost?
Brojni glavni izvršni direktori žestoko su pritiskali svoje timove da koriste najbolje modele i brzo djeluju, bez obzira na troškove, a novi modeli objavljeni u studenom prošle godine – poput Anthropicova Claude Opusa 4.5, OpenAI-evog GPT-5.1 i Googleova Geminija 3 Pro – donijeli su značajna poboljšanja agentskim alatima, što je umnožilo potrošnju.
Tako se jedna tvrtka navodno našla suočena s računom od 500 milijuna američkih dolara nakon što je zaboravila postaviti ograničenja u korištenju za zaposlenike. Ima i onih koji ponašanje tvrtki što razvijaju umjetnu inteligenciju uspoređuju s postupcima dilera drogom koji žele navući nove ovisnike.
Dvogodišnja studija, provedena na 20 tisuća programera, a koju je Faros objavio u travnju, otkrila je da se proizvodnja povećava, ali raste i broj grešaka i prepisivanja.
Jellyfish, platforma za upravljanje inženjeringom, slično je otkrila da su inženjeri koji su koristili najviše tokena bili otprilike dvostruko produktivniji od onih koji su manje koristili umjetnu inteligenciju, ali su potrošili 10 puta više tokena da bi to postigli.
Potrošnja po programeru porasla je oko 18,6 puta u devet mjeseci, izračunali su u toj platformi, a nije jednostavno izračunati koliko je temeljem toga rasla produktivnost.
Problemi s mjerenjem
Barem dio tog problema mjerenja je sama skala u kojoj se umjetna inteligencija danas koristi. Praćenje tokena traži temeljito preispitivanje alata, specifikacija i računovodstvenih sustava, a postoje i tvrtke kao što je Pay-i, koja prati, mjeri i optimizira troškove i performanse ulaganja u generativnu umjetnu inteligenciju.
Paid, s druge strane, omogućuje programerima praćenje troškova, mjerenje korištenja i naplatu korisnicima na temelju stvarne vrijednosti, a ne pretplata. Osim Jellyfisha, tu su također Waydev te već spomenuti Faros AI, a svi oni omogućuju praćenje AI agenata kako bi dokazali povrat ulaganja razvojnih alata.
Tvrtke s postojećom distribucijom također dodaju nove značajke da bi ih kapitalizirale na ovom novom tržištu. Ramp se tako nedavno prebacio na upravljanje AI troškovima, a Datadog i New Relic dodali su usluge poput upravljanja troškovima u oblaku, promatranja na razini tokena i praćenja GPU-a.
Očekuje se da će AWS također predstaviti nove značajke financijskog upravljanja usmjerene na troškove poduzeća za AI te se procjenjuje da će učinkovitost i promatranje tokena vjerojatno biti dodani kao sloj opreme ili aplikacije, a sve će češći biti i alati koji automatski biraju pravi model AI-a za svaki zadatak.
Moguće je da će pružatelji modela usvojiti optimizaciju u stilu OpenRoutera kako bi usmjerili upite na najjeftinije modele, što je trend koji se već pojavljuje na poslovnim računima Anthropicova Claudea.
Potreba za zajedničkim jezikom
Ali sve ove alate gradi se bez zajedničkog jezika ili zajedničkih definicija o tome koliko token košta, što proizvodi i kako usporediti potrošnju među dobavljačima, a tu svoju priliku vidi Zaklada tokenomija.
U njoj grade definiciju i okvir za tokenomiju, otvorene standarde, specifikacije i metrike za korištenje i naplatu AI tokena, kao i nove metrike za AI ekonomiju, poput cijene po inteligenciji ili tokena po vatu. Također planiraju definirati metrike za učinkovitost tvornice tokena i učinkovitost potrošnje, a formalno predstavljanje rezultata njihovih napora najavljeno je za srpanj.
Goldman Sachs predviđa da će globalna upotreba tokena do 2030. godine biti 24 puta veća. No tvrtke koje su već premašile proračun trebaju rješenja sada, a prvi rezultat Zaklade tokenomija još je mjesecima daleko, piše Tech Crunch.