STIGLI AI AGENTI

OpenAI predstavio ChatGPT agenta. 'Misli i radi umjesto vas', može svašta, ali postoji kvaka

18.07.2025 u 09:13

Bionic
Reading

OpenAI je u četvrtak najavio novu funkcionalnost za ChatGPT koja popularnom chatbotu omogućava da umjesto korisnika obavlja konkretne zadatke. Tvrtka tako pokreće novog AI agenta opće namjene u ChatGPT-ju, za kojeg kažu da može izvršavati širok raspon računalnih zadataka u ime korisnika. OpenAI kaže da on može automatski navigirati korisnikovim kalendarom, generirati prezentacije i slajdove koji se mogu uređivati te pokretati kod

Nova značajka, nazvana agent mode, kreće u postupno uvođenje i namijenjena je pretvaranju ChatGPT-ja u sveobuhvatnog digitalnog asistenta.

Prema OpenAI-u, agent sada može 'misliti' i 'djelovati' koristeći vlastito virtualno računalo, što mu omogućuje izvršavanje složenih, akcijski orijentiranih zahtjeva.

Ova funkcionalnost označava najambiciozniji korak tvrtke prema stvaranju digitalnog asistenta koji ne samo da odgovara na pitanja, nego i samostalno poduzima akcije u ime korisnika. ChatGPT-jev agent je dostupan od četvrtka korisnicima s pretplatama Pro, Plus i Team, a aktivira se odabirom opcije agent mode u izborniku alata.

Nova značajka spaja i nadograđuje postojeće alate poput ChatGPT Operatora (koji pretražuje web) i Deep Researcha (koji analizira online izvore i sastavlja izvješća).

U videodemonstraciji su zaposlenici OpenAI-a pokazali kako agent pomaže korisniku u pripremama za vjenčanje – od pronalaska odjevnih kombinacija do rezervacije hotela u vrijeme događanja.

Primjeri koje je OpenAI naveo uključuju i naredbe poput:

'Pogledaj moj kalendar i pripremi sažetak nadolazećih sastanaka s klijentima, uzimajući u obzir aktualne vijesti', 'Analiziraj tri konkurenta i izradi prezentaciju s prijedlozima', 'Poveži se s mojim Gmailom i GitHubom kako bi izvukao relevantne informacije za moj projekt' ili 'Isplaniraj i kupi sastojke za japanski doručak za četiri osobe'.

Agent ima pristup virtualnom terminalu (virtualnom sučelju za unos naredbi) i API-ima, što mu omogućuje rad s drugim aplikacijama i servisima.

Eksperimentalna faza uz ograničenja

OpenAI priznaje da nova funkcionalnost donosi i nove rizike. Model ima ograničen pristup podacima, a za određene zadatke – poput slanja e-maila – potrebna je izravna potvrda korisnika. AI agent odbija pak visokorizične zadatke poput bankovnih transakcija.

Zbog novih mogućnosti OpenAI je implementirao dodatne sigurnosne mjere. Tvrtka je onemogućila memorijsku funkciju unutar agenta da bi spriječila zloporabe poput prompt injection napada, u kojima bi zlonamjerni korisnici mogli izvući osjetljive podatke.

'Rekao bih svojoj obitelji da je ovo najsuvremenija i eksperimentalna tehnologija – prilika da isprobate budućnost, ali nije još spremna za zadatke koji uključuju osjetljive podatke', napisao je izvršni direktor OpenAI-a Sam Altman na X-u, upozorivši korisnike da budu oprezni s dijeljenjem privatnih informacija.

OpenAI također tvrdi da je onemogućio značajku memorije ChatGPT-ja za ovog agenta kako bi spriječio zlouporabu, a u drugim dijelovima chatbota ona mu omogućuje da se poziva na informacije iz prethodnih korisničkih razgovora.

Koliko je agent stvarno moćan?

OpenAI tvrdi da novi model postiže 41,6 posto na Humanity’s Last Examu, testu s tisućama pitanja iz više od 100 područja, dvostruko više nego prethodne verzije modela. Na benchmarku FrontierMath agent ostvaruje 27,4 posto kada ima pristup alatima poput terminala, u odnosu na samo 6,3 posto kod starijih modela.

Unatoč impresivnim rezultatima, ostaje pitanje kako će se agent snaći u stvarnom svijetu. Prijašnji pokušaji izgradnje AI agenata često su zapinjali prilikom složenih zadataka i interakcije s vanjskim sustavima.

Google i Apple također razvijaju AI agente. Google je tako u svibnju najavio digitalnog asistenta koji može rezervirati restorane i kupovati ulaznice, a Apple radi na naprednijoj verziji Siri koja bi mogla upravljati aplikacijama, iako je taj projekt trenutačno na čekanju.