OpenAI tvrdi da je najnoviji AI model puno učinkovitiji te da je daleko manje podložan klasičnim problemima poput pogrešnih odgovora ili halucinacija
Nakon kontroverzne odluke o suradnji s američkim Ministarstvom obrane (DoD), koja je izazvala negativne reakcije javnosti i unutar same tvrtke, OpenAI pokušava vratiti povjerenje korisnika lansiranjem najnovijeg modela - GPT-5.4. Tvrtka ga opisuje kao 'najsposobniji i najučinkovitiji model za profesionalni rad', ističući značajna poboljšanja u razumijevanju, programiranju i autonomnim radnim procesima, sve unutar jednog unificiranog modela.
Dostupnost i osnovne karakteristike
GPT-5.4 počinje se uvoditi od danas i bit će dostupan u ChatGPT-u, Codexu te preko OpenAI-jevog API-ja. Korisnici ChatGPT-a Plus, Teams i Pro plana dobit će pristup GPT-5.4 Thinking, dok će GPT-5.4 Pro biti dostupan preko API-ja, kao i za ChatGPT Enterprise i Edu pretplatnike.
Najznačajnija novost je da je GPT-5.4 prvi OpenAI-jev model opće namjene s ugrađenim mogućnostima autonomne upotrebe računala. To znači da model može samostalno obavljati zadatke preko različitih aplikacija na korisnikovom uređaju, uključujući pisanje i izvođenje koda, kao i slanje naredbi tipkovnicom i mišem za navigaciju operativnim sustavom. Ovo predstavlja veliki korak naprijed u razvoju tzv. agentičke umjetne inteligencije.
Benchmark rezultati i poboljšanja
OpenAI tvrdi da je GPT-5.4 postigao vrhunske rezultate na nekoliko ključnih benchmark testova. Model je zauzeo prvo mjesto na Mercorovom APEX-Agents benchmarku, koji mjeri performanse za profesionalne usluge, kao i na OSWorld-Verified i WebArena Verified testovima koji se usredotočuju na upotrebu računala.
Za prosječnog korisnika ChatGPT-a, koji model uglavnom koristi za postavljanje pitanja i dobivanje odgovora, OpenAI obećava značajna poboljšanja. Prema tvrtki, pojedinačni odgovori GPT-5.4 su 33 posto manje vjerojatno da će sadržavati pogreške u odnosu na GPT-5.2, a ukupna vjerojatnost grešaka smanjena je za 18 posto. Također, model je manje sklon 'halucinacijama', odnosno izmišljanju nepostojećih činjenica, piše Gizmodo.
Javna reakcija i budućnost platforme
OpenAI se nada da će ova poboljšanja privući natrag korisnike, posebno nakon što je platforma, prema izvješćima, izgubila oko 1,5 milijuna korisnika nakon najave suradnje s Ministarstvom obrane. Odluka je izazvala ne samo javnu kritiku, već i unutarnje neslaganje s nekim zaposlenicima otvoreno izražavajući protivljenje suradnji s Pentagonom. Iako manje grešaka u odgovorima sigurno poboljšava korisničko iskustvo, pitanje je hoće li to biti dovoljno da se obnovi povjerenje u tvrtku i njenog vodstva.