IZ 'KUHINJE' OPENAI-JA

Povijesni dan za umjetnu inteligenciju: Pogledajte kakva videa radi novi AI model Sora

16.02.2024 u 10:49

Bionic
Reading

OpenAI-jev novi model Sora koristi prirodni jezik kako bi stvarao uvjerljiva videa u trajanju od minute. Videa su bez zvuka i, kompanija kaže, pate od raznih grešaka. S druge strane, ovaj trend prikazuje zanimljivu budućnost u kojoj je sve teže razlikovati lažni od pravog sadržaja

Vodeća kompanija u polju umjetne inteligencije, OpenAI, predstavila je nov model pod imenom Sora (što na japanskom znači nebo), za kojeg tvrdi da može stvarati 'realistične' i 'maštovite' videozapise od 60 sekundi iz kratkih tekstualnih upita.

U objavi na blogu u srijedu, tvrtka je rekla da je Sora sposobna generirati videozapise u trajanju do 60 sekundi iz tekstualnih upita, uz mogućnost posluživanja scena s više likova, specifičnim vrstama pokreta i detaljnim pozadinama.

'Model razumije ne samo što je korisnik tražio u upitu, već i kako te stvari postoje u fizičkom svijetu', stoji u objavi na blogu. OpenAI je rekao da namjerava uvježbati AI modele kako bi ljudima 'pomogao u rješavanju problema koji zahtijevaju interakciju u stvarnom svijetu'.

Ovo je najnoviji pokušaj tvrtke koja stoji iza viralnog chatbota ChatGPT, koji nastavlja gurati generativni pokret umjetne inteligencije naprijed. Iako 'multi-modalni modeli' nisu novi i modeli tekst-u-video već postoje, ono što ih izdvaja je duljina i točnost za koju OpenAI tvrdi da Sora ima, navodi Reece Hayden, viši analitičar u tvrtki za istraživanje tržišta ABI Research.

Hayden je rekao da bi ove vrste AI modela mogle imati veliki utjecaj na tržišta digitalne zabave s novim personaliziranim sadržajem koji se prenosi preko kanala. 'Jedan očiti slučaj upotrebe je unutar TV-a; stvaranje kratkih scena koje podržavaju naracije', rekao je Hayden. 'Model je još uvijek ograničen, ali pokazuje smjer u kojem se tržište kreće.'

U isto vrijeme, OpenAI je rekao da je Sora još uvijek ima jasne 'slabosti', osobito kada su u pitanju prostorni detalji upita - miješanje lijevog i desnog - te uzroka i posljedice. Dao je primjer stvaranja videozapisa na kojem netko grize kolačić, ali odmah nakon toga nema traga ugriza.

Za sada, poruke OpenAI-ja ostaju usmjerene na sigurnost. Tvrtka je rekla da planira surađivati s timom stručnjaka na testiranju najnovijeg modela i pomno promatrati različita područja uključujući dezinformacije, sadržaj pun mržnje i pristranost. Tvrtka je rekla da također gradi alate za pomoć u otkrivanju pogrešnih informacija.

Sora će najprije biti dostupna profesorima kibernetičke sigurnosti, takozvanim 'crvenim timovima' koji mogu procijeniti proizvod za štetu ili rizike. Također daje pristup brojnim vizualnim umjetnicima, dizajnerima i filmašima za prikupljanje povratnih informacija o tome kako bi ga kreativni profesionalci mogli koristiti.

Najnovije ažuriranje dolazi dok OpenAI nastavlja unapređivati ChatGPT.

Izvor: Društvene mreže / Autor: MKBHD

Ranije ovog tjedna, tvrtka je rekla da testira značajku u kojoj korisnici mogu kontrolirati memoriju ChatGPT-a, dopuštajući im da zatraže od platforme da zapamti chatove kako bi buduće razgovore učinili personaliziranijim.