NOVA GENERACIJA

Google lansirao Gemini, svoj najnapredniji AI model: Pogledajte što sve može

07.12.2023 u 10:09

Bionic
Reading

Najjasnija prednost novog velikog jezičnog modela dolazi iz njegove sposobnosti razumijevanja i interakcije s videom i zvukom. Ali, s time stižu i dosad nepoznati rizici

Gemini, novi Googleov veliki jezični model, početak je nove ere umjetne inteligencije u toj tvrtki, ako pitate njenog glavnog izvršnog direktora Sundara Pichaija. Najavljen tijekom konferencije za razvojne programere I/O u lipnju ove godine, sad je napokon i predstavljen javnosti.

Prema opisu izvršnog direktora Google DeepMinda Demisa Hassabisa, Gemini je veliki korak naprijed koji će utjecati na praktički sve Googleove proizvode.

Nije samo jedan, već tri

Osnovna verzija Gemini Nano namijenjena je uređajima s operativnim sustavom Android, na kojima će raditi i kad nisu povezani s mrežom.

Jača inačica Gemini Pro bi uskoro trebala pokretati mnoge Googleove usluge temeljene na umjetnoj inteligenciji i od danas je okosnica robota za brbljanje Bard.

Gemini Ultra je najmoćnije izdanje dosad. Čini se kako je uglavnom namijenjen podatkovnim centrima i poslovnim aplikacijama.

Ta tri modela bit će dostupna postupno na raznim razinama. Kao što je već spomenuto, Barda već sad pokreće Gemini Pro.

Korisnici pametnog telefona Pixel 8 Pro dobit će nekoliko novih značajki zahvaljujući Gemini Nano, dok bi Gemini Ultra trebao biti implementiran tijekom 2024. godine.

Programeri i poslovni korisnici moći će pristupiti Geminiju Pro putem Google Generative AI Studija ili Vertex AI u Google Cloudu počevši od 13. prosinca.

Od početka jedinstveni multisenzorni model

Gemini je za sada dostupan samo na engleskom, no uskoro će uskoro biti i na drugim jezicima. Bit će integriran Googleovu tražilicu, njegove reklamne proizvode, web preglednik Chrome...

Ujedno će biti glavni adut u okršaju s OpenAI-jevim ChatGPT-jem, čija je premijera prije nešto više od godinu dana Google zatekla nespremnim.

Može li se Gemini nositi s njim i drugom konkurencijom?

U Googleu su uvjereni kako je njihov veliki jezični model napredniji u ogromnoj većini mjerila pomoću kojih se procjenjuje stupanj razvoja umjetne inteligencije.

Najjasnija prednost dolazi iz njegove sposobnosti razumijevanja i interakcije s videom i zvukom. To je u velikoj mjeri dizajnirano.

Google nije istrenirao zasebne modele za slike i glas, kao što je OpenAI stvorio DALL-E i Whisper; od početka je izgradio jedinstveni multisenzorni model.

Trenutno osnovni modeli rade s tekstom, ali Gemini Ultra može raditi i sa slikama, video te zvukom, a trebao bi moći zahvatiti i šire od toga, kako bi uključio akciju i dodir. S vremenom bi Gemini trebao dobiti više osjetila, postati svjesniji i precizniji.

Ovi modeli i dalje 'haluciniraju', imaju predrasude i druge probleme koji muče generativnu umjetnu inteligenciju. Ali, u Googleu su uvjereni kako će postajati bolji što više znaju.

Početak velike promjene

Pravi test bit će svakodnevno korištenje za traženje ideja i informacija, pisanje računalnog koda i još puno toga. Čini se da Google vidi kodiranje posebno kao ubojit oblik primjene za Gemini.

Koristi novi sustav za generiranje koda nazvan AlphaCode 2, za koji tvrde kako radi bolje od 85 posto sudionika natjecanja u kodiranju, u odnosu na 50 posto za izvorni AlphaCode.

No, poboljšanja bi se trebala osjetiti u svemu u što će biti ugrađen.

Gemini je također, naizgled, daleko učinkovitiji model. Uvježban je na Googleovim vlastitim jedinicama za obradu tenzora, pa je brži je i jeftiniji za pokretanje od Googleovih prethodnih modela poput PaLM-a.

Google je također predstavio i novu verziju svog sustava TPU - TPU v5p - računalnog sustava dizajniranog za korištenje u podatkovnim centrima za obuku i pokretanje velikih modela.

Pichai i Hassabis, piše Verge, pokretanje Geminija vide kao početak većeg projekta i korak promjene u sebi.

Ipak, i dalje ne žele žuriti samo kako bi držali korak s drugima, pogotovo dok se približavamo krajnjem snu umjetne inteligencije: umjetnoj općoj inteligenciji, koja se samopoboljšava, pametnija je od ljudi i spreman promijeniti svijet.

Toj aktivnoj vrsti tehnologije treba pristupiti oprezno, ali optimistično, uvjereni su, zbog čega su uveli brojne mjere sigurnosti, pouzdanosti i zaštite.

Jedan od najozbiljnijih problema je to što će se pojaviti problemi i vektori napada koje nitko ne može predvidjeti. Zbog toga će najnapredniji modeli biti implementirani postupno, kako bi imali prilike vidjeti o čemu se radi i naučiti što je potrebno.

Tportal je i na WhatsAppu

Želite dobivati najvažnije vijesti dana na WhatsApp: Zapratite tportalov kanal ovdje i kliknite 'Prati'.