POVIJESNO POSTIGNUĆE

Microsoftovo prepoznavanje govora sada je u rangu ljudskog!

24.10.2016 u 06:50

Bionic
Reading

Prije svega mjesec dana, Microsoft je objavio kako su uspješno postavili novi industrijski standard po kvaliteti prepoznavanja govora, uz WER (Word Error Rate) od svega 6,3 posto. Stvar je u svega mjesec dana drastično uznapredovala te je ostvaren WER od samo 5,9 posto, što je u praksi jednako ljudskom prepoznavanju govora

Stvaranje tehnologije koja može prepoznavati riječi jednako dobro kao ljudi nevjerojatan je podvig, a premda je Microsoft postavio najviše standarde još prošli mjesec, stvari su sada drastično uznapredovale. Prije 20 godina, najbolji sustavi su imali WER od 43 posto ili gori, no moderne tehnologije i algoritmi omogućili su fenomenalne korake naprijed.

Vodeći istraživač Microsofta na polju prepoznavanja govora, Xuedong Huang, izjavio je kako je riječ o povijesnom postignuću. 'Sustav u prepoznavanju govora sad parira ljudima', dodao je Huang. Prvi put u povijesti, računalo može prepoznavati riječi u razgovoru jednako dobro kao osoba. Istraživački tim je postavljeni cilj ostvario u manje od godinu dana, no stvar je otišla dalje i bolje nego su uopće mislili da mogu u tako kratkom roku.

'Prije svega pet godina ne bih vjerovao da možemo postići ovakvo što. Jednostavno ne bih mislio da je to moguće', rekao je Harry Shum, izvršni potpredsjednik koji vodi odjel Microsoft Artificial Intelligence and Research.


Microsoftovi sustavi, a posebno asistent Cortana, zahvaljujući ovom podvigu postat će bolji nego ikad - i osigurati stvaranje osnova za istinski AI, navode iz Redmonda. Jasno, mjesta za poboljšanje u prepoznavanju govora još uvijek ima. To posebno vrijedi stoga što ni ljudi nisu u stanju bez greške prepoznavati svaku izrečenu riječ sugovornika.

I dok je posrijedi fenomenalno postignuće, istraživači IT diva iz Redmonda podsjećaju da je ovo tek početak priče. Prepoznavanje riječi je jedno, a istinsko razumijevanje nešto posve drugo. Upravo potonje je potrebno kako bi se izašlo iz svijeta gdje korisnici moraju razumijeti računala u svijet u kojem računala razumiju ljude, napomenuo je Shum.