ALGORITMI

Pitali ste se kako Instagram pronalazi sadržaj koji vam je zanimljiv? Evo objašnjenja

27.11.2019 u 09:32

Bionic
Reading

U Instagramu su objavili više pojedinosti o tome kako njihova aplikacija koristi strojno učenje kako bi pronašla određeni sadržaj za korisnike

Iako nije podjednako na udaru kao YouTube, ipak su i Instagram zakačile kritike zbog neodgovarajuće reakcije na govor mržnje, širenje dezinformacija i drugog problematičnog sadržaja.

Objašnjavajući kako funkcionira njihova kartica Explore, koja služi za pronalaženje novog sadržaja, držali su se dalje od vrućih političkih tema.

fAKEBOOK

Čiji je otac bio član KKK, tko bi zabranio motore i kome su imigranti draži od ratnih veterana: Ovo je 10 najčitanijih lažnih vijesti na Facebooku

Pogledaj galeriju

Instagram je ogroman i pun raznovrsnog sadržaja, u rasponu od arapske kaligrafije do modela željeznice. Izazov je u tom obilju pronaći pravu preporuku za pojedinog korisnika, što u Instagramu rješavaju tako što se fokusiraju ne na objave koje bi korisnik htio vidjeti već na to kakav bi ga/ju sadržaj mogao zanimati.

Otkrivaju međusobno slične korisničke račune koristeći metodu strojnog učenja koja se oslanja na mapiranje riječi. Takav sustav proučava redoslijed u kojem se riječi pojavljuju u tekstu kako bi odredio u kakvom su međuodnosu. Primjerice, uočio bi kako se riječ vatra često pojavljuje uz riječi uzbuna i vozilo, ali rjeđe uz riječi pelikan ili sendvič.

Pitanje je koliko toga se obrađuje ručno

Najprije gleda korisničke račune s kojima su korisnici bili u interakciji u prošlosti, tako što su ih lajkali ili spremali sadržaje koje su objavili. Potom pronalazi slične korisničke račune i iz njih izvlači 500 dijelova sadržaja. Potom ih filtrira kako bi uklonio spam, dezinformacije i sadržaj u suprotnosti s pravilima korištenja Instagrama.

Preostale objave rangira temeljem procjene koliko je vjerojatno da će korisnik stupiti u interakciju s nekom od njih. Konačno, 25 najbolje rangiranih objava bivaju prikazane na prvoj stranici kartice Explore.

Instagram nije objavio kako njihov sustav prepoznaje dezinformacije ili spam, kao ni u kojoj mjeri koristi strojno učenje pri flitriranju nedoličnog sadržaja.

Recimo, u Instagramu su se obračunali sa sadržajem kojeg objavljuju protivnici cijepljenja, ali su se u tome oslonili uglavnom na ručni, vjerojatno ljudski rad. Automatski blokira hashtagove za koje je poznato kako nisu točni (poput #vaccinescauseaids), dok se oslanjaju na institucije poput Svjetske zdravstvene organizacije pri otkrivanju potencijalno opasnih objava kako bi ih uklonili, piše Verge.