Znanstvenici s Ruđera razvili novu metodu grupiranja podataka

Strojno učenje jedno je od danas najuzbudljivijih područja računarske znanosti zbog brojnih mogućnosti primjena od raspoznavanja uzoraka i dubinske analize podataka do robotike, računalnog vida, bioinformatike i računalne lingvistike sve do medicine.

Znanstvenici Laboratorija za reprezentacije znanja i strojno učenje Zavoda za elektroniku, Maria Brbić i dr. sc. Ivica Kopriva razvili su novu metodu za grupiranje podataka temeljenih na modelu linearnih potprostora kao generatora odgovarajućih funkcionalnih skupina.

Da je riječ o značajnim rezultatima potvrđuje i objava rada u jednom od najutjecajnijih znanstvenih časopisa u području računalnih znanosti i umjetne inteligencije 'IEEE Transactions on Cybernetics' koji se s obzirom na visoki faktor odjeka (8.803) svrstava na treće mjesto u ovom području.

Otkrivanje znanja iz velike količine podataka

Strojno učenje je grana umjetne inteligencije koja se bavi oblikovanjem algoritama za automatsku obradu podataka. Drugim riječima, to je proces otkrivanja znanja iz velike količine podataka pri čemu računarski sustavi sami automatski poboljšavaju svoje procese kroz iskustvo. Strojno učenje jest temelj današnje podatkovne znanosti, a dijeli se na nadzirano, nenadzirano i polunadzirano.

Rad hrvatskih znanstvenika objevljen je u jednom od najutjecajnijih znanstvenih časopisa u području računalnih znanosti i umjetne inteligencije 'IEEE Transactions on Cybernetics' Izvor: Licencirane fotografije / Autor: IRB

Jedan od temeljnih problema u računalnim znanostima unutar nenadziranog učenja jest grupiranje podataka. Naime, za razliku od nadziranog strojnog učenja gdje su podaci dani u obliku ulazne i ciljne vrijednosti, a stroj uči funkciju koja ulaznim podacima pridružuje klasnu ili realnu vrijednost ciljanih podataka, u procesu nenadziranog strojnog učenja od algoritama se očekuje da podatke grupiraju u funkcionalne skupine koristeći isključivo informacije naučene iz samih podataka (engl. data driven methods).

Otvoreni dani Instituta Ruđer Bošković Izvor: Promo fotografije / Autor: IRB

Pojednostavljeno, kod nenadziranog učenja nema učitelja, nema onoga koji pokazuje točno znanje, dani su podaci bez ciljne vrijednosti. U ovom slučaju cilj je grupirati primjere i otkriti neku strukturnu pravilnost u podacima, odnosno otkriti što podaci znače.

Od robotike, preko bioinformatike, do medicine

Neke od najčešćih primjena grupiranja podataka u medicini odnose se na segmentaciju slike, primjerice kod CT slike (skupine su organi), PET slike (skupine su tkiva), mikroskopske slike histopatoloških preparata (skupine su tkiva i/ili stanice), slike optičke koherentne tomografije oka (npr. skupine su slojevi unutar mrežnice).

nova znanstvena istraživanja

Ovo je sedam uzbudljivijih ekspedicija i misija koje će razotkriti najveće misterije Zemlje

Pogledaj galeriju

'Primjene koje smo ilustrirali u ovom novom radu odnose se na prepoznavanje lica odnosno grupiranje slika lica u skupine koje odgovaraju osobama, zatim prepoznavanje govornika, odnosno grupiranje značajki govora u skupine koje odgovaraju osobama, te prepoznavanje rukom pisanih brojeva, odnosno grupiranje slika u skupine koje odgovaraju znamenkama od 0 do 9', objašnjava dr. sc. Ivica Kopriva.

Ključno je učenje matrice

Razvijene metode grupiranja podataka kod navedenih primjera temelje se na modelu prema kojem su podaci unutar svake skupine generirani iz pripadajućeg linearnog potprostora.

Temeljem tog modela razvijeni su algoritmi koji daju vrlo kompetitivne rezultate na grupiranju zahtjevnih skupova podataka.

Dodjela stipendija Za zene u znanosti 2018.: Martina Požar, Maria Brbić, Antonela Blažeković, Andrea Bistrović Izvor: Pixsell / Autor: Davorin Visnjic/PIXSELL

'Ključan element u ovom pristupu je učenje matrice reprezentacije koja je rijetka i ima nizak rang. Umjesto konveksnih mjera ranga i rijetkosti koje se standardno koriste, u radu su predložene mjere koje bolje procjenjuju rang i rijetkost: (i) egzaktne mjere temeljene na L0 i Schatten-0 kvazi normama, te (ii) glatka surogat funkcija L0 i Schatten-0 kvazi normi', objašnjava Maria Brbić.

Uvođenjem ovih mjera odgovarajući optimizacijski problemi su postali nekonveksni, što dokaz konvergencije algoritma čini zahtjevnim. Unatoč ovim poteškoćama, u radu je dan teorijski dokaz globalne konvergencije navedenog optimizacijskog problema za učenje matrice reprezentacije.

'Novi algoritmi su značajno poboljšali točnost u usporedbi s postojećim metodama na svim testiranim primjenama', zaključuje Brbić. Razvijena metoda je rezultat istraživanja doktorandice Marije Brbić u okviru istraživačkog projekta Hrvatske zaklade za znanost voditelja dr.sc. Ivice Koprive.

Znanstvenici s Ruđera razvili novu metodu grupiranja podataka

Otkrivanje znanja iz velike količine podataka

Od robotike, preko bioinformatike, do medicine

Ovo je sedam uzbudljivijih ekspedicija i misija koje će razotkriti najveće misterije Zemlje

Ključno je učenje matrice

preporučujemo

Voyager 1 uspostavio vezu sa Zemljom nakon pet mjeseci 'šutnje', NASA oduševljena

Kombinacija Wikipedije i ChatGPT-a: O ovom AI startupu priča čitava industrija

Tražite posao u IT sektoru? Ove tvrtke zapošljavaju, pogledajte što nude

Venecija ovaj tjedan počinje naplaćivati ulaz u grad, evo koliko košta ulaznica

Turistkinja se spotaknula o suknju i pala u 75 metara dubok krater vulkana

Najbitnije od bitnog

Prijava na newsletter

Otkrivanje znanja iz velike količine podataka

Od robotike, preko bioinformatike, do medicine

Ovo je sedam uzbudljivijih ekspedicija i misija koje će razotkriti najveće misterije Zemlje

Ključno je učenje matrice

vezane vijesti

Jesu li to znanstvenici po prvi put svjedočili nastanku crne rupe?

Ugledni profesor s Columbusa upozorava: Tableti su dvosjekli mač

Naočale isprobao i Pentagon: Veliki uspjeh hrvatskog startupa Orqa u Las Vegasu

vezane vijesti

Hrvatski znanstvenici otkrili fascinantan genetski paradoks

Ruđerovci sudjelovali u otkrivanju ključne uloge virusa u ciklusu metana na Zemlji

Europski fuzijski znanstvenici postavili novi rekord, sudjelovao i naš IRB

preporučujemo

Voyager 1 uspostavio vezu sa Zemljom nakon pet mjeseci 'šutnje', NASA oduševljena

Kombinacija Wikipedije i ChatGPT-a: O ovom AI startupu priča čitava industrija

Tražite posao u IT sektoru? Ove tvrtke zapošljavaju, pogledajte što nude

Venecija ovaj tjedan počinje naplaćivati ulaz u grad, evo koliko košta ulaznica

Turistkinja se spotaknula o suknju i pala u 75 metara dubok krater vulkana

Pratite nas na društvenim mrežama

Najbitnije od bitnog

pročitaj još i ovo

Hrvatski znanstvenici otkrili fascinantan genetski paradoks

Objavljen prije 19 godina: Ovo je bio prvi video na YouTubeu

Imate Android? Ova opcija može produžiti trajanje baterije do 72 sata

Muku mučite s odabirom prave palete boja za fasadu? Ovi trikovi olakšat će proces

Voyager 1 uspostavio vezu sa Zemljom nakon pet mjeseci 'šutnje', NASA oduševljena

Kombinacija Wikipedije i ChatGPT-a: O ovom AI startupu priča čitava industrija

Puni 'halucinacija': Evo kako chatbotovi šire dezinformacije uoči europskih izbora

Ovaj kruh zaludio je svijet, a konačno ga možete pronaći i u najpoznatijoj pekari u Hrvatskoj

Analitičar Rimac: SDP-ova situacija kompleksna je iz tri razloga

Dok se svijet brine zbog Kate Middleton, još jedna europska princeza boluje od teške bolesti

Na najelegantnijem vjenčanju oduševila haljinom koja košta manje od 50 eura

Toksini iz starih mobitela ostaju u organizmu i do 11 godina poslije. Evo kako ih se riješiti

Kako je teška dijagnoza zauvijek promijenila odnos Kate i Williama

Stvarna pozadina sukoba u Mostu: Jesu li Raspudići zaljuljali temelje 'sekte iz doline Neretve'

Jesu li oni najljepši par? Supruga monegaškog princa ostavlja bez daha u senzacionalnoj haljini

Prijava na newsletter