U Redditu tvrde kako imaju dokaze da neke tvrtke iskorištavaju Wayback Machine kako bi zaobišle njegove politike i bez dopuštenja prikupljale korisnički sadržaj
Reddit je počeo blokirati Wayback Machine servisa Internet Archive u indeksiranju većine njegovih stranica, nakon što je otkriveno kako tvrtke koje se bave umjetnom inteligencijom prikupljaju podatke iz digitalne vremenske kapsule.
Ovaj potez dolazi u trenutku kada Reddit pooštrava kontrolu nad korisničkim podacima. Ne smeta ih što tvrtke koje se bave umjetnom inteligencijom obučavaju svoje modele na objavama na Redditu, ali prvo moraju platiti.
Prethodno su objavili kako neće ograničavati 'aktere koji djeluju u dobroj vjeri' poput Internet Archivea. Ali, sada vjeruju kako neki od njih pomažu tvrtkama koje se bave umjetnom inteligencijom u izbjegavanju plaćanja naknade za licenciranje.
Iznenadna promjena stava Reddita naglašava kako je licenciranje podataka postalo glavni izvor prihoda u eri umjetne inteligencije.
Internet Archive je neprofitna organizacija posvećena izgradnji ogromne digitalne biblioteke web stranica i drugog online sadržaja. Do sada je arhivirala milijarde web stranica, zajedno s milijunima knjiga, videozapisa i softverskih programa.
Njihov alat, Wayback Machine, omogućuje korisnicima spremanje snimaka web stranica i njihovo kasnije ponovno posjećivanje kako bi točno vidjeli kako su izgledale na određeni datum.
Pristup ograničen do daljnjeg
U Redditu tvrde kako imaju dokaze da neke tvrtke iskorištavaju Wayback Machine kako bi zaobišle njegove politike i bez dopuštenja prikupljale korisnički sadržaj Stoga su im ograničili pristup dok ne budu u mogućnosti 'obraniti svoju stranicu i pridržavati se politika platforme'.
Wayback Machine više neće moći indeksirati stranice s detaljima objava, komentare ili profile. Umjesto toga, bit će mu dopušteno samo indeksiranje početne stranice Reddita. O tome su unaprijed obavijestili Internet Archive.
Reddit je posljednjih godina pooštrio kontrolu nad pristupom svojim podacima. Iako je tvrtka otvorena za licenciranje svojih podataka, obračunava se s tvrtkama koje nisu platile. Tvrtka je već sklopila višemilijunske ugovore s Googleom i OpenAI-jem.
Nakon sklapanja ugovora s Googleom Reddit se uključio u indeksiranje pretraživanja i prikupljanje podataka o obuci umjetne inteligencije. Zatim je počeo blokirati druge tražilice u prikazivanju nedavnih objava s Reddita u svojim rezultatima pretraživanja.
U lipnju je Reddit tužio startup za umjetnu inteligenciju Anthropic, optužujući ga za krađu podataka, piše Gizmodo.