Kakvo zaobilažnje: AI kompanije nastavljaju kopati po internetu unatoč zabranama

Kakvo zaobilaženje: AI kompanije nastavljaju kopati po internetu unatoč zabranama

Velik broj AI tvrtki zaobilazi upute u datoteci robots.txt, zaobilazeći zabrane koje su tamo upisane. Internetskim stranicama pristupaju kako bi njihov sadržaj koristili za treniranje LLM-ova

Perplexity, tvrtka koja svoj proizvod opisuje kao 'besplatnu tražilicu s umjetnom inteligencijom', na meti je sve većeg broja kritika. Ubrzo nakon što ga je Forbes optužio da je ukrao njegovu priču i ponovno je objavio na više platformi, Wired je izvijestio da je Perplexity ignorirao Robots Exclusion Protocol ili robots.txt te da je skrapirao (prikupio podatke za treniranje LLM-a) njihovu web stranicu i druge Condé Nast publikacije.

Tehnološka web stranica The Shortcut također je optužila kompaniju za krađu njezinih članaka. Reuters je izvijestio da Perplexity nije jedina AI tvrtka koja zaobilazi datoteke robots.txt i skrapira web stranice kako bi dobila sadržaj koji se zatim koristi za obuku njihovih tehnologija.

Reuters izvještava o pismu upućenom izdavačima iz TollBita, startupa koji ih spaja s AI tvrtkama kako bi mogli postići ugovore o licenciranju, upozoravajući ih da 'AI agenti iz više izvora (ne samo jedne tvrtke) odlučuju zaobići robots.txt protokol za dohvaćanje sadržaja s web-mjesta'.

Datoteka robots.txt sadrži upute za web pretraživače o tome kojim stranicama mogu, a kojim ne mogu pristupiti. Web programeri koriste protokol od 1994. godine, ali usklađenost je u cijelosti dobrovoljna, objašnjava Engadget.

TollBitovo pismo ne imenuje nijednu tvrtku, ali Business Insider navodi da je saznao kako OpenAI i Anthropic - kreatori chatbota ChatGPT, odnosno Claude - također zaobilaze signale robots.txt. Obje tvrtke prethodno su objavile da poštuju upute 'ne indeksiraj' koje web stranice stavljaju u svoje datoteke robots.txt.

Tijekom svoje istrage, Wired je otkrio da je stroj na Amazonovom poslužitelju 'kojim sigurno upravlja Perplexity' zaobilazio upute robots.txt njegove web stranice. Kako bi potvrdio je li Perplexity skrapirao svoj sadržaj, Wired je tvrtkinom alatu dao naslove iz svojih članaka ili kratke upite koji opisuju njegove priče. Alat je navodno došao do rezultata koji su usko parafrazirali njegove članke 's minimalnim pripisivanjem'. A ponekad je čak generirao netočne sažetke za svoje priče - Wired kaže da je chatbot lažno tvrdio da je izvijestio o određenom kalifornijskom policajcu koji je u jednom slučaju počinio zločin.

U intervjuu za Fast Company, izvršni direktor Perplexityja Aravind Srinivas rekao je publikaciji da njegova tvrtka 'ne ignorira Robot Exclusions Protocol i onda laže o tome.' Međutim, to ne znači da nema koristi od alata za indeksiranje koji ignoriraju protokol. Srinivas je objasnio da tvrtka osim vlastitih koristi alate za indeksiranje trećih strana i da je alat za indeksiranje kojeg je identificirao Wired jedan od njih. Kada je Fast Company pitao je li Perplexity rekao pružatelju alata za indeksiranje da prestane skrapirati Wiredovu web stranicu, on je samo odgovorio da je 'to komplicirano'.

Srinivas je branio praksu svoje tvrtke, rekavši publikaciji da Protokol o isključivanju robota 'nije pravni okvir' sugerirajući da bi izdavači i tvrtke poput njegove možda morali uspostaviti novu vrstu odnosa. Također je navodno insinuirao da je Wired namjerno koristio upite kako bi natjerao Perplexityjev chatbot da se ponaša onako kako se ponašao, tako da obični korisnici neće dobiti iste rezultate. Što se tiče netočnih sažetaka koje je alat generirao, Srinivas je rekao: 'Nikada nismo rekli da naš AI ne halucinira.'

Kakvo zaobilaženje: AI kompanije nastavljaju kopati po internetu unatoč zabranama

preporučujemo

AI kao partner: Što je to AI psihoza i gdje je granica između stvarnog i virtualnog

Prve Svjetske igre humanoidnih robota u Pekingu: Pogledajte taj kaos

Astronomi otkrili novu vrstu supernove

Kraj mučninama u vožnji: Jeste li znali za ove korisne opcije na iPhoneu

Baltik se sprema na najgore? Djeca u Litvi učit će izrađivati dronove od osme godine

Najbitnije od bitnog

Porezni trikovi SpaceX-a: Je li kompanija desetljećima bila izvan zakona?

YouTube želi prenositi dodjelu Oscara - evo zašto je to dobra ideja

Korisnici se sprdaju s GPT-jem 5, a Altman najavljuje - još više troškova

najpopularnije

Šokantna istina o 25 godina burnog braka Catherine Zeta-Jones i Michaela Douglasa

Evo koliko je Hrgović zaradio pobjedom protiv Adeleyea

Ovo su najljepše cipele za sezonu pred nama; nema što ne ide uz njih

Ovo su horoskopski znakovi koji najviše lažu

Dinamo slavio na Rujevici golovima Belje; Rijeka ima za čime žaliti

Gledamo ga kao Đihana u seriji 'Daleki grad': 'Očinstvo je promijenilo moj pogled na svijet'

Prijava na newsletter

vezane vijesti

Rimčeva tvrtka za robotaksije Project 3 mobility promijenila ime

Umjetna inteligencija i na Olimpijskim igrama: Evo kako će štititi sportaše

Umjetna inteligencija 'halucinira', istraživači pronašli način kako to detektirati

vezane vijesti

Korisnici se sprdaju s GPT-jem 5, a Altman najavljuje - još više troškova

DeepSeek odgodio objavu novog modela umjetne inteligencije

Hrvatski Telekom predstavlja svestrane uređaje T Phone 3 i T Tablet 2

preporučujemo

AI kao partner: Što je to AI psihoza i gdje je granica između stvarnog i virtualnog

Prve Svjetske igre humanoidnih robota u Pekingu: Pogledajte taj kaos

Astronomi otkrili novu vrstu supernove

Kraj mučninama u vožnji: Jeste li znali za ove korisne opcije na iPhoneu

Baltik se sprema na najgore? Djeca u Litvi učit će izrađivati dronove od osme godine

Pratite nas na društvenim mrežama

Najbitnije od bitnog

pročitaj još i ovo

Korisnici se sprdaju s GPT-jem 5, a Altman najavljuje - još više troškova

Veliko otkriće: Znanstvenici su uspjeli rekreirati prve molekule u svemiru

Porezni trikovi SpaceX-a: Je li kompanija desetljećima bila izvan zakona?

Pet skrivenih čuda koja još niste vidjeli, a nalaze se u blizini Zagreba

Živimo u doba Bitcoina, ali koje još kriptovalute poznaju Hrvati?

AI kao partner: Što je to AI psihoza i gdje je granica između stvarnog i virtualnog

YouTube želi prenositi dodjelu Oscara - evo zašto je to dobra ideja

Čisti, briše, pere, suši… Testirali smo Eufy Omni E28 - robot koji radi sve umjesto vas

Rebić nije dao vodu Agbekpornuu; pogledajte što je onda napravio trener Hajduka

Spektakularna haljina prve dame Bosne i Hercegovine sve je zasjenila na crvenom tepihu

Zaboravite na štikle i balerinke: Ove tenisice su tako dobre da se nose i u ured

Osvojite ljetni ceker prepun pažljivo odabranih proizvoda za dugo, toplo ljeto. Evo kako

Zelenski uoči ključnog sastanka u Washingtonu: Trump ima snagu da nagovori Putina na mir

Livaja je preskočio reklame i krenuo prema Torcidi; pogledajte kako su uslijedili kaos i sramotne scene

Šokantna istina o 25 godina burnog braka Catherine Zeta-Jones i Michaela Douglasa

Porezni trikovi SpaceX-a: Je li kompanija desetljećima bila izvan zakona?

YouTube želi prenositi dodjelu Oscara - evo zašto je to dobra ideja

Korisnici se sprdaju s GPT-jem 5, a Altman najavljuje - još više troškova

najpopularnije

Šokantna istina o 25 godina burnog braka Catherine Zeta-Jones i Michaela Douglasa

Evo koliko je Hrgović zaradio pobjedom protiv Adeleyea

Ovo su najljepše cipele za sezonu pred nama; nema što ne ide uz njih

Ovo su horoskopski znakovi koji najviše lažu

Dinamo slavio na Rujevici golovima Belje; Rijeka ima za čime žaliti

Gledamo ga kao Đihana u seriji 'Daleki grad': 'Očinstvo je promijenilo moj pogled na svijet'

Prijava na newsletter