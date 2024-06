Tehnološka web stranica The Shortcut također je optužila kompaniju za krađu njezinih članaka. Reuters je izvijestio da Perplexity nije jedina AI tvrtka koja zaobilazi datoteke robots.txt i skrapira web stranice kako bi dobila sadržaj koji se zatim koristi za obuku njihovih tehnologija.

TollBitovo pismo ne imenuje nijednu tvrtku, ali Business Insider navodi da je saznao kako OpenAI i Anthropic - kreatori chatbota ChatGPT, odnosno Claude - također zaobilaze signale robots.txt. Obje tvrtke prethodno su objavile da poštuju upute 'ne indeksiraj' koje web stranice stavljaju u svoje datoteke robots.txt.

Tijekom svoje istrage, Wired je otkrio da je stroj na Amazonovom poslužitelju 'kojim sigurno upravlja Perplexity' zaobilazio upute robots.txt njegove web stranice. Kako bi potvrdio je li Perplexity skrapirao svoj sadržaj, Wired je tvrtkinom alatu dao naslove iz svojih članaka ili kratke upite koji opisuju njegove priče. Alat je navodno došao do rezultata koji su usko parafrazirali njegove članke 's minimalnim pripisivanjem'. A ponekad je čak generirao netočne sažetke za svoje priče - Wired kaže da je chatbot lažno tvrdio da je izvijestio o određenom kalifornijskom policajcu koji je u jednom slučaju počinio zločin.

U intervjuu za Fast Company, izvršni direktor Perplexityja Aravind Srinivas rekao je publikaciji da njegova tvrtka 'ne ignorira Robot Exclusions Protocol i onda laže o tome.' Međutim, to ne znači da nema koristi od alata za indeksiranje koji ignoriraju protokol. Srinivas je objasnio da tvrtka osim vlastitih koristi alate za indeksiranje trećih strana i da je alat za indeksiranje kojeg je identificirao Wired jedan od njih. Kada je Fast Company pitao je li Perplexity rekao pružatelju alata za indeksiranje da prestane skrapirati Wiredovu web stranicu, on je samo odgovorio da je 'to komplicirano'.

Srinivas je branio praksu svoje tvrtke, rekavši publikaciji da Protokol o isključivanju robota 'nije pravni okvir' sugerirajući da bi izdavači i tvrtke poput njegove možda morali uspostaviti novu vrstu odnosa. Također je navodno insinuirao da je Wired namjerno koristio upite kako bi natjerao Perplexityjev chatbot da se ponaša onako kako se ponašao, tako da obični korisnici neće dobiti iste rezultate. Što se tiče netočnih sažetaka koje je alat generirao, Srinivas je rekao: 'Nikada nismo rekli da naš AI ne halucinira.'