Škoda Karoq
Mga Kategorya: balita sa IT

Kinokolekta ng mga kumpanya ng AI ang data mula sa mga site ng mass media na salungat sa mga direktang pagbabawal

Ang perplexity, na naglalarawan sa produkto nito bilang isang "libreng search engine na may artipisyal na katalinuhan," ay sinisiraan nitong mga nakaraang araw. Di-nagtagal pagkatapos inakusahan ito ng Forbes ng pagnanakaw ng artikulo nito at muling pag-publish nito sa maraming platform, iniulat ni Wired na binabalewala ng Perplexity ang Robot Exclusion Protocol, o robots.txt, at inaalis ang mga artikulo nito sa site nito at iba pang publikasyon ng Condé Nast. Inakusahan din ng Tech site na The Shortcut ang kumpanya ng AI sa pag-alis ng mga artikulo nito. Ngayon ay isiniwalat ng Reuters na ang Perplexity ay hindi lamang ang kumpanya ng AI na lumalampas sa mga file ng robots.txt at nag-scrape ng mga website para sa nilalaman na ginagamit nito upang sanayin ang teknolohiya nito.

Iniulat ng Reuters na nakakita ito ng isang liham na naka-address sa mga publisher mula sa TollBit, isang startup na nag-uugnay sa kanila sa mga kumpanya ng AI upang makapasok sila sa mga kasunduan sa paglilisensya, na nagbabala sa kanila na "ang mga ahente ng AI mula sa iba't ibang mga mapagkukunan (hindi lamang mula sa isang kumpanya) ay nagpasya na i-bypass ang robots.txt protocol upang makatanggap ng nilalaman mula sa mga site." Ang robots.txt file ay naglalaman ng mga tagubilin para sa mga robot sa paghahanap kung aling mga pahina ang maaari at hindi nila ma-access. Ginagamit ng mga web developer ang protocol na ito mula noong 1994, ngunit ang pagsunod dito ay ganap na boluntaryo.

Walang pinangalanang kumpanya sa liham ng TollBit, ngunit sinabi ng Business Insider na nalaman nito na ang OpenAI at Anthropic -- ang mga gumagawa ng chatbots na ChatGPT at Claude, ayon sa pagkakabanggit -- ay nilalampasan din ang mga signal ng robots.txt. Nauna nang sinabi ng parehong kumpanya na iginagalang nila ang mga tagubiling "huwag gumapang" na inilalagay ng mga website sa kanilang mga robots.txt file.

Sa panahon ng pagsisiyasat nito, nalaman ni Wired na ang isang makina sa isang server ng Amazon na "tiyak na pinapatakbo ng Perplexity" ay lumalampas sa mga tagubilin sa robots.txt ng website nito. Upang kumpirmahin na nililinis ng Perplexity ang nilalaman nito, ipinakain ni Wired ang mga headline ng tool ng kumpanya mula sa mga artikulo nito, o mga maikling tip na naglalarawan sa kanilang mga kuwento. Ang tool ay naiulat na gumawa ng mga resulta na tumpak na nag-paraphrase sa kanyang mga artikulo "na may kaunting attribution." At kung minsan ay lumikha pa ito ng mga hindi tumpak na buod para sa mga artikulo – sinabi ni Wired na ang chatbot ay maling nag-claim na nag-uulat sa isang partikular na opisyal ng pulisya ng California na nakagawa ng krimen sa isang kaso.

Sa isang pakikipanayam sa Fast Company, sinabi ng CEO ng Perplexity na si Aravind Srinivas sa publikasyon na ang kanyang kumpanya ay "hindi binabalewala ang Robot Exclusion Protocol at pagkatapos ay nagsisinungaling tungkol dito." Gayunpaman, hindi ito nangangahulugan na hindi ito nakikinabang sa mga bot na binabalewala ang protocol. Ipinaliwanag ni Srinivas na ang kumpanya ay gumagamit ng mga third-party na bot sa paghahanap bilang karagdagan sa sarili nito, at ang bot na tinukoy ng Wired ay isa sa mga ito. Nang tanungin ng Fast Company kung sinabi ng Perplexity sa provider ng crawler na ihinto ang pag-crawl sa Wired site, sinabi niya, "Ito ay kumplikado."

Ipinagtanggol ni Srinivas ang mga kagawian ng kanyang kumpanya, na sinabi sa publikasyon na ang bot exclusion protocol "ay hindi isang legal na batayan" at nagmumungkahi na ang mga publisher at kumpanyang tulad niya ay maaaring magkaroon ng bagong uri ng relasyon. Ipinahiwatig din niya na sinadya ni Wired ang paggamit ng mga pahiwatig para maging ganoon ang pagkilos ng Perplexity chatbot, para hindi makakuha ng parehong mga resulta ang mga regular na user. Tungkol sa hindi tumpak na mga natuklasan na nabuo ng tool, sinabi ni Srinivas: "Hindi namin sinabi na ang Perplexity chatbot ay hindi tumpak: 'Hindi namin sinabi na hindi kami kailanman nagkaroon ng mga guni-guni.'

Basahin din:

magbahagi
Julia Alexandrova

Kape. Photographer. Nagsusulat ako tungkol sa agham at espasyo. Masyado pang maaga para magkita kami ng mga alien. Sinusundan ko ang pagbuo ng robotics, kung sakali ...

Mag-iwan ng Sagot

Ang iyong email address ay hindi nai-publish. Mga kinakailangang patlang ay minarkahan*