
Image by Marco Verch, from Ccnull
AI Labirint: Cloudflareov novi alat zavarava AI pretraživače lažnim web stranicama
Cloudflare je objavio “AI Labyrinth”, alat dizajniran za borbu protiv web skrejpera vođenih AI-jem koji izvlače podatke s web stranica bez dozvole.
Žurite? Evo brzih činjenica:
- Alat generira realističan, ali beskoristan sadržaj stvoren od strane AI-ja kako bi se gubilo vrijeme skupljačima podataka.
- AI Labyrinth cilja na botove koji ignoriraju robots.txt, uključujući one iz Anthropica i Perplexity AI.
- Funkcionira kao honeypot nove generacije, detektirajući i identificirajući neovlaštene pretraživače.
Umjesto da izravno blokira ove botove, AI Labyrinth ih zavodi u beskrajni labirint stranica generiranih umjetnom inteligencijom, trošeći njihovo vrijeme i računalnu snagu.
“Kada detektiramo neovlašteno pretraživanje, umjesto blokiranja zahtjeva, povezat ćemo se na niz stranica generiranih umjetnom inteligencijom koje su dovoljno uvjerljive da privuku pretraživača da ih pregleda,” objasnila je Cloudflare u blog postu.
“No, iako izgleda stvarno, ovaj sadržaj zapravo nije sadržaj stranice koju štitimo, pa pretraživač troši vrijeme i resurse,” dodala je Cloudflare.
ArsTechnica napominje da su AI skrejperi problem jer skupljaju ogromne količine podataka s web stranica, često bez dozvole, kako bi trenirali AI modele. To stvara nekoliko problema: može narušiti prava intelektualnog vlasništva, zaobilazeći kontrole koje vlasnici web stranica koriste za regulaciju pristupa.
Osim toga, skrejping može dovesti do zloupotrebe osjetljivih ili vlasničkih podataka. Obujam skrejpinga dramatično se povećao, pri čemu Cloudflare izvještava o preko 50 milijardi zahtjeva za skrejperima dnevno.
Ova ekstrakcija podataka na velikoj skali iscrpljuje resurse web stranica, utječući na njihovu izvedbu i privatnost, dok istovremeno doprinosi rastućim zabrinutostima o iskorištavanju podataka u razvoju umjetne inteligencije.
Iako vlasnici web stranica tradicionalno oslanjaju na robots.txt datoteku kako bi botovima rekli što mogu i ne mogu pristupiti, mnoge tvrtke koje se bave umjetnom inteligencijom – uključujući velike igrače poput Anthropic i Perplexity AI – optužene su da ignoriraju ovakve direktive, kako je izvijestio The Verge.
Cloudflareov AI Labyrinth nudi agresivniji pristup u rješavanju ovih neželjenih botova. Alat funkcionira kao “sljedeća generacija honeypota”, privlačeći botove dublje u umjetnu mrežu sadržaja koji izgleda stvarno, ali je na kraju beskoristan za AI trening.
Za razliku od tradicionalnih honeypota, koje su botovi naučili prepoznati, AI Labyrinth kreira realistične, ali nevažne informacije koristeći Cloudflareovu Workers AI platformu.
“Nijedan stvarni čovjek ne bi išao četiri poveznice duboko u labirint gluposti generirane umjetnom inteligencijom,” napomenula je Cloudflare. “Svaki posjetitelj koji to čini vrlo je vjerojatno bot, pa nam to pruža potpuno nov alat za identifikaciju i otiskivanje loših botova.”
Sadržaj generiran umjetnom inteligencijom dizajniran je da bude znanstveno točan, ali nema veze s stvarnom web stranicom koja se štiti.
Ovo osigurava da alat ne doprinosi dezinformacijama, dok i dalje zbunjuje AI skidere. Zavaravajuće stranice su nevidljive ljudskim posjetiteljima i ne utječu na rangiranje pretraživača.
AI Labirint dostupan je kao besplatna opcija koju korisnici mogu odabrati za sve korisnike Cloudflarea. Administratori web stranica mogu ga aktivirati putem svoje Cloudflare nadzorne ploče u postavkama upravljanja botovima.
Tvrtka ovo opisuje kao tek početak protumjera vođenih umjetnom inteligencijom, s budućim planovima za stvaranje još obmanjujućih lažnih stranica.
Igra mačke i miša između web stranica i AI skrejpera se nastavlja, s Cloudflareom koji preuzima inovativan pristup zaštiti online sadržaja. No, ostaju pitanja o tome koliko brzo će se tvrtke koje se bave umjetnom inteligencijom prilagoditi ovim zamkama i može li ova strategija dovesti do eskalacije u borbi oko web podataka.
Ostavite komentar
Otkaži