O bibliotecă Python open-source numită Scrapling atrage atenția dezvoltatorilor de agenți AI care o folosesc pentru a ocoli sistemele anti-bot de nivel enterprise, escaladând un conflict de lungă durată între scraperele web și companiile care încearcă să le oprească.
Instrumentul a devenit viral săptămâna aceasta după ce utilizatorii OpenClaw, un framework popular open-source de agenți AI, au început să îl promoveze pe rețelele sociale ca o modalitate de a ocoli protecțiile. „Fără detectare de roboți. Fără mentenanță de selectori. Fără coșmaruri Cloudflare”, se arăta într-o postare distribuită pe scară largă pe X, care descria cum OpenClaw poate direcționa Scrapling să extragă date în timp ce instrumentul „se ocupă de discreție”. Pe subreddit-ul OpenClaw, utilizatorii au lăudat viteza Scrapling și capacitatea sa de a se adapta automat atunci când site-urile web își reproiectează paginile.
Cloudflare ripostează
Cloudflare lucrează activ pentru a contracara amenințarea. Într-un raport WIRED, CTO-ul Dane Knecht a declarat că compania „a detectat deja o creștere a capacității lor de a ocoli apărările noastre” și că echipa de operațiuni de securitate „lucrează cu diligență la noi contramăsuri”. Knecht a caracterizat dinamica ca fiind un ciclu continuu: „Ne adaptăm, iar apoi ei se adaptează.”

Cloudflare a blocat anterior versiuni mai vechi ale Scrapling și acum dezvoltă un patch pentru cea mai recentă versiune, conform WIRED. Compania s-a poziționat drept principalul portar al internetului împotriva scraping-ului condus de AI, dezvăluind în decembrie că a blocat 416 miliarde de cereri de la boți AI începând cu 1 iulie 2025.
O cursă a înarmării fără o soluție ușoară
Creat de dezvoltatorul Karim Shoair sub pseudonimul D4Vinci, Scrapling se prezintă ca fiind o „bibliotecă de web scraping indetectabilă, performantă și inteligentă”. Funcția sa StealthyFetcher folosește o versiune modificată a Firefox cu falsificarea amprentei digitale pentru a eluda automat sistemul Turnstile al Cloudflare. Biblioteca a acumulat peste 8.000 de stele pe GitHub și mai mult de 200.000 de descărcări, potrivit WIRED. Licențiată sub BSD-3, natura open-source a instrumentului îl face aproape imposibil de închis prin canale legale.
Dezvoltarea acestui instrument vine pe fondul unor tensiuni mai ample legate de colectarea de date pentru AI. Interactive Advertising Bureau a publicat în februarie un proiect de legislație prin care solicită companiilor de AI să compenseze editorii pentru conținutul extras prin scraping, avertizând că scraping-ul necontrolat ar putea lăsa „puțini editori susținuți de publicitate, de orice fel, în doar câțiva ani”. Google este implicată într-un proces federal cu SerpApi, o companie specializată în extragerea de date, pentru presupusa eludare a barierelor sale anti-scraping, iar autori au dat în judecată OpenAI, Google și Meta pentru utilizarea de cărți piratate în antrenarea sistemelor AI.
Pagina GitHub a Scrapling include o declarație de declinare a responsabilității care menționează că instrumentul este furnizat „exclusiv în scopuri educaționale și de cercetare” și că utilizatorii ar trebui să „respecte legislația locală și internațională privind extragerea de date și confidențialitatea”. Dacă această declarație are vreo greutate într-un peisaj în care agenții AI operează acum în mod autonom rămâne o întrebare deschisă.
Surse:
https://www.wired.com/story/big-interview-event-matthew-prince-cloudflare/
