Le regole del digitale stanno cambiando.
O sei visibile o sei fuori. Noi ti aiutiamo a raggiungere i clienti giusti — quando ti stanno cercando.
Contattaci ora →Perplexity AI aggira i divieti dei siti web e si maschera da utente: una trappola svela i suoi metodi e riapre il dibattito sul rispetto del contenuto originale online
Cloudflare accusa Perplexity AI di aver ignorato i blocchi `robots.txt`, usando tecniche "stealth" e bot camuffati per accedere a siti protetti. Cloudflare ha teso una trappola per svelare l'inganno. Perplexity nega le accuse. L'incidente solleva dibattiti sull'etica dell'IA, la fiducia digitale e il rispetto per i contenuti originali sul web.
La trappola che ha svelato il gioco sporco
Cloudflare, uno di quei giganti che gestisce la sicurezza e le performance di una fetta enorme di internet, ha iniziato ad avere dei sospetti.
E cosa ha fatto?
Ha teso una trappola degna di un film. Hanno creato dei siti web civetta, nuovi di zecca, mai linkati da nessuna parte e protetti da ogni tipo di scansione automatica. L’ordine era chiaro: nessun bot può entrare.
E indovina un po’ chi si è presentato a curiosare?
Esatto.
Perplexity, come riportato dalla stessa Cloudflare, non solo ha trovato questi siti fantasma, ma ne ha letto e indicizzato il contenuto, dimostrando di aver aggirato le barriere in modo deliberato.
Il come è quasi più interessante del cosa: l’azienda usava un arsenale di trucchi, mascherando i suoi crawler da normali utenti che navigano con un browser Chrome, cambiando continuamente indirizzo IP per non farsi scoprire e usando diverse “identità ” di rete per confondere le acque.
In pratica, bussava alla porta con la sua faccia (il suo bot ufficiale “PerplexityBot”), e quando gli veniva detto di no, tornava indossando baffi finti e occhiali da sole.
Una mossa astuta, non c’è che dire.
Ma questa scoperta solleva una domanda ben più grande e scomoda: se un’azienda che si propone come il futuro della ricerca e dell’informazione agisce in questo modo, di chi possiamo fidarci davvero online?
La debole difesa di Perplexity e il tempismo di Cloudflare
Messa di fronte a prove così schiaccianti, la risposta di Perplexity è stata, a essere generosi, deludente. Un portavoce ha liquidato il tutto come una “trovata commerciale” di Cloudflare, sostenendo che le prove non dimostrassero nulla e che il bot identificato “non fosse nemmeno il loro”.
Una difesa che suona fragile, quasi un tentativo di arrampicarsi sugli specchi.
D’altro canto, è impossibile non notare il tempismo di Cloudflare. Proprio di recente, l’azienda ha lanciato nuovi strumenti, ovviamente a pagamento, pensati apposta per bloccare i crawler delle intelligenze artificiali.
Una coincidenza?
O una mossa di marketing perfettamente orchestrata, usando Perplexity come il “cattivo” ideale per dimostrare la necessità dei loro nuovi servizi?
Il dubbio è legittimo, perché quando due colossi si scontrano, raramente lo fanno solo per difendere un principio.
Questa vicenda, quindi, non è solo la storia di un bot che non rispetta le regole. È il sintomo di un problema molto più profondo, una crepa che si allarga nel patto non scritto su cui, fino a oggi, si è retto il web.
La fine del patto tra gentiluomini e il valore del tuo lavoro
Per anni, internet si è basato su una sorta di accordo informale: il file robots.txt
. Non è un muro invalicabile, ma un semplice file di testo in cui tu, proprietario di un sito, dici “per favore, qui non guardare”. È una richiesta di cortesia, un patto tra gentiluomini che i grandi player come Google hanno quasi sempre rispettato.
Le azioni di Perplexity, se confermate, fanno saltare questo banco. Dimostrano che il tuo contenuto, il frutto del tuo lavoro, delle tue analisi e della tua creatività , può essere prelevato senza permesso per addestrare un’intelligenza artificiale che, un giorno, potrebbe diventare la tua diretta concorrente, rispondendo alle domande dei tuoi potenziali clienti al posto tuo.
La questione, quindi, va ben oltre la singola startup o la mossa di Cloudflare.
Ci costringe a chiederci quale sia il vero valore del contenuto originale in un’era in cui le macchine possono “imparare” da esso in un istante, a volte senza neanche chiedere il permesso.
E questa, purtroppo, è una domanda a cui nessuno, oggi, ha una risposta chiara.