Wow, un picco di traffico sul mio account analytics, Evviva!
Peccato che controllando le sorgenti di traffico, ci accorgiamo che si tratta di spam bot e non di visite da parte di utenti veri. Esistono infatti diversi siti web che per vari motivi visitano il tuo sito (a mezzo software) con la sgradevole conseguenza di falsarti le metriche referral. Questa pratica sembra andare avanti da alcuni mesi ed ho letto in giro diversi articoli che parlano ad esempio di come eliminare il problema delle visite provenienti da Semalt.
Gli spam bot sono solo una parte del problema. Consulta la nostra guida completa allo spam. Salvati ora che ancora puoi!
Come risolvere il problema
Jader Gardner (che non è un mio parente) ha scritto su Moz un articolo in cui spiega come risolvere definitivamente il problema delle visite provenienti da referral non umani, ma automatici. I passaggi sono 2 e sono molto semplici.
1) Bloccare l’accesso al sito web tramite il file .htaccess. La sintassi per fermare questo genere di visite è la seguente:
# Block Russian Referrer Spam RewriteEngine on RewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly.\.ru/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly\.org/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly\.info/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*iloveitaly\.ru/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*econom\.co/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*savetubevideo\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*kambasoft\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*buttons\-for\-website\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*semalt\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*darodar\.com/ [NC] RewriteRule ^(.*)$ – [F,L]
2) Filtrare gli indirizzi sospetti tramite Google Analytics
Si tratta di accedere all’amministrazione del proprio account Analytics e selezionare la vista del sito web sul quale intervenire. Tra le varie opzioni a disposizione sotto la vista, c’è quella di creare un nuovo filtro che potrai settare per bloccare tutte le visite provenienti da un singolo paese o tutte quelle provenienti da un singolo sito web. È abbastanza semplice, basta creare un filtro di tipo custom, come nelle immagini che riporto qui sotto:
Ma perché si verifica questo fenomeno?
Se è vero che in questo periodo diversi blogger stanno producendo articoli in cui mostrano le contromisure da mettere in campo per “pulire” il proprio sito web da questo genere di visite, devo dire che ancora in pochi si sono domandati il motivo di questo strano fenomeno. Insomma, abbiamo capito come avviene e come liberarcene, ma perché succede?
Innanzitutto facciamo un distinguo tra bot come quelli di Semalt, facenti capo a progetti di web monitoring e bot del tutto anonimi, che producono visite da siti web che non esistono come social-buttons.com.
Posso ipotizzare (attenzione, sto solo ipotizzando) che ci sia di mezzo un nuovo tipo di SEO negativa che colpisce solo chi non riceve visite da questi bot.
Mi spiego: Google potrebbe leggere le visite come un’attestazione della qualità del sito. Se nella stessa serp tutti i siti web ricevono tante visite tranne uno, evidentemente quell’unico sito non merita di essere su quella serp. Sotto questo aspetto i bot potrebbero portare traffico a tutti i siti tranne a quello che si intende far retrocedere. Un’autentica malignità!
Dimmi la verità, ci avevi pensato anche tu o sono l’unico psicopatico in circolazione?
Spunti interessanti. Mi viene da pensare, però, che se Google considerasse davvero come fattore di ranking le visite provenienti dai bot abbia anche trovato un modo per distinguere quelli innocui da quelli “negative” e potenzialmente malevoli. Possibile?
Certo Alessia, Google dovrebbe assolutamente essere in grado di riconoscere questo tipo di visite. Qualora non ci riuscisse sempre, è solo questione di tempo.
🙂
Sinceramente credo che sia un modo troppo strano per fare negative Seo. È vero che penalizzi un dominio, ma ne favorisci altri nove…
In realtà non favorirebbe anche gli altri, perché il vantaggio sarebbe uguale per tutti, quindi utile per nessuno.
Ma chiaramente qui si fanno supposizioni.
Ciao Francesco, ma potrebbe essere anche una azione di seo negativa che influisce sulla frequenza di rimbalzo?? Se fra i parametri con cui Google giudica un sito c’è la frequenza di rimbalzo, potrebbe essere un’azione volta ad aumentarne la media ? Se noti la frequenza di rimbalzo di questi referral è del 100% con media di visita 00:00:00..
Certo Gabriele, hai ragione. La cosa potrebbe essere letta al contrario. Nella stessa serp, l’unico sito che non riceve quelle visite potrebbe essere quello da spingere, non quello da far retrocedere.
Bravo Francè ! Lo dicevo io che fai finta di non sapere queste cose 😀
a proposito invece del testo scritto, semalt rompe proprio le scatole
E’ un pensiero malefico, molto malefico. Però in effetti stai ragionando su seo negativa e tutto diventa attuabile. Io per natura non do niente per scontato ed è sicuramente una possibilità 🙂
Ho trovato anche nei miei risultati questi fastidiosi spam bot.
La prima cosa che ho fatto è stato inibire l’accesso tramite file htaccess (credo sia la cosa migliore rispetto a filtrare i dati da analytics).
Sospetto però che queste visite siano in qualche modo legate all’utilizzo di alcuni plugin per CMS per la condivisione sui social network degli articoli, attraverso i classici pulsantini prima o dopo il corpo dell’articolo… ripeto, sospetto.
Gran bell’articolo, mi serviva proprio avere più di una conferma su questi bot che falsano le statistiche.
Bell’articolo sui bot spamers… molto utile per capire di più come funzionano queste cose… ma c’è un altro modo di applicare un altro filtro personalizzato che non sia per paese? Per esempio, applicare un filtro per “Sorgente Campagna” come quello suggerito in questo link: http://www.emprsitiweb.com/eliminare-referral-spam-statistiche-google-analytics/, e poi, impostando come pattern le URL dei siti spam? Penso che applicare un filtro come quello del paese è molto drastico, no? PS: ho indicato “Sorgente Campagna” perché questo lo suggeriva un’altra fonte online che, purtroppo, adesso non riesco a ricordare.
CIao Trovo la tua guida molto interessante.
Mi sapresti dire come mai utilizzando il tuo codice cmq mi ritrovo gli accessi di questi referrer??
Ho un dubbio, avendo due siti, nel secondo inserisco l’url del primo sito nel blocco in htaccess, se a ora inserisco un link nel primo sito che punta al secondo cliccandoci mi dovrebbe bloccare o no??
GRazie
ciaooo
Ciao Frank,
perdonami, ma non credo di aver capito le tue domande. 🙂
Beh ma io penso che google sappia capire benissimo quali siano gli spam-bot. Anche perchè quasi il 90% di questi spam hanno una frequenza di rimbalzo del 100% e se ci sono servizi che li sanno individuare penso che google li conosca…o almeno lo spero….
Salve a tutti,
bell’articolo nell’evidenziare questi fastidiosi spam bot..
Ma non riesco a capire in quale sezione del mio sito si acceda al file htaccess
mi potete aiutare?? Grazie :))
Ciao Domenico,
il file .htaccess si trova nella directory che contiene il tuo sito web.
Per accedervi, dovresti usare un client FTP.
Ottimi spunti, ma non credo si possa cmq risolvere al 100% maledetti spambot 😀
Certo che si può risolvere: basta aggiornare costantemente le regole ed i filtri. 😉
Articolo Interessante, interessante anche come a distanza di 4 anni dall’articolo continuo a verificare discrepanze di dati in alcuni siti, mi domando come mai google non sia tempestivo nel determinare gli ip dei spider in modo da eliminare le visite da loro generate. Non penso sia una pratica comoda quella di aggiornare costantemente il file .htacess di ogni sito gestito!
Tramite il file .htaccess è sicuramente efficace ma alla lunga il file diventa troppo lungo ed un po’ difficile da gestire, secondo me. Via Google Analytics è molto più comodo, secondo me. Grazie!
PS Ciao Francesco 😉
Nel 2024 questi consigli su come risolvere il problema degli spam bot sono ancora applicabili, visto l’uscita di Penguin 4.0 (2016) e di G4 (2023)?