Ultimamente leggo un po’ di post in giro che pongono domande sull’utilizzo dei canonical. Li leggo e mi accorgo di due cose, la prima è che dopo anni che diciamo come usarli, le persone continuano a far prevalere il sentimento alla ragione, la seconda è che il cuore vince sempre, anche sulle linee guida di Google. E vabbè.
Il “canonical” è un attributo (rel=) del tag <link> visibile solo nel codice sorgente. Serve a indicare a Google l’indirizzo canonico di una pagina web, in modo da evitare l’indicizzazione della stessa pagina con indirizzi URL diversi. A questo serve, non ad altro. Ma proviamo a dire qualcosa in più.
Perché (e quando) è stato introdotto
Se non sbaglio risale al 2009 (in caso mi corrigerete). Fu introdotto perché Google si accorse che molti CMS, soprattutto siti ecommerce, ma non solo quelli, generavano una grande quantità di suffissi URL per gli stessi indirizzi di pagina in condizioni diverse. Ad esempio, hai mai fatto caso che per ogni commento lasciato sotto un blog fatto con WordPress, si genera un nuovo suffisso URL? E ti sei mai accorto che le versioni “stampabili” (sì, esistono ancora oggi) delle pagine web pure hanno lo stesso URL di quelle base, ma con un suffisso? E hai mai fatto caso che WordPress – e non solo – genera il suffisso /feed/ per tutte le pagine? Fu principalmente per queste ragioni che si introdusse il canonical. L’attributo doveva servire a definire l’URL canonico e consolidare gli eventuali segnali di rilevanza verso una pagina sola, quella indicizzabile. In questo modo Google avrebbe avuto meno difficoltà a capire cosa tenere in indice e cosa escludere. In quel periodo ci fu un grosso miglioramento dei risultati di ricerca. Google era riuscito a mettere una “pezza” su di un problema che gli costava enormi risorse di scansione e allo stesso tempo aveva migliorato un po’ la vita delle persone. Evviva.
Quando si usa il canonical per pagine “diverse”
Qui è il caso di essere molto chiari. Il canonical può servire in caso di migrazione di un contenuto su di un altro sito web. In questo caso si fa riferimento alla funzione “cross domain” del canonical per dire a Google che la pagina da tenere in indice non è quella sul sito X, ma quella sul sito Y. A queste condizioni le due pagine non saranno del tutto uguali, fosse solo perché cambiando il sito web avremo probabilmente template diversi. Un altro caso diffusissimo riguarda i filtri nei siti ecommerce. È pratica condivisa da tempo, consolidare i segnali delle pagine filtro verso la pagina master di categoria, quella presente nei menu principali di navigazione. Attenzione, non tutte le pagine filtro, ma solo quelle che:
- generano “sorting” su più o meno colonne
- generano sorting per prezzo ascendente/discendente
- mostrano un numero predefinito di risultati
- mostrano risultati filtrarti con caratteristiche particolari
Quest’ultimo punto è quello a cui fare più attenzione, perché sei chiamato a decidere se una pagina che mostra risultati filtrati debba essere canonica o “canonicalizzata” verso la pagina di categoria principale. La scelta dipende da quanto ti interessa che quella visualizzazione corrisponda a una pagina effettivamente indicizzabile, quindi visibile in base a una ricerca articolare degli utenti. E devi pensarci bene, molto bene.
[adrotate banner=”1″]
In ultimo puoi utilizzare il canonical verso una scheda prodotto “master” quando ne hai diverse praticamente uguali che cambiano solo per un microdettaglio del tutto privo di incidenza nelle ricerche.
Quando è inopportuno canonicalizzare
Una pagina web può avere canonical autoreferenziale (a se stessa) oppure essere canonicalizzata, cioè avere un canonical che punta altrove. Se il tuo sito web presenta categorie con sottopagine, ciascuna di esse deve avere un canonical autoreferenziale. Non preoccuparti delle sottopagine perché a patto che il titolo sia uguale (più il suffisso del numero di pagina), Google le renderà visibili solo nelle serp risultanti dall’utilizzo dell’operatore “site:” e non sulle normali pagine di risposta del motore di ricerca. Tienile autoreferenziali.
NON utilizzare il canonical come strategia di posizionamento. Può capitare che tu scopra di avere più pagine che trattano praticamente sempre lo stesso argomento. In questi casi riaprile e modificale in modo da coprire sfumature particolari, insomma, rendile rilevanti per chiavi correlate diverse. Un errore che mi è capitato di vedere spesso è che in questi casi si sceglie una pagina master e si canonicalizzano le altre verso di essa.
Conclusioni
Credo di aver espresso un po’ tutti i casi di utilizzo corretto o scorretto del canonical, ma se me ne è sfuggito qualcuno ti prego di scrivermelo qui sotto in un commento. Ad ogni modo ricorda sempre che il canonical non sostituisce una buona struttura di scansione, cioè, se il codice sorgente del tuo sito web genera un milione di suffissi per la stessa pagina, non pensare di cavartela solamente usando bene i canonical, perché è vero che questa misura serve a consolidare segnali, ma non preserva risorse di scansione, quindi ricordati sempre che è una “pezza”, non la panacea. Se hai il codice sorgente pieno zeppo di percorsi espliciti in più, la via maestra è evitare di servirli, non canonicalizzarli.