Le pagine in sitemap non si indicizzano

Le sitemap che sottometti a Google attraverso la search console sono spesso il primo strumento che Google utilizza per analizzare i contenuti e la struttura scansionabile del tuo sito web. Google tende infatti a ritenere canoniche le pagine che trova in sitemap, anche in assenza dell’attributo canonical, che comunque è sempre meglio utilizzare per tutte le pagine del sito web.

come gestire le sitemap xml
Come gestire le sitemap xml

Ma se è vero che le sitemap rappresentano le porte d’accesso principali per i crawler di Google, capita anche di frequente che alcune (o parecchie) pagine non vengano indicizzate, pur essendo listate in sitemap. Vediamo di seguito i casi principali in cui può verificarsi una situazione del genere.

Le pagine in questione sono orfane

Se le pagine listate in sitemap non sono raggiungibili dal sito web sono appunto orfane. A queste condizioni Google può tranquillamente ignorarle, anche se presenti in sitemap. In questi casi è importante conoscere il motivo per cui le pagine listate in sitemap sono in realtà orfane, perché alcuni problemi SEO importanti potrebbero dipendere da questo.

Non sono orfane, ma nessuno ci clicca mai sopra

Sarà importante valutare anche la posizione dei link che puntano alle pagine listate in sitemap. Se ad esempio si trovano a fondo pagina, sperduti, magari nessuno ci cliccherà mai e ciò potrà essere interpretato come un segnale negativo da Google, che potrebbe appunto escluderne l’indicizzazione. Ricorda che se un link non viene cliccato MAI, la cose sono due: o è sbagliata la posizione/aspetto/anchor, oppure quel link in pagina, non ci dovrebbe proprio stare.

Sono povere

Google ha parecchie risorse che gli servono per scansionare una enorme quantità di pagine web sparate online da tutto il mondo, ma il fatto che ne abbia tante (di risorse) non vuol dire che le destinerà a qualunque cosa gli diamo in pasto. Se il nostro sito web presenta molte pagine vuote o quasi, sarà probabile che per queste pagine il processo di scansione non condurrà a un’indicizzazione piena, semplicemente perché non ne vale la pena. Valuta quindi che se le pagine listate in sitemap non entrano in indice, il motivo potrebbe essere questo. Perché sono povere? Servono davvero?

Sono molto simili ad altre giudicate invece rilevanti

Molti siti web creano un fantastilione di pagine in automatico, tutte uguali tranne che per minuscoli particolari. Se vai online in queste condizioni, non ti sorprenderà più di tanto scoprire che per questa miriade di pagine, non solo non avviene l’indicizzazione, ma spesso non si avvierà nemmeno la scansione. Le troverai segnalate in search console, tra le pagine rilevate, ma non indicizzate. Considera inoltre che ogni sito web ha diritto a una certa quantità di risorse di scansione e che tale quantità è destinata a crescere via via che aumentano la rilevanza e la volumetria del sito stesso, organicamente. Se vai online direttamente con due milioni di pagine indicizzabili, è probabile che Google ne indicizzerà solo una minima parte, poi si fermerà in attesa di vedere se alle persone il sito piace. Questo non dipende nemmeno dal fatto che le pagine siano più o meno uguali, ma è proprio un discorso legato all’economia che Google fa delle risorse di scansione. Giustamente.

In ultimo, se hai 40 lingue diverse, di cui parecchie sono duplicazioni della lingua inglese, può verificarsi la mancata indicizzazione delle pagine pur già inviate con una o più sitemap. In questi casi il suggerimento è osservare se gli hreflang sono compilati bene o (più probabilmente) escludere un bel po’ di localizzazioni secondarie del sito web dalla sitemap.

Sono offtopic col sito web

Capita spesso con i tag su wordpress. Non vengono indicizzati perché sono poveri, essendo associati per ignoranza a un solo articolo. Inoltre sono anche spesso offtopic, perché vengono prodotti a partire da termini vari ed eventuali che presi di per sé hanno un significato troppo largo, che diventa del tutto fuorviante. Ho trovato il tag “scala a chiocciola” in un travel blog in cui un articolo raccontava di una spiaggia molto difficile da raggiungere, alla quale appunto si accedeva con una scala a chiocciola. Google non aveva indicizzato quel tag, sebbene fosse presente in sitemap… e in effetti aveva evitato di indicizzare parecchie altre pagine. A ragione.

È ancora presto…

Magari è tutto giusto, ma il sito web è recente e Google non ha ancora avuto modo di concludere il processo di indicizzazione per tutte le pagine listate nelle sitemap. Direi che 3 o 4 mesi dovrebbero essere un tempo d’attesa sufficiente a escludere la “recentezza” del sito web dalle possibili cause di un’esclusione dall’indice delle pagine listate in sitemap.

Idee? Suggerimenti?

Possono esserci ancora altri motivi per cui una pagina listata in sitemap può venire esclusa dall’indicizzazione. Ad esempio – ed è bene ribadirlo – se una pagina è in noindex, bloccata da robots.txt o reindirizza verso un’altra pagina, Google di base la escluderà dall’indice. Le sitemap non dovrebbero contenere link a pagine di questo tipo, perché è proprio un errore.

E a te, vengono in mente altri motivi per cui una pagina listata in sitemap non dovrebbe entrare in indice?

Rispondi all'articolo

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati *


The reCAPTCHA verification period has expired. Please reload the page.