Come Migliorare la Scansione dei tuoi Contenuti

Le pagine web non sono tutte uguali, ma come sai già bene, esistono pagine più superficiali ed esterne e pagine più profonde e interne. Le prime definiscono oggetti di conoscenza, le seconde ne spiegano i significati più dettagliatamente.

migliora la scansione

migliora la scansione


 

Quale che sia la struttura dei contenuti del tuo progetto web, quanto più riesci a fare in modo che la frequenza di scansione delle pagine sia alta, tanto più Google sarà reattivo alle modifiche e ai nuovi contenuti che pubblichi, insomma, un segno di attenzione che decisamente non guasta.

Cosa determina la frequenza di scansione?

Le variabili sono principalmente 3

  1. La frequenza di aggiornamento dei contenuti
  2. La popolarità
  3. La quantità di visite e di pageviews

Google tende a elargire un budget di scansione più alto ai contenuti orizzontali e a quelli pubblicati con cadenza frequente e precisa. I siti web dei giornali ad esempio tendono ad avere un “crawling budget” elevato in virtù del fatto che Google è sensibile agli aggiornamenti frequenti.

Allo stesso tempo un sito web verticale e statico come quello di un azienda, tenderà ad avere una frequenza di scansione dei contenuti più bassa, a meno che non sia molto popolare, cioè non ottenga una quantità tale di menzioni e link in ingresso da richiedere particolare attenzione a Google, che non potrà lasciarsi sfuggire un aggiornamento, ma dovrà adoperarsi per scansionare e assorbire negli indici le pagine nuove, pur prodotte raramente e/o con frequenza casuale.

In ultimo, un fattore che favorisce l’aumento della frequenza di scansione delle pagine di un sito web è la quantità delle visite. Un sito web che fa tante visite sia in termini assoluti che relativamente al segmento di mercato in cui si affaccia è evidentemente ritenuto utile dagli utenti. Anche in questo caso Google stanzierà una quantità di risorse di scansione più elevata per evitare di perdersi aggiornamenti.

La somma fa il totale?

I siti sono tanti, milioni di milioni… parti dal presupposto che è Google a determinare quante risorse di scansione mettere a disposizione del tuo progetto, quindi non puoi fare granché in questo senso se non (fondamentalmente) curare la SEO, sfruttando al massimo le risorse di scansione a tua disposizione, indirizzandole verso i tuoi contenuti business. Insomma, se già ti occupi di pulire e deindicizzare tutte le pagine vecchie, e quelle inutili generate dinamicamente dal CMS che utilizzi, hai già fatto un lavoro importante ed ecologico soprattutto considerando che wordpress è bello, ma se non sai gestirne le tassonomie può diventare un incubo. Peggio c’è solo Joomla che a causa di com’è progettato indicizza proprio archivi che non esistono, because open source matters!

Filtri di Google ed ecologia delle serp

Considerando che la maggior parte dei siti web al mondo sono realizzati su piattaforma WordPress e che se questa viene utilizzata senza cognizione di causa genera un’enorme quantità di spazzatura, con il tempo mi sto facendo l’idea che Google deve avere dei filtri che gli consentono di “saltare” i contenuti ridondanti ed evidentemente sconosciuti ai web master che sviluppano siti web. Pensa solo a quante pagine con i contenuti d’esempio (lorem ipsum) vengono fatte inconsapevolmente indicizzare ogni giorno. Google deve sapere come ignorare questi documenti web, altrimenti sarà sempre più difficile far emergere i contenuti di qualità.

Non è quindi solo il link graph ad essere sporco, ma anche il knowledge graph potrebbe risentire di questi enormi volumi di contenuti indicizzati casualmente e lasciati a svernare senza fare niente per anni. Ricordatelo ogni volta che ti lamenti su Facebook del fatto che Google funziona male.

Conclusioni

Tutto è relativo. Il sito web di un giornale tende ad avere una frequenza di scansione più elevata rispetto ad un sito web aziendale, a meno che il giornale non sia il Corriere di Misterbianco e il sito aziendale non sia quello della Apple. Il lavoro da fare per agevolare la scansione è tecnico, ma le variabili che ho riportato sopra sono tutte sociali ed è in base a quelle che Google determina quanto frequentemente è opportuno aggiornare le proprie cache.

Il mio suggerimento è quindi quello di aggiornare i contenuti e soprattutto di creare valore e diffonderlo in rete in modo tale da produrre interesse e visite. Niente di meglio che puntare al tuo pubblico di riferimento, magari provando a migliorarne la vita. Tutto qui? No certo, puoi anche imbrogliare Google forzandone la scansione con trucchetti black hat… noiosi più che altro.

2 Comments

  1. matteo 11/02/2016

Rispondi all'articolo

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati *


Il periodo di verifica reCAPTCHA è scaduto. Ricaricare la pagina.