Homepage » Coding » Controlla in che modo Google indicizza i tuoi contenuti con meta tag

    Controlla in che modo Google indicizza i tuoi contenuti con meta tag

    Ci sono molti motori di ricerca là fuori, ma la maggior parte delle volte, i proprietari dei siti si preoccupano di far sì che il loro sito sia indicizzato su Google onnipotente. Un modo per ottenere prestazioni migliori nel motore di ricerca è usa i tag meta robot.

    Il meta il tag robot è un meta tag di consenso tra i motori di ricerca come Google, Yahoo e Bing. L'uso del meta tag è di permettere agli sviluppatori web di avere il controllo dell'accessibilità per le pagine web, contro i crawler dei motori di ricerca. Per esempio, qualcosa di simile noindex impedirà a tutti i robot dai motori di ricerca di inserire la tua pagina web nel loro indice.

    Il robot di Google è chiamato Googlebot. In questo post vedremo come ci occupiamo esclusivamente di Googlebot meta tags.

    Indirizzamento a Googlebot

    Per indirizzare Googlebot, specifica la meta nome come googlebot invece di solo robot. Questo esempio impedisce a Googlebot di inserire la tua pagina web nel proprio indice, ma consente comunque ai bot di Bing e Yahoo di eseguire la scansione della pagina. Pertanto, le tue pagine Web potrebbero ancora apparire nei risultati di ricerca di Bing e Yahoo.

      

    Google ha un numero di robot speciali che eseguono la scansione di diversi tipi di contenuti come Immagine, Notizie, Video, Annunci e Mobile. Google ti consente di bloccare questi robot singolarmente. Se non vuoi che il tuo sito web appaia nei risultati di ricerca di Google Mobile, ad esempio, puoi specificare il tag meta robot in questo modo:

      

    L'elenco completo dei tipi di bot di Google è disponibile nella pagina dei crawler dei siti web di Google.

    Impedire l'indicizzazione delle immagini

    È davvero irritante quando trovi la tua immagine protetta da copyright utilizzata da qualcun altro senza la tua previa autorizzazione. Se vuoi minimizzare ciò, puoi impedire a Google di inserire le tue immagini nel loro indice.

    Specifica il tag meta robot con il valore di noimageindex. Ciò impedirà al robot di indicizzare tutte le immagini nella pagina e le tue immagini non appariranno nei risultati di Google Image Search, che è dove le persone di solito cercano immagini.

      

    In alternativa, puoi impostare il nome meta come Googlebot-image per impedire in modo specifico ai robot di Google di eseguire la scansione del tuo sito per le immagini.

      

    Impedisci la traduzione

    Google Chrome offre la traduzione di un sito in lingua straniera alla lingua preferita o locale del visitatore, con l'aiuto di Google Traduttore. Mentre la traduzione di Google Traduttore sta migliorando, non è perfetta per alcune lingue. L'output di traduzione potrebbe a volte essere davvero bizzarro.

    Se non vuoi che Google traduca le tue pagine web, imposta la meta di googlebot con il valore di notranslate, così.

      

    Se si desidera impedire la traduzione di una determinata sezione della pagina, è possibile aggiungere il notranslate classe all'interno dell'elemento che avvolge il contenuto:

     

    Google ignorerà questo

    completamente.

    Impedire l'indicizzazione dopo un tempo specificato

    Puoi anche impedire a Google di indicizzare le tue pagine web dopo un certo periodo di tempo. Ciò sarà particolarmente utile per le pagine Web che sono rilevanti solo in un periodo di tempo, come ad esempio una pagina di registrazione di un evento.

    In questo caso, probabilmente vorrai dire al robot di non eseguire la scansione e l'indicizzazione di questa pagina dopo che l'evento è terminato, impedendo quindi che venga visualizzato nei risultati di ricerca di Google.

    Per fare ciò, specifica il meta tag con il valore di unavailable_after poi seguito dalle informazioni sul tempo. Il formato dell'ora deve essere conforme al formato RFC-850, ad esempio: Giovedì 26 settembre 14 10:00 UTC

      

    Dando l'esempio sopra, il robot di Google non eseguirà la scansione della pagina dopo il 29-set-14. La pagina finirà per scomparire dall'indice, tuttavia puoi ancora conservare la pagina per l'archiviazione nel tuo sito web.