Les pages exclues de l’indexation
Parmi les pages d’un site internet, il peut y avoir quelques unes qu’on ne souhaite pas indexer. Donc la non apparition de ces pages sur les SERP (Search Engine Result Pages : Résultats des moteurs de recherche) serait donc parfaitement intentionnel de votre part. Néanmoins, certaines URL peuvent se trouver exclues alors que vous ne l’aviez pas souhaité.
Comment faire son choix de pages à exclure ?
Pourquoi c’est bon pour le SEO ?
Et comment vérifier que la tâche a été bien réalisée et qu’aucune page à indexer n’a été exclue ?
Les pages à exclure
Un site internet ne peut pas être bien référencé en entier sur toute sa marque, le bon référencement sur certaines pages.
Donc par exemple, si vous tenez un blog et que vous avez un article appartenant à plusieurs catégories, il se peut qu’il deviennes accessible depuis plusieurs URL. Hors, le projet du référencement de votre article est lié à son URL. Les URL seront mises en concurrence en elles donc perdront un potentiel commun, de plus pour Google il y a un contenu dupliqué sur plusieurs adresses, ce n’est pas bon… vous devez donc faire un choix et placer une URL canonique pour cet article.
Vous pouvez aussi ne pas avoir envie de laisser les internautes accéder depuis Google directement aux pages catégories produits de votre site e-commerce si vous en teniez un. Donc vous voulez que les personnes accèdent directement sur le produit Pull bleu imprimé mais pas sur la pages catégories Pulls avec 120 produits placés dans une pagination. Pour cela, vous pouvez placez une balise noindex ou bien faire un disallow sur le fichier Robots.txt.
Il peut y avoir encore des cas plus évidents où par exemple vous avez des fichiers factures PDF hébergés sur des liens de votre site. Ici vous pouvez même rajouter un nofollow et un noindex.
Faire attention, un nofollow n’annule pas forcément l’indexation même si c’est rare. Google peut indexer une page sans l’avoir explorée.
Ne soyez pas contradictoires aussi. N’indiquez pas un noindex sur une URL canonique par exemple. Google risque de loucher !
Les pages exclues, c’est bon pour le SEO ?
Avoir des pages exclues bien gérées et saines sur votre site prouve à Google que votre site est de qualité. Quand vous avez un contenu dupliqué vous l’assumez et vous prenez une bonne décision par la suite, ça aide Google à voir que vous savez communiquer avec lui.
De plus, ignorer et laisser aller des pages à exclure dans l’index ralentit la croissance dans le SERP. Les pages dupliquées par exemple l’auront pas le même rang par rapport au même mot clé mais se boufferont entres elles quelques places sans doute.
Ce qui est bon dans la bonne gestion des pages exclure c’est qu’on évite le mauvais de si on les ignore.
Vérifier les pages exclues
Dans le rapport Couverture du Google Search Console on peut aller voir les pages exclues dans la dernière colonne. Ici on aura une vue par période sur les pages qui ont été exclues.
Plus bas, sur un tableau statique, on peut voir les raisons de cette exclusion avec des détails sur le nombre des pages concernées.
En cliquant sur les raisons énoncées ou Types d’exclusion on peut avoir la liste détaillées des pages concernées également.
Parmi les types, on peut citer :
– Bloquées par le fichier Robots.txt
– Bloquées par la balise « noindex »
– Autre page avec balise canonique correcte
– Introuvable 404
– Soft 404
– Page avec redirection…
Donc il arrive que Google prenne la décision seul d’exclure des pages et il a raison. Par exemple pour une page avec redirection permanente, il ne sert à rien de la laisser indexer. Il faudra plutôt s’occuper de référencer la page de destination dans la redirection et non celle redirigée. C’est pour cela que cette dernière devient exclue.