Les erreurs d’exploration

La couverture index

Google Search Console, anciennement Google WebMaster Tools, est un outil qui permet de communiquer en quelque sorte avec Google. Il nous permet d’envoyer aux crawlers les pages de notre site internet et différents éléments tels que le Sitemap et d’en voir en temps réel la validation ou le renvoi d’erreurs.

En effet, certaines pages peuvent présenter des problématiques risquant de gêner les crawlers dans leur exploration de votre contenu. Ceci pouvant être pénalisant pour le référencement d’un site internet, il faut donc y faire attention.

Le rapport Couverture dans le panneau à gauche dans Google Search Console nous aide justement à identifier les erreurs générées à y remédier.

 

La lecture du rapport couverture

Le rapport nous indique dans un graphique le nombre d’erreurs, de pages valides avec des avertissements, de pages valides et enfin de pages exclues. Tout ceci en fonction des dates dans une période prédéfini.

Vous pouvez voir dans l’image qui suit ce que ça peut donner :

 

 

Les pages exclues de l’indexation peuvent être des pages dupliquées présentant des URL canoniques, des balises noindex ou bien elles peuvent être bloquées par le fichier robots.txt…

Ces pages exclues intentionnellement ne devraient pas nous poser des problèmes. Notre casse-tête ça va être les pages présentant des erreurs ou bien exclues sont qu’on en ait l’intention, et ce à cause de problèmes d’exploration.

Les erreurs de redirection

Google n’aime pas les redirections multiples qui font basculer plus d’une fois ses robots d’une page à une autre. Ce cas arrive lorsque vous arrivez sur une page, elle vous redirige vers une autre et cette dernière vous redirige encore vers une troisième… Deux redirections c’est déjà beaucoup, mais il peut y en avoir plus et c’est ralentissent ! C’est très connu, les robots n’aiment pas être ralentis.

Une page peut aussi rediriger vers elle même, c’est bizarre et pas du tout fonctionnel en plus, donc évitez de laisser vos pages se prendre dans leur propre piège. 

Dans la mesure du possible utilisez les redirections permanentes plutôt que les redirections temporaires.

Les redirections temporaires qui sont là dans les cas où les contenus sont momentanément indisponibles risquent un peu plus de présenter des problèmes.

 

 

Le code erreur 500

Ce sont des erreurs liés au serveur. Un grand nombre de visites peut être à l’origine du problème (peut-être aviez-vous fait le buzz récemment ?) et ça peut être vérifié sur le rapport Temps Réel de l’outil Google Analytics.

Il peut y avoir aussi une incompatibilité entre le contenu et le serveur. Par exemple pour du WordPress, il faut privilégier le système Linux par rapport au système Windows.

Si vous êtes sur un serveur Cloud ou un serveur dédié, c’est que vous devez en général vous occuper de la mise à jour du serveur. Peut-être vous l’aviez oublié ?

Mais si vous êtes sur un serveur mutualisé, vous n’avez pas à faire votre mise à jour. Ceci est à la charge de l’hébergeur. Sachez quand même qu’un serveur mutualisé risque beaucoup plus d’être saturé donc au moins, ne soyez pas sur une formule d’hébergement non adaptée à votre volumétrie de contenus juste pour son prix inférieur.

La base de données peut aussi être endommagée ou rédigée dans une mauvaise version des langages informatiques. Vérifiez cela auprès de votre hébergeur si vous n’avez pas les prérequis techniques pour le faire en autonomie.

 

Si vous avez des extensions SEO sur votre CMS, il faudra regarder s’ils ne sont pas entrés en compétition tout en foutant du bordel. Quoique un seul plugin peut faire le foufou tout seul aussi ! Pour vérifier, désactivez les extensions une à une et regardez ce qui se passe.

Il est inutile de paniquer, mais la piste d’un piratage est possible. Pensez toujours en tout cas à télécharger votre base de données pour pouvoir tout récupérer en cas de problème.

 

 

Les codes erreur 404 et soft 404

Les googlebots détestent les erreurs 404… ils sont là, ils détectent une URL, ils vont ensemble explorer… et ils ne trouvent rien ! Ce n’est pas possible de ne pas s’occuper de l’adresse URL qui reste indexée ou bien citée quelque part sur le Net après avoir supprimé ou changé l’URL de la page. Il faut s’en occuper absolument, et donc placer une redirection. Choisissez quand même une bonne page de destination de redirection. Pour quelques cas ça peut être la page d’accueil mais pas tous. Par exemple dans le cas où un produit a été supprimé dans un site e-commerce, il serait pertinent de rediriger la page vers la catégorie du produit ou un produit de substitution.

Les Soft 404 sont un cas à part. La page existe toujours et elle est parfaitement fonctionnelle sauf que… elle est vide ! Vide complètement ou bien presque, avec pour exemple un tout petit mot perdu et seul. Ne publiez donc pas vos pages avant de les finir, gardez-lez en brouillons en attendant de les terminer. Et si vous voulez supprimer tout le contenu d’une page autant en supprimer l’URL en entier et mettre une redirection.

 

Des pages dupliquées

Vous pouvez de manière légitime avoir du contenu dupliqué sur plusieurs de vos pages. Vous savez que c’est normal pour certains cas (Par exemple pour un site e-commerce où vous avez la page produit qui se duplique car elle appartient à deux catégories produit à la fois) mais Google a besoin de vous l’entendre dire. « Bon voilà Google, je sais que j’ai deux pages avec le même contenu mais ce n’est pas parce que je veux tricher avec toi et faire genre j’ai plein de pages, je veux que tu le saches et merci ! »

Il serait tellement plus simple de lui parler comme ça mais ce n’est pas possible. Il faut lui communiquer une  URL canonique sur vos pages dupliquées. Ainsi, vous ne serez pas sanctionnés.

Pour voir si vous avez bien placé vos balises canoniques, rendez-vous sur le rapport couverture du Google Search Console. Vous allez voir dans les pages exclues tout le détail.

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *