Trouver les sources des liens cassés (404) vers votre site avec GWT

Lorsque l’on surfe sur le Web, une des choses les plus frustrantes est sans doute lorsque l’on tombe sur un lien cassé, c’est à dire un lien qui ne mène à rien si ce n’est un jolie message du style « Page Not Found ».

page not found Trouver les sources des liens cassés (404) vers votre site avec GWT

Ceci est d’autant plus dommageable pour la réputation d’un site et pour le trafic perdu que cela peut représenter.

Or bien souvent nous sommes impuissants face à ces liens cassés, d’autant plus quand nous n’avons pas la main dessus et que nous n’avons aucun moyen de savoir où ils se trouvent (sur quels sites). Impossible donc d’agir et de corriger ou tenter de faire corriger le problème.

En effet, depuis des années il nous est possible de savoir quels sont les pages de nos sites qui sont liés sur le Web et où su la toile (les backlinks, les referers …). Mais lorsqu’il s’agit de pas non trouvée, nous avons moins d’information, si ce n’est une entrée dans les logs et la pseudo page demandée.

Heureusement, Google (encore eux) vient à la rescousse avec l’un des outils de Google Webmaster Tools. Il s’agit du WebCrawler. Pour y accéder, connectez vous à votre compte Google Webmaster Tools et allez à la rubrique « Dashboard > Diagnostics > Web crawl ».

menu gwt Trouver les sources des liens cassés (404) vers votre site avec GWT

Malheureusement, comme ce blog utilise WordPress, il n’y a aucune erreur 404 en tant que tel, car ce moteur de blog intègre une fonctionnalité qui redirige vers une page dédié (404.php) en cas d’erreur. Pire, j’ai configuré toutes requêtes pour aller vers une page standard de mon blog. Mais voyez tout de même ce que cela peut donner en image :

web crawl 404 errors page highlighted 300x213 Trouver les sources des liens cassés (404) vers votre site avec GWT

Mieux depuis quelques temps, il est possible de connaitre la source causant une erreur 404. Plus d’excuse pour laisser ce type d’erreur désormais. Il suffit de cliquer sur le nombre de pages causant une erreur donnée.

web crawl 404 errors source 300x60 Trouver les sources des liens cassés (404) vers votre site avec GWT

Libre à vous ensuite de contacter le webmestre du dît site pour qu’il corrige ce lien. Il y sera lui aussi content, les deux sites gagnant en fiabilité. Autre technique, créer la (fausse) page en question pour qu’elle redirige vers une vraie page ou encore créer une règle du serveur Web (Apache HTTPD par exemple) pour qu’il interprète les url manquantes.

N’oubliez pas non plus qu’il est possible d’agrémenter ses pages 404 d’un outil GWT. Celui-ci permet de faire des suggestions de pages se rapprochant de la page demandée et le cas échéant de proposer une recherche Google directement dans la page 404.

widget 404 example 300x160 Trouver les sources des liens cassés (404) vers votre site avec GWT

Crédits: Blog officiel GWT