Olivier Duffez, Lundi 16 février 2009
http://www.webrankinfo.com/dossiers/techniques/url-canonique
Le problème des contenus dupliqués (duplicate content) est un des sujets les plus récurrents dans le domaine du référencement : il y a d’ailleurs beaucoup d’incompréhensions sur ce sujet mais ceci fera l’objet d’un autre article. Aujourd’hui, nous allons analyser la nouvelle proposition commune de Google, Yahoo et Live Search pour essayer de résoudre les problèmes de contenus dupliqués (à l’intérieur d’un site) : la balise spéciale link rel=canonical qui décrit l’URL canonique d’une page (c’est-à-dire son URL officielle).
Le problème du contenu dupliqué
Il y a de nombreuses situations qui font qu’une page est accessible à plusieurs URL, en général à cause d’une mauvaise conception du site (j’ai d’ailleurs donné des conseils pour corriger les problèmes de contenus dupliqués). Ceci pose problème pour le référencement car :
pour analyser une page web ou tout document web indexable (PDF, Flash, .doc, etc.), les moteurs de recherche fonctionnent avec comme principe 1 page = 1 URL : une page est identifiée par une URL.
donc si l’URL est différente, c’est a priori une autre page, analysée différemment
En conséquence, quand une même page web est accessible à plusieurs endroits, les moteurs de recherche considèrent par défaut qu’il s’agit de plusieurs pages. Imaginons donc une fiche produit accessible à plusieurs URL (à cause des identifiants de session, des paramètres de tracking et d’affiliés, de la présence du produit dans plusieurs catégories, etc.). Si chacune de ces versions reçoit des liens différents (venant d’autres sites par exemple), alors chaque page est en concurrence avec les autres dans les pages de résultats Google.
Si inversement le site est bien construit et qu’une page n’est accessible qu’à une seule URL quelles que soient les conditions, alors cette page concentre tous les atouts pour le référencement (notamment au travers de ces fameux backlinks).
Conclusion : vous n’allez pas recevoir un carton rouge de la page de Google parce que vous avez des pages accessibles à plein d’URL à la fois, mais vous vous donnez beaucoup moins de chances de réussir à bien vous positionner dans les moteurs.
La solution de l’URL canonique
La solution proposée par les 3 principaux moteurs est très simple et a priori très efficace, à tel point qu’on se demande pourquoi cela n’a pas été introduit auparavant. Le principe est de permettre au webmaster d’indiquer pour chaque page de son site quelle est l’URL canonique, c’est-à-dire l’URL officielle de la page.
En quelque sorte, le webmaster indique l’URL à laquelle la page est censée être trouvée. Toutes les autres versions, qui jusqu’à présent provoquaient du contenu dupliqué, seront désormais considérées par les moteurs comme étant strictement la même page.
Le format de la balise rel=canonical
Cette balise est à placer dans l’entête HTML de votre page (entre et ), avec le format très simple
0 Responses
Stay in touch with the conversation, subscribe to the RSS feed for comments on this post.