Le référencement de sites dynamiques


Certaines estimations concernant la taille du web permettent de constater que la plus grande partie de celui-ci est constituée de pages dynamiques, c'est à dire de pages générées à l'aide de bases de données implémentées sur un site web. Le web invisible (pages dynamiques) représenterait ainsi un volume plus de 200 fois supérieur au web visible (pages statiques).

Cette situation a conduit dans un premier temps les moteurs de recherche à choisir de n'indexer que les pages Html statiques, simplement pour des raisons liées aux capacités de traitement d'un volume de données aussi important.

Parmi les raisons invoquées par les moteurs à cette difficulté d'indexation des pages synamiques, il y avait également des craintes concernant le doublonnage des entrées dans leurs bases de données, et le fait que l'indexation de sites dynamiques ne répondait pas aux habitudes de recherche majoritaires des internautes.

Aujourd'hui, certains moteurs semblent néanmoins prêts à se lancer dans l'indexation de pages dynamiques. Il s'agit principalement de Google, et dans une moindre mesure de Yahoo et de MSN. Malgré tout, le volume de pages dynamiques indexées par ces moteurs est encore extrêmement limité comparé à celui du web invisible dans son ensemble.

Quels sont les facteurs qui empêchent le référencement de pages dynamiques, et comment y remédier ?

La première difficulté est que les spiders (robots-indexeurs des moteurs de recherche) ont besoin de suivre des liens à l'intérieur de votre site afin de pouvoir indexer les pages correspondantes. Si, sur votre site, les pages dynamiques ne peuvent être accédées que par le biais de l'interrogation d'un formulaire, celles-ci ne pourront pas être indexées par les moteurs. Il vous faut donc intégrer, dès les premières pages de votre site, des liens vers les principales Urls dynamiques que vous souhaiteriez voir indexées. Ceci peut se faire de façon invisible, de manière à ne pas remettre en cause le design et la structure de votre site.

La seconde difficulté est que l'indexation de pages dynamiques, même sur les moteurs ayant commencé à la mener, reste l'exception plutôt que la règle. En général, les moteurs de recherche repèrent une page dynamique à la présence d'un point d'interrogation dans l'Url, suivi d'une liste de paramètres. La seule façon de contourner cette difficulté est donc de recourir à des techniques d'URL rewriting, c'est à dire à un paramétrage de votre serveur permettant de retranscrire vos Urls de pages dynamiques, en Urls apparemment statiques de façon à faciliter leur indexation par les moteurs.

Par exemple, il vous faudra retranscrire des URLS du type
http://www.monsite.com/page.php?parametreA=15&parametreB=42
en   http://www.monsite.com/page_parametreA15_parametreB42/

Cette technique d'URL rewriting nécessite, pour bien fonctionner, un paramétrage spécifique de votre serveur

Pour implémenter l'URL rewriting sur votre site, vous pouvez utiliser l'une de ces deux méthodes : méthode 1 - méthode 2

A lire aussi : l'excellent tutorial de Webmaster Hub sur le module Apache mod_rewrite

Sommaire de la rubrique Optimisation