Le
référencement de sites dynamiques
Certaines estimations
concernant la taille du web permettent de constater que la plus grande
partie de celui-ci est constituée de pages dynamiques, c'est
à dire de pages générées à l'aide
de bases de données implémentées sur un site
web. Le web invisible (pages dynamiques) représenterait
ainsi un volume plus de 200 fois supérieur au web visible
(pages statiques).
Cette situation a conduit
dans un premier temps les moteurs de recherche à choisir de
n'indexer que les pages Html statiques, simplement pour des raisons
liées aux capacités de traitement d'un volume de données
aussi important.
Parmi les raisons invoquées
par les moteurs à cette difficulté d'indexation des
pages synamiques, il y avait également des craintes concernant
le doublonnage des entrées dans leurs bases de données,
et le fait que l'indexation de sites dynamiques ne répondait
pas aux habitudes de recherche majoritaires des internautes.
Aujourd'hui, certains
moteurs semblent néanmoins prêts à se lancer dans
l'indexation de pages dynamiques. Il s'agit principalement de Google,
et dans une moindre mesure de Yahoo et de MSN. Malgré tout,
le volume de pages dynamiques indexées par ces moteurs est
encore extrêmement limité comparé à celui
du web invisible dans son ensemble.
Quels sont les facteurs
qui empêchent le référencement de pages dynamiques,
et comment y remédier ?
La première difficulté
est que les spiders (robots-indexeurs des moteurs de recherche) ont
besoin de suivre des liens à l'intérieur de votre site
afin de pouvoir indexer les pages correspondantes. Si, sur votre site,
les pages dynamiques ne peuvent être accédées
que par le biais de l'interrogation d'un formulaire, celles-ci ne
pourront pas être indexées par les moteurs. Il vous faut
donc intégrer, dès les premières pages de votre
site, des liens vers les principales Urls dynamiques que vous souhaiteriez
voir indexées. Ceci peut se faire de façon invisible,
de manière à ne pas remettre en cause le design et la
structure de votre site.
La seconde difficulté
est que l'indexation de pages dynamiques, même sur les moteurs
ayant commencé à la mener, reste l'exception plutôt
que la règle. En général, les moteurs de recherche
repèrent une page dynamique à la présence d'un
point d'interrogation dans l'Url, suivi d'une liste de paramètres.
La seule façon de contourner cette difficulté est donc
de recourir à des techniques d'URL rewriting, c'est
à dire à un paramétrage de votre serveur permettant
de retranscrire vos Urls de pages dynamiques, en Urls apparemment
statiques de façon à faciliter leur indexation par les
moteurs.
Par exemple, il vous faudra
retranscrire des URLS du type
http://www.monsite.com/page.php?parametreA=15¶metreB=42
en http://www.monsite.com/page_parametreA15_parametreB42/
Cette technique d'URL rewriting nécessite, pour bien fonctionner,
un paramétrage spécifique de votre serveur
Pour implémenter l'URL rewriting sur votre site, vous pouvez
utiliser l'une de ces deux méthodes : méthode
1 - méthode
2
A lire aussi : l'excellent tutorial de Webmaster Hub sur le module
Apache mod_rewrite