stephane Statut: Administrateur
 Enregistré: 02-12-2000 Messages: 364 IP: enregistrée
|
L'algorithme de Google devoilé ?
L'algorithme de Google devoilé ?
Au début, j'ai cru à un gag je l'avoue... Deux universitaires iraniens annonçent le 19 octobre avoir percé à jour l'algorithme de classement des résultats de Google, en appliquant à celui-ci de simples méthodes d'analyse mathématique.
Pour preuve de l'aboutissement de leurs travaux, une petite page web extrêmement colorée ( http://www.iranian4iran.com/google.htm ), un document Word d'introduction au projet rédigé en perse, et quelques extraits d'un diaporama également en perse.
Les deux scientifiques sont issus de l'Université iranienne Khaje Nasir, spécialisée en ingenierie électrique.
Si les résultats de leur étude n'ont pas encore été publiés, quelques informations ont déjà filtré sur les conclusions auxquelles ils seraient parvenus, et celles-ci sont de nature à susciter un tollé dans le landernau des référenceurs...
Les résultats de l'étude et la méthode d'analyse employée ne devraient pas être communiqués avant la Conférence IFAC de Rotterdam du 27 août 2003 ( http://www.sysid2003.nl/ ), à laquelle participera le directeur de projet iranien.
Mais les détracteurs de cette étude semblent d'ores et déjà bien décidés à ne pas attendre cette date pour la discréditer complètement ainsi que leurs auteurs avant même toute communication publique...
Que deux universitaires spécialisés en ingenierie électrique, avec peu ou pas de connaissance préalable du référencement, affirment avoir découvert en quelques mois quelque chose que cherchent tous les référenceurs du monde depuis des années était déjà en soi un choc pour beaucoup de monde.
Qu'une simple analyse mathématique de l'algo de Google en tant que système linéaire puisse aboutir, là où des années de recherche empirique de la part de professionnels du référencement n'ont permis d'atteindre qu'une connaissance très partielle, serait encore plus choquant, n'est ce pas ?
Pourtant, en ce qui me concerne, leur démarche m'a interessé. L'analyse mathématique est évidemment d'un grand intérêt dans la recherche en "algo cracking". Le fait que ces chercheurs aient un regard complètement extérieur vis à vis du référencement et choisissent de tourner le dos à l'analyse statistique pour employer une nouvelle méthode permettra peut-être d'élargir ou de renouveler un peu notre connaissance des moteurs et de leurs algos.
Si je ne crois aucunement que la théorie à laquelle ils soient parvenus soit la bonne, je suis persuadé que leur démarche et leurs conclusions pourront se reveler utiles. Peut-être que cela permettra d'identifier de nouveaux critères de pertinence par exemple, ou de mieux comprendre le poids relatif des différents critères.
Voici quelques unes des informations qui ont filtré sur le résultat de leurs travaux et la méthode d'analyse employée.
Pour l'essentiel, la méthode d'analyse a consisté à aborder l'algorithme de Google comme un système linéaire pouvant ressembler à une fonction de ce type là : F(a*g(t) + b*h(t)) = a*F(g(t)) + b*F(h(t))
Où a et b sont des constantes, et g et h des fonctions d'une variable indépendante.
L'optique de leur étude était donc de parvenir à isoler chacune des variables indépendantes (les critères de pertinence) afin d'évaluer leur poids relatif dans l'algorithme de Google.
Ali Khaki Sedigh et Mehdi Roudaki affirment y être parvenus.
Leurs conclusions sont assez surprenantes...
Selon eux, le critère numero un du positionnement dans Google serait la présence du mot-clé dans les intitulés de catégories Dmoz des liens entrants (sites referrers). Cela voudrait dire que si votre site concerne le mot-clé "emploi", vous ameliorerez son classement de manière décisive en obtenant des liens depuis des sites inscrits dans l'Open Directory dans des catégories comportant le mot "emploi" dans leur intitulé, par exemple "World: Français: Commerce et économie: Emploi".
Le second critère de pertinence serait un ratio entre le nombre de liens similaires et le nombre total de liens entrants. La formule exacte est présentée comme ceci : {(similar links)/(all links)}*1/30
Cela voudrait dire que vous améliorez à coup sûr votre classement si parmi vos liens entrants vous avez une forte proportion de sites que Google puisse considérer comme des sites similaires au votre.
Le fameux PageRank n'arriverait, lui, qu'en 8ème position des critères de pertinence les plus importants pour Google !
De quoi hérisser le poil de tous les adorateurs du PageRank, non ? C'est aussi en grande partie pour cette raison que l'étude de Sedigh et Roudaki est aussi violemment critiquée avant même d'avoir pu être publiée.
Leur théorie battrait en brèche, en effet, pas mal d'idées reçues dans le domaine du référencement, et déchaine déjà contre elles les partisans du "PageRank is king" aussi bien que les partisans du "Content is king".
J'espère pour ma part que les deux chercheurs iraniens ne nous feront pas trop attendre pour communiquer leur étude, et qu'une discussion sereine sur le fond pourra rapidement s'engager, concernant tant la validité de leurs conclusions que celle de leur méthode d'analyse.
____________________________
Stephane
Promoweb - le guide du référencement
|