Les moteurs de recherches, ces engins qui vous veulent du bien ...

Un moteur de recherche, c'est un service sur lequel on peut rechercher des sites web à partir d'un mot clé ou d'une requête composée de plusieurs mots clefs.

Par exemple, si vous cherchez des informations sur la migration des pingouins, vous taperez les mots "migration pingouins" dans le moteur de recherche que vous utilisez habituellement. Vous ne saisirez pas de ponctuation ni d'articles tels que "le", "la" ou "les", ils sont trop communs pour être significatifs.

Le moteur dispose d'une base de données composé généralement de plusieurs milliers, voir de plusieurs millions ou milliards d'URLs, indexées à intervalle régulier.

Lors d'une recherche dans son index, l'extraction des résultats de votre requête se fait sur une base de données, en fonction d'un algorythme plus ou moins pertinent, propre à chaque moteur.

Fonctionnement d'un moteur de recherche ...
C'est assez simple en téhorie mais très difficile à mettre en œuvre en raison des ressources matérielles, logicielles et de la bande passante nécessaire à son bon fonctionnement. Le logiciel utilisé, bien que souvent emprunté à l'Open Source, est généralement programmé ou modifié en interne. Ainsi, chaque moteur de recherche à ses propres caractéristiques et une méthode unique d'indexation.

Référencement et indexation ...
Dans un premier temps, le moteur doit disposer d'une liste d'adresses de sites web. En général, ces URLs sont collectées via un formulaire en ligne, puis enregistrées dans une base de données. Les documents sont ensuite visités, lus et interprétés par un robot d'indexation, comme vous le faites avec votre navigateur. Les engins de recherche récents tiennent compte de la géolocalisation de votre site.

Une autre manière de collecter les adresses de sites web et de relever les liens qui se trouvent dans les pages visitées par le robot d'indexation. Lorsque des liens externes sont repérés dans une page, ceux-ci sont automatiquement ajoutés dans la base de données du moteur pour une future indexation. Ce qui nous mène directement au

PageRank

...

Popularité et PageRank
Au début des années 1980, Internet se résumait à quelques centaines de documents essentiellement publiées par des chercheurs d'Universités et des étudiants qui avaient ainsi trouvé le moyen de s'échanger facilement leurs informations. A cette époque, le réseau des réseaux se nommait Arpanet.

Aujourd'hui, il paraît impossible de décompter le nombre de documents accessibles sur la toile. Internet représente la plus formidable source de documentation jamais mise à la disposition de tout un chacun.

Le problème, c'est qu'il devient de plus en plus difficile de trouver une information pertinente au milieu de cette profusion de sites web. Pire encore, dans un contexte de mondialisation libérale ou l'accroissement des profits commerciaux justifie tout et n'importe quoi, l'information tend à disparaître à la faveur des sites marchands.

C'est là que les notions de popularité et de page rank devraient permettre de distinguer une information pertinente d'une autre sans intérêt. En effet, on considère que : "si de nombreux webmasters incluent un lien vers un site en particulier, c'est qu'il est sans doute digne d'intérêt". Hélas, cette prime attribuée au mérite est trés souvent détournée par les SEO.

Parmi les moteurs de recherche généralistes, on peut citer :

Altavista Un des plus anciens, en ligne depuis 1995. Plutôt pertinent et rapide, Altavista est un moteur à découvrir si vous ne le connaissez pas encore.
Google Le moteur qui fait sans doute le plus parler de lui ...
Google
Voila moteur de recherches Français, édité par Wanadoo, filliale de France Télécom.
Yahoo A longtemps été un annuaire thématique et qui à lancé son moteur de recherche en février 2004.

Il existe aussi des moteurs spécifiques à une catégorie de site, parmis lesquels :

Legicite Spécialisé dans l'indexation des sites juridiques.
Sexe-Crawler Le spécialiste des sites adultes.
Spinoo Le moteur de recherches de l'éducation, édité par le Centre National de Documentation Pédagogique (CNDP)

En fait, il existe des milliers de moteurs de recherches, plus ou moins gros : Trellian, un spécialiste des outils pour SEO, permet de s'inscrire dans plus de 8600 moteurs et annuaires avec son logiciel de référencement SubmitWolf !


référencement - hébergement - géolocalisation - moteurs - pertinence
SEO - webmaster - google sitemap - contact

simulateur de crédit, grossesse, de la musique

annuaire référencement gratuit annuaire de sites internet