|
|
Les moteurs de recherches, ces engins qui vous veulent du bien ...
Un moteur de recherche, c'est un service sur lequel on peut rechercher des sites web à
partir d'un mot clé ou d'une requête composée de plusieurs mots clefs.
Par exemple, si vous cherchez des informations sur la migration des pingouins, vous taperez les mots "migration pingouins" dans le moteur de recherche que vous utilisez habituellement. Vous ne saisirez pas de ponctuation ni d'articles tels que "le", "la" ou "les", ils sont trop communs pour être significatifs.
Le moteur dispose d'une base de données composé généralement de
plusieurs milliers, voir de plusieurs millions ou milliards d'URLs, indexées
à intervalle régulier.
Lors d'une recherche dans son index, l'extraction des résultats de votre
requête se fait sur une base de données, en fonction d'un algorythme plus ou
moins pertinent, propre à chaque moteur.
|
|
Fonctionnement d'un moteur de recherche ...
C'est assez simple en téhorie mais très difficile à mettre en œuvre
en raison des ressources matérielles, logicielles et de la bande passante nécessaire
à son bon fonctionnement. Le logiciel utilisé, bien que souvent emprunté
à l'Open Source, est généralement programmé ou modifié en
interne. Ainsi, chaque moteur de recherche à ses propres caractéristiques et une
méthode unique d'indexation.
Référencement et indexation ...
Dans un premier temps, le moteur doit disposer d'une liste d'adresses de sites web. En
général, ces URLs sont collectées via un formulaire
en ligne, puis enregistrées dans une base de données. Les documents sont ensuite
visités, lus et interprétés par un robot d'indexation, comme vous
le faites avec votre navigateur. Les engins de recherche récents tiennent compte de la
géolocalisation de votre site.
Une autre manière de collecter les adresses de sites web et de relever les liens
qui se trouvent dans les pages visitées par le robot d'indexation. Lorsque
des liens externes sont repérés dans une page, ceux-ci sont automatiquement
ajoutés dans la base de données du moteur pour une future indexation.
Ce qui nous mène directement au PageRank...
Popularité et PageRank
Au début des années 1980, Internet se résumait à quelques centaines de
documents essentiellement publiées par des chercheurs d'Universités et des
étudiants qui avaient ainsi trouvé le moyen de s'échanger facilement
leurs informations. A cette époque, le réseau des réseaux se nommait
Arpanet.
Aujourd'hui, il paraît impossible de décompter le nombre de documents accessibles
sur la toile. Internet représente la plus formidable source de documentation
jamais mise à la disposition de tout un chacun.
Le problème, c'est qu'il devient de plus en plus difficile de trouver une information
pertinente au milieu de cette profusion de sites web. Pire encore,
dans un contexte de mondialisation libérale ou l'accroissement des profits commerciaux
justifie tout et n'importe quoi, l'information tend à disparaître à la
faveur des sites marchands.
C'est là que les notions de popularité et de page rank devraient
permettre de distinguer une information pertinente d'une autre
sans intérêt. En effet, on considère que : "si de nombreux webmasters
incluent un lien vers un site en particulier, c'est qu'il est sans doute digne d'intérêt".
Hélas, cette prime attribuée au mérite est trés souvent
détournée par les SEO.
Parmi les moteurs de recherche généralistes, on peut citer :
| Altavista |
Un des plus anciens, en ligne depuis 1995. Plutôt pertinent et rapide, Altavista
est un moteur à découvrir si vous ne le connaissez pas encore. |
| Google |
Le moteur qui fait sans doute le plus parler de lui ...
|
| Voila |
moteur de recherches Français, édité par Wanadoo, filliale de France Télécom. |
| Yahoo |
A longtemps été un annuaire thématique et qui à lancé son moteur de recherche en février 2004. |
Il existe aussi des moteurs spécifiques à une catégorie de site, parmis
lesquels :
| Legicite |
Spécialisé dans l'indexation des sites juridiques. |
| Sexe-Crawler |
Le spécialiste des sites adultes. |
| Spinoo |
Le moteur de recherches de l'éducation, édité par le Centre National de Documentation Pédagogique (CNDP) |
|
|
référencement - hébergement - géolocalisation - moteurs - pertinence - SEO - webmaster - sitemap - contact |
|