Les moteurs de recherche
Par Danielle • 4 fév, 2010 • Catégorie : Internet- Les plus célèbres et les plus pratiques moteurs de recherche
- Le fonctionnement des moteurs de recherche
- Evolution des moteurs de recherche
Logiciels indispensables à l’exploration des données sur le Web, les moteurs de recherche se montrent très pratiques dès lors que l’on maîtrise leur fonctionnement !
Les plus célèbres et les plus pratiques moteurs de recherche
Pratiques et performants : les moteurs de recherche
D’abord on recense de nombreux sites web dont le rôle principal est de retrouver des ressources, à l’image de Youtube, Dailymotion, Google vidéo… Ce sont des moteurs de recherche vidéo. On peut encore en citer comme exemple les annuaires de sites web, comme ceux de Yahoo et Voilà. Par ailleurs, il existe aussi ceux qu’on appelle métamoteurs. Il s’agit de sites internet, comme Seek.fr, Mamma, Kartoo… qui se servent, simultanément, de plusieurs moteurs de recherche, pour offrir un résultat encore plus pertinent. Enfin, il faut savoir que les moteurs de recherche ne fonctionnent pas uniquement avec internet.
Il est également possible de les installer sur un ordinateur, en tant qu’outil personnel. Dans ce cas, les recherches qu’il effectue ne se limitent pas aux données web, mais incluent également les fichiers stockés sur la machine. Google Desktop, Exalead Desktop, et Copernic Desktop search figurent parmi ces dernières formes de moteur de recherche.
Le fonctionnement des moteurs de recherche

YouTube : pour le partage et la recherche de vidéos
De manière simple, le fonctionnement d’un moteur de recherche comprend trois étapes. Premièrement, celui-ci parcourt la multitude de ressources sur le web à partir du mot clé. Ensuite, le navigateur indexe les données récupérées, puis restitue les résultats à l’internaute. En termes plus techniques, la première étape est dite l’exploration ou le crawl. Au cours de cette étape, les robots, appelés crawlers, bots ou spiders, parcourent les bases de données du web, à travers tous les hyperliens qu’ils rencontrent, et récupèrent les ressources qu’ils jugent intéressantes. Notons au passage que chaque moteur de recherche possède son propre robot, disposant de sa signature particulière. Par exemple, le crawler de Google est signé Googlebot.
La deuxième étape du fonctionnement d’un moteur de recherche est dite, dans le langage technique, indexation des ressources. Durant cette phase, le moteur extraie les mots significatifs du corpus à explorer.

Google : moteur de recherche leader, incontesté et incontestable
Ces mots sont ensuite transcrits dans une base de données, à l’image de l’index terminologique d’un ouvrage. Au cours de ce processus, une valeur de poids, correspondant aux apparitions ou fréquence des termes, est attribuée aux mots significatifs. Ce poids est calculé à partir de la formule Tf-Idf. Et, dans la dernière étape, qui correspond à la restitution des résultats, le moteur de recherche présente le fruit de son travail par ordre de pertinence, présumée lors de l’indexation. Trois types de moteurs de recherche se distinguent durant cette étape : il y a ceux qui se contentent de comparer les mots avec ceux des documents. Ceux-ci affichent très vite leur limite face aux corpus volumineux. Puis, il y a ceux qui utilisent la formule Tf-Idf, en mettant le poids des mots en perspective ou en intégrant des pondérations comme les indices de notoriété.
Récemment, certains moteurs de recherche ont tenté d’introduire la technique d’analyse sémantique latente afin de fournir des résultats plus cohérents, et mieux en rapport aux requêtes des internautes. En plus de ces fonctionnements de base, les moteurs de recherches disposent aussi de correcteur orthographique, de lemmatiseur ou de réducteur de mot à leur lemme, d’antidictionnaire ou d'éliminateur de mots vides, pour améliorer la qualité des résultats qu’ils offrent.
Evolution des moteurs de recherche

Bing : un moteur de recherche essaie de se faire connaître
Les moteurs de recherche sont aujourd’hui de plus en plus performants. Les requêtes par mot-clé sont dépassées et la recherche sémantique apparaît comme la future méthode de travail. Cette dernière permet à l’internaute d’effectuer ses recherches directement en langue naturelle, ce qui est beaucoup plus conviviale et d’obtenir des résultats plus précis. Le fonctionnement de cette technique est simple : il associe les termes de la recherche à ses mots proches, par exemple la voiture avec le garage, la mécanique... et offre ainsi des résultats plus pertinents. Bien que cette méthode ne soit pas encore au point et continue d’être au stade de la tentative, elle s’annonce déjà comme le nouveau mode de référencement des moteurs de recherche. Notons que jusqu’ici Google arrive en tête des moteurs de recherche les plus utilisés, avec 60% des requêtes enregistrées. A la seconde place se situe Yahoo, avec 14% des recherches effectuées. Puis, il y a Baidu (le Google chinoi)s, qui accapare 5,4% du total, et Bing, le substitut de Live search, occupant 3,4 % des recherches effectuées sur le net.
Les moteurs de recherche emploient des technologies de plus en plus pointilleuses pour permettre des résultats toujours plus pertinents. Les outils sont nombreux pour des fonctions diverses. Apprenez à les maîtriser pour trouver tout ce que vous désirez !
Images :
www.iconarchive.com
YouTube, Bing, Google
[...] internet est conçue à partir de balises HTML, et ce sont ces dernières qui sont lues par les moteurs de recherche pour analyser la page. Il existe des balises pour chaque élément tel que le titre, le corps du [...]
[...] opportunité et ont fait des chiffres d’affaires très important. Mais aujourd’hui, les grands moteurs de recherche comme Google et Yahoo n’autorisent plus cette technique. Acheteurs et vendeurs sont alors [...]
[...] que plus de 200 critères sont pris en compte par le moteur de recherche pour ordonner les résultats, quelques points essentiels sont cependant à connaître. D’abord, [...]
[...] de webmarketing diront qu’un référencement ne se fait pas à coup de baguette magique. Les moteurs de recherche intègrent plusieurs paramètres pour indexer les sites Internet. Ainsi, seuls les professionnels [...]