toutpublic

google searchGoogle propose, à partir de son blog officiel, un article détaillé sur le fonctionnement de son célèbre moteur de recherche. Pour une recherche, il peut exister des milliers voir des millions de pages Web qui contiennent des informations potentiellement pertinentes liées à la requête de l’internaute. Comment Google prédit les résultats à vous proposer ? Le processus commence avant même que vous ayez saisi votre requête...

 

 

Les moteurs de recherche fonctionnent en trois temps. D’abord, l’exploration qui consiste à faire parcourir le Web par des robots pour collecter des informations sur les pages Web.  Puis, c’est l’indexation : les données sont analysées et classées dans des bases de données afin de permettre leur exploitation. Enfin, un internaute effectue une requête. Un algorithme est appliqué pour identifier dans l’index les sites qui correspondent le mieux aux mots-clés de la recherche.

Exploration et indexation

Les robots d'exploration (crawleurs) parcourent et organisent en permanence le contenu des pages Web et d'autres informations publiquement accessibles au sein de l'index de recherche Google.

Le processus d'exploration commence par une liste d'adresses Web issues d'explorations précédentes et de « sitemaps » ou (carte des sites) fournis par les « webmaster ». À mesure que les robots d'exploration de Google visitent ces sites Web, ils recherchent des liens vers d'autres pages à parcourir. L’algorithme accorde une attention particulière aux nouveaux sites, aux modifications apportées à des sites existants et aux liens non fonctionnels (pages 404, erreur 301 etc.).

Dès que les robots d'exploration détectent une page Web, les systèmes la visualisent, comme avec un navigateur. Google surveille certains signaux importants, comme les mots clés et le niveau d'actualisation des sites, qui sont enregistrés dans l'index de recherche Google.

L'index de recherche Google contient des centaines de milliards de pages Web et sa taille est bien supérieure à 100 millions de giga-octets. Il ressemble à l'index que l'on peut trouver à la fin d'un livre, à la différence près qu'il recense chaque mot de chaque page Web. Lorsque le robot indexe une page Web, il l'associe aux entrées de tous les mots affichés sur la page.

Algorithmes de traitement des recherches :

Google utilise les algorithmes de recherche de différentes manières :

  • Analyse des termes de recherche
  • Recherche de correspondances
  • Classement des pages selon leur utilité
  • Prise en compte du contexte
  • Affichage des meilleurs résultats

moteur de recherche cours

Des réponses qui évoluent en permanence

Les algorithmes sont affinés en permanence par des milliers d'ingénieurs qui inventent de nouvelles méthodes de recherche. En effet, le Web évolue constamment, avec des centaines de nouvelles pages publiées chaque seconde. C’est la raison pour laquelle Google explore en permanence le Web pour indexer les nouveaux contenus.

En fonction de votre requête, certaines pages de résultats changent rapidement, tandis que d'autres restent stables. 

En conséquence, beaucoup d’entreprises essaient de se positionner en tête des résultats de recherche. D’ailleurs, des nouveaux métiers spécialisés dans l’optimisation du référencement (référencement SEO ou  Search Engine Optimisation) sont apparus depuis plusieurs années. Certaines entreprises  choisissent de payer pour apparaître en haut des résultats de recherche  via des « liens sponsorisés » ou « annonces ».

L’optimisation du référencement

Le référencement naturel ou SEO (Search Engine Optimization) permet d’améliorer le classement d’un site web dans les résultats de recherche. Pour cela, les éditeurs doivent notamment bien choisir les mots-clés dans leur contenu rédactionnel et les placer à des endroits stratégiques. Le référencement naturel est à distinguer du référencement payant des annonces et les liens sponsorisés. 

google seo

Comme beaucoup de moteur de recherche, de nombreuses données personnelles sont collectées au fil des navigations sur le Web (identifiants, recherches, cookies, etc.) et peuvent ensuite être utilisées à des fins commerciales ou malintentionnées. Pour éviter cela, pensez à paramétrer votre navigateur internet en suivant ces quelques conseils.

Ces informations sont aussi disponibles en cliquant sur le lien “information consommateur” placé en bas de chaque page de la recherche Google.

Plus d’informations sur : https://www.google.com/search/howsearchworks/

Aucun commentaire

Devenir Membre

Pour vous informer sur l'école numérique (Tice), les applications pédagogiques, les outils, le codage, l'algorithmique, les objets connectés... Totalement Gratuit !

S'inscrire

Sauvegarder
Choix utilisateur pour les Cookies
Nous utilisons des cookies afin de vous proposer les meilleurs services possibles. Si vous déclinez l'utilisation de ces cookies, le site web pourrait ne pas fonctionner correctement.
Tout accepter
Tout décliner
Essential
Ces cookies sont nécessaires au bon fonctionnement du site, vous ne pouvez pas les désactiver.
session
Accepter
Analytics
Outils utilisés pour analyser les données de navigation et mesurer l'efficacité du site internet afin de comprendre son fonctionnement.
Google Analytics
Mesure d'audience
Accepter
Décliner