Retour Lexique

Index

Un index, qu’est-ce que c’est ?

L’index d’un moteur de recherche est un système qui recense et stocke toutes les pages web de tous les sites internet que ses robots d’exploration visitent. L’index fait office de copie du web à un instant T qui sert à délivrer les résultats de recherche les plus adaptés aux requêtes des internautes.

Index - Photo de dossiers bien rangés

Google, Bing, Yahoo, tous les moteurs de recherche disposent de leur propre index et proposent des méthodes d’indexation et de référencement naturel différentes. 

L’index, comment ça marche ?

L’index fait office de place centrale pour les ressources apportées par les crawler. Par exemple Googlebot, le robot d’exploration de Google, crawle le web en permanence. Sa navigation de site en site lui permet de collecter des données toujours plus récentes, et les envoyer vers l’index. Ces données sont ensuite copiées puis stockées sur des millions de serveurs. 

Lorsqu’un internaute fait une recherche Google, le moteur de recherche va consulter son index pour apporter des réponses adaptées à sa requête. Ce processus fonctionne en simultané avec un index inversé, un système à part qui facilite ce travail en analysant le contenu et les mots clés des pages web. 

Depuis 2003, Google utilise 2 index. Un index principal qui stocke les pages web les plus qualitatives, et un secondaire qui contient les pages avec des contenus de moins bonne qualité. On y retrouve également les pages avec du contenu dupliqué. 

Tout ce processus d’indexation est fastidieux, c’est pour cela qu’optimiser son site internet est important. Travailler le SEO d’un site web permet de faciliter le travail des robots d’exploration (spider), l’indexation de vos pages et le référencement naturel de votre site. Les crawlers font attention à tous les détails pour hiérarchiser les résultats dans les SERP. Le contenu ainsi que les expressions et les mots-clés sont bien sûr extrêmement importants car le texte est la matière première d’une page web. Chaque balise méta de chaque page est à travailler comme la méta title ou la méta description. Tout l’aspect technique comme les liens ou les performances influencent également le jugement des robots. C’est le travail d’une agence de référencement de faire en sorte qu’un site plaise au mieux aux robots d’indexation.