Imprimer

Google interprête-t-il mes requêtes ?

Écrit par Raphaël Richard. Posted in Outils

L'un de mes amis me demande pourquoi lorsque l'on recherche son site, il voit apparaitre des sites sans relation en 2eme ou 3eme page. Dans la réponse que je lui ai faite, je donne quelques précisions sur l'évolution du système d'interpretation des recherches par Google entre 2011 et 2013.

Voici telle qu'était formulée la question.

Quand on recherche "Jamesedition" sur Google. La première page est nickel.
Mais la deuxième... part sur des "James" qui n'ont rien à voir. Alors qu'avant c'était clean. Ca parlait de Jamesedition dans nos multiples médias.
D'ou ca peut vient venir à ton avis?
 
Précision de l'auteur: j'ai remplacé le nom du site de mon ami par le nom d'un autre site qui générent la même anomalie chez Google. Mon ami ne gére donc pas Jamesedition, mais un autre site.

Ma réponse

Je ne suis pas certain d'avoir compris ta question car sur mon google, la deuxième page fait apparaitre des resultast "jamesedition" et c'est seulement a partir de la 3eme page que l'on voit apparaitre du "james" quelquechose.
En partant que du principe que c'est sur mes résultats troisième page que porte ta question, voici ma petite vision des choses.

En 2011, lorsque j'ai réalisé l'étude "Google décodé", Google interprétait les chaines de caractères avant de lancer une recherche par mot clé dans son index. C'est a ce moment qu'il a commencé à repérer les fautes de typo, en proposant de les corriger et de lancer une recherche sur la version corrigée, puis en substituant de plus en plus souvent les résultats "version corrigée" aux résultats "version avec faute de typo".

  L’évolution est presque complétement arrivée à son terme: Google corrige ta "faute" et te propose un page de résultats avec la version corrigée et te propose de lancer 'via un petit lien' une recherche sur le mot clé que tu as effectivement demandé. Tape Jameseditionn par exemple. Ce sont les résultats pour Jamesedition qui arrivent d'abord.
Et ensuite, si tu cliques sur le lien "Essayez avec l'orthographe jameseditionn", tu tombes sur une encore sur une page avec recherche interpretée (James Edition).
Ce n'est qu'en lançant une recherche sur +jameseditionn que tu auras le resultats sur "jameseditionn".

Pour revenir a ton cas, je pense que l'on est sur un cas intermédiaire: d'abord des recherches sur Jamesedition exact, puis sur des variations autour de la chaine de caractère jamesedition.

Pour terminer, je pense que les mots clés commençant par des prénoms courant sont traités de façon spécifiques et déclenche plus facilement des corrections.

Estime toi heureux, car pour certains mots ou prénoms rares (Shauen, par exemple), Google ne fonctionne plus du tout. Shauen et Krista  Trump sont cités sur plusieurs pages indexées par Google.

Mais tu peux taper shauen ou + shauen, tu ne verras pas ces pages n'apparaissent pas.

Elles n'apparaitront que quand tu taperas "Shauen and Krista Trump"

L'extrait de Google décodé auquel je fais référence.

 

Nous venons de comprendre d'où venaient les informations contenues dans les gigantesques bases de données Google. Mais cela ne répond pas à la cruciale question de l'ordre d'apparition des sites dans les pages de résultats: pourquoi un site apparaît-il avant les autres ?

 

Denombreuxinternautesseposentlaquestionetaimeraitquelaquestionserésumeàdeuxoutroispoints.

 

Malheureusement,laréponseestcomplexe

 

Nonseulement,Googleutiliseplusieurscentainesdecritèresdeclassementtelsquel'âgedusite,lenombrederépétitionouleslienspointantverslesite,mais,enplus,cesdifférentscritèresévoluentavecletempsetpeuventinteragiraveclesunsaveclesautres.

 

Pourcomprendrecequiapparaîtsurunepagederésultat,ilfautcomprendre5pointsclés:

 

  • Letraitementd'unerequêteenfonctiondumotclé

  • Lescritèresdeclassementdits« Onpage »

  • Lescritèresdeclassementliésaucontenudusite

  • Lescritèresdeclassementliésaulienspointantverslesite

  • Lescritèresdeclassementliésàlaconfiance

  • Lescritèresdeclassementliésàl'autorité

 

Le traitement d'une requête en fonction du mot clé

 

Afin d'interroger sa base de données à la recherche de pages web pertinentes, Google analyse les mots clés tapés par l'internaute.

 

Filtrage linguistique

 

L'un des premiers tests réalisés par Google lorsque la requête est saisie est le test de langue. Google détecte la langue du mot clé et fait apparaître en priorité, les documents correspondant à cette langue. Si le mot clé est un mot clé d'une langue étrangère, mais que des pages web comprenant ce mot clé existent dans la langue du chercheur (le français, par exemple), Google fera apparaître une page composée de quelques pages en français qui contient le mot clé étranger, puis, dans une seconde partie de la page, les pages web pertinentes en langue étrangère.

 

Correction orthographique

 

Google est capable de reconnaître les fautes d'orthographe les plus courantes. Lorsqu'il détecte ce qu'il estime être une faute d'orthographe dans le texte, il peut réagir de 4 façons différentes:

 

Il affiche d'office les résultats qui devraient s'afficher si la requête avait été tapée sans faute d'orthographe,

 

Il affiche une page de résultats composée de pages web contenant le mot clé sans faute d'orthographe, mais aussi de pages web contenant le mot clé avec faute d'orthographe,

 

Il affiche une page de résultats composée de pages web contenant le mot clé avec faute d'orthographe mais affiche un lien en haut de la page qui permet de lancer une requête sur

 

Google peut coupler un filtrage linguistique avec une correction orthographique.

 

Exemple: lorsque l'on effectue une recherche sur le mot « shauen », version mal orthographiée du verbe allemande « schauen » (regarder), Google affiche une page composée de trois résultats

 

1°) Suggestion d'une recherche sur la version correctement orthographiée

 

2°) Affichage de pages francophones contenant la bonne orthographe (en l'occurrence des fiches produits contenant le mot clé bien orthographié « Schauen »)

 

3°) Affichage de pages d'autres langues autres que le français et l'allemand, contenant la version mal orthographiée.

 



 

Recherche exacte ou élargie

 

Lorsqu'une requête composée de plusieurs mots clés est tapée, Google peut interroger de trois façons différentes sa base de données en lançant alternativement une recherche sur:

 

  • Les documents qui contiennent l'expression exacte recherchée: les documents doivent contenir au moins une fois tous les mots clés, dans l'ordre exact où ils ont été tapés par l'internaute. Google active cette recherche pour les expressions de recherche qui se retrouvent à l'identique sur des milliers ou millions de documents sur le web,

  • Les documents qui contiennent tous les mots clés de la recherche, mais pas nécessairement dans les dans l'ordre, ni au même endroit du texte. Google active cette option pour les expressions qui se trouvent à l'identique sur un faible nombre de document sur le web.

  • Les documents qui contiennent certains des mots clés tapés, mais pas tous. Google active cette option lorsqu'il ne trouve aucune page sur le web qui contiennent tous les mots clés.

 

Détection d'expression cachée

 

Lorsqu'un internaute oublie de séparer les deux mots clés d'une expression de recherche (ex: lapinchasseur), Google le détecte dans la plupart des cas et suggère de lancer une recherche sur la version avec séparation (ex: lapin chasseur).

 

Mais Google n'affiche pas les résultats qui devraient s'afficher lors d'une recherche sur l'expression corrigée avec séparation. La logique de sélection des résultats est peu claire.

 

Détection du type de recherche

 

En plus des tests précédents, certains mots clés correspondent à des cas de figure bien précis reconnus par Google.

 

Ainsi, lorsqu'un internaute effectue une recherche sur une personne, en tapant son prénom et son nom, Google est très souvent capable de reconnaître qu'il ne s'agit pas d'une recherche ordinaire, probablement grâce à une base des prénoms les plus courants. Google est ainsi capable de corriger une faute d'orthographe sur un prénom lorsqu'il détecte une recherche de personne.

 

Lorsqu'un internaute effectue une recherche de commerce tel qu'un restaurant, Google affiche souvent des résultats issus de sa base de données Google Adresses, un service à mi chemin entre un annuaire d'entreprise et un service de cartographie. Dans ce cas, Google insère au milieu des pages web classiques, de 2 à 8 résultats issus de Google Adresses ainsi qu'une carte dans la colonne de droite.

 

Il existe de très nombreux autres cas qui déclencheront l'affichage de modules spécifiques au sein de la page de résultats. La liste de ces cas est indiquée dans la suite de l'étude.

 

Extraction de mots clés

 

Lorsqu'une requête est composée de mots clés anormaux ou rares qui renvoient très peu de résultats dans sa base de données , Google effectue une interprétation:

 

  • il recherche tout d'abord si le mot contient une faute d'orthographe courante ou une faute de frappe: si tel est le cas, il affiche alors d'office les pages web correspondant à la version bien orthographiée, en signalant qu'il a corrigé le mot clé mais sans donné le choix à l'internaute,

  • il tente, ensuite, de comparer, les mots inhabituels à une base de mots proches (variant souvent d'une lettre). Si le test est négatif, Google indique qu'il n'a aucun résultat. Si le test est positif, Google indique qu'il n'a aucun résultats et propose une recherche sur le mot clé approchant dans sa base de données.

 

Une fois ces différentes opérations de filtrage réalisées, Google interroge sa base de données de pages web pour remplir la page de résultats qui correspondent le mieux possible au mot clé demandé.