icon/dark/fileicon/dark/foldericon/dark/folde-openicon/dark/hashtagicon/dark/line-graphicon/dark/listicon/dark/localicon/dark/lock

J'ai un rêve pour le Web dans lequel les ordinateurs deviennent capables d'analyser toutes les données sur le Web

- Tim Berners-Lee, inventeur du World Wide Web, 1999

Fin 2016, WooRank a publié une liste des tendances en matière de référencement où vous pouvez remarquer un lien commun entre les sujets : la recherche conversationnelle, l'intention de recherche, le traitement du langage naturel et l'intelligence artificielle (ou l'apprentissage automatique, machine learning en anglais). Dans cet article, nous aborderons comment les robots deviennent vraiment intelligents et, dans le cas de Google, comment ils commencent à comprendre le contexte.

Le résultat de ces avancées s’appelle le "web sémantique".

L'Internet d'antan

Avant le balisage sémantique, l'Internet se composait d’un tas de fichiers différents reliés par des liens. Ces liens relient les fichiers les uns aux autres, ce qui facilite la référence et la navigation. Ces fichiers sont généralement des pages Web, mais peuvent être également des fichiers PDF, jpegs, vidéos ou tout autre type de fichier. C'est la structure de base de l'Internet.

Fonctionnement traditionnel du Web

Les moteurs de recherche fonctionnent en utilisant ces liens pour se déplacer d'un site à un autre site et d'une page à l'autre, en parcourant ces pages et en les stockant dans leurs bases de données, appelées «index». Lors de l'exploration et l'indexation des pages, les moteurs de recherche lisent leur code pour comprendre ce qui est une image, ce qui est un titre, ce qui est un sous-titre, ce qui est une vidéo et ce qui est une copie normale d’un texte. Ces informations sont également stockées dans l'index et utilisées pour déterminer la pertinence de la requête de recherche d'un utilisateur.

Évidemment, la pertinence n'est pas le seul facteur déterminant lorsqu'il s'agit de montrer un résultat de recherche. Les moteurs de recherche regardent également les liens pointant vers un site et utilisent leurs divers éléments (hypertexte et linking domain, entre autres) pour calculer l'autorité d'un site et sa popularité. Le linking domain et les hypertextes étaient les indices sur les mots et pages des sites reconnus pour leur autorité.

Donc, cela nous amène aux mots-clés et aux liens, dont vous êtes probablement très familiers. Les moteurs de recherche s’appuyaient sur des mots-clés ou des expressions qui correspondaient au code et au contenu des mots de la requête de recherche. Les moteurs de recherche déterminaient alors la pertinence de la requête en fonction de la fréquence à laquelle ces mots clés apparaissent sur la page. Ils utilisaient alors des liens pointant vers une page et un site pour mesurer l'exactitude et l'autorité de cette page. C'est une explication très simple du fonctionnement, mais nous sommes sur le point de changer tout cela.

optimisez votre traffic

L'essor du Web sémantique

Ce système fonctionnait assez bien, mais était insuffisant lorsque les gens recherchaient des renseignements plus spécifiques, plus précisément des réponses aux questions. Pour utiliser le célèbre exemple de Gary Illyes, prenez quelqu'un qui cherche un guide pour gagner aux jeux vidéo sans les codes de triche. Google a vu "sans" comme un stop word, (mot non pris en compte dans les recherches) ce qui signifie qu'il l'a ignoré, donc "comment gagner aux jeux vidéo sans les codes de triche " a été transformé en "comment gagner aux jeux vidéo codes triches ", qui est exactement le contraire de ce que la requête originale essayait de trouver.

Ainsi vient le web sémantique. Qu'est-ce que le Web sémantique ?

Eh bien, puisque nous parlons de sémantique, nous allons commencer par aborder plusieurs définitions. Tout d'abord, que signifie «sémantique» ?

La sémantique est une branche de la linguistique qui étudie les signifiés, ce dont on parle, ce que l'on veut énoncer. Sa branche symétrique, la syntaxe, concerne pour sa part le signifiant, sa forme, sa langue, sa graphie, sa grammaire, etc ; c'est la forme de l'énoncé.

- Wikipédia

Selon Merriam-Webster, la sémantique est «l'étude des significations».

Ainsi, lorsque cette étude de la signification est appliquée au contenu Web, nous obtenons le web sémantique :

Le Web sémantique fournit un cadre commun qui permet de partager et de réutiliser les données entre les frontières des applications, des entreprises et des communautés

- World Wide Web Consortium

Qu'est-ce que cela veut dire ?

Pour simplifier, le Web sémantique est un moyen de relier des idées, également appelées entités, et des morceaux de données, pas seulement des fichiers et des pages Web. Ces liens permettent aux programmes, comme les moteurs de recherche, d'explorer au-delà des mots sur une page les idées et les concepts derrière eux. Prenez cette phrase simple par exemple:

"Je suis né au Michigan et je suis un résident de Bruxelles."

Avant le web sémantique, il n'y avait pas moyen d'aider les moteurs de recherche à relier les mots de cette phrase à leur signification: qui suis-je (pour ne pas trop être cartésien ici), qu'est-ce que le Michigan et qu'est-ce que c’est Bruxelles?

Désormais, grâce au Web sémantique, il y a une meilleure façon de le faire : les données structurées (également appelées balisage sémantique). Cette méthode aide les robots à analyser cette phrase avec quelques bits de HTML :

<div vocab="http://schema.org/” typof=”Person”> 
    <span property="name”>Greg Snow-Wasserman</span> was born in
        <span property="birthPlance” typeof=”Place” href=”https://www.wikidata.org/wiki/Q1166”>
            <span property="name”>Michigan</span> and is a resident of
        <span property="homeLocation” typeof=”Place” href=”https://www.wikidata.org/wiki/Q240”>
            <span property="name”>Brussels</span>       
        </span>
</div>

Cette phrase, seulement compréhensible par les humains auparavant, a désormais un sens pour les machines.

En d'autres termes, le web sémantique évolue d'un réseau de pages liées à un réseau de données liées, représentant des significations, des idées et des concepts qui sont derrière ces données.

Pour récapituler, voici comment l'ancien réseau connectait les idées, à travers des sites liés :

Fonctionnement traditionnel du Web

Et voici à quoi cela ressemble avec le web sémantique, des idées via les données liées :

web sémantique et les idées via les données liées

Comment a changé la recherche sur le web sémantique

En tant qu'êtres humains, nous voyons tout le balisage sémantique qui donne un sens aux mots sur la page, mais cela a eu et continue d'avoir un impact majeur sur les moteurs de recherche, offrant ce que nous appelons la recherche sémantique.

Hummingbird: moteur Google comme des réponses

En Septembre 2013, Google a annoncé une nouvelle mise à jour de son algorithme pendant un mois. Cette mise à jour, appelée Hummingbird (colibri en anglais, car il a été conçu pour être "rapide et précis») a donné à Google la possibilité d'appliquer le web sémantique aux demandes et résultats de recherche sur le Web.

Hummingbird analyse la sémantique des requêtes de recherche pour déterminer l'intention qui se trouve derrière eux. Revenons à notre exemple précédent, "comment gagner aux jeux vidéo sans les codes de triche". Hummingbird ne voit plus «sans» comme un Stop word et peut en déduire que l'utilisateur cherche vraiment un guide pour le jeu ou d'autres guides de stratégie et non pas comment activer le mode "dieu".

Grâce à sa précision, Hummingbird trouve les parties de contenu qui correspondent à cette intention et les propose à l'utilisateur.

Notez que dans l'utilisation du mot «contenu» dans ce cas, il y a un changement significatif par rapport à l'ancien système qui a proposé la page considérée comme la plus pertinente pour les mots clés de la requête.

Avez-vous envie de le tester ? Vérifiez le positionnement des résultats de la recherche "what’s link juice" ( qu’est ce le jus de lien ou jus de référencement en français)

rich snippet de What is link juice

Google a été en mesure d'interpréter le sens de l'application (trouver la définition de "jus de lien") et a trouvé un paragraphe sur une page web qui répond à cette question.

RankBrain renforce le moteur de recherche

Notre objectif est de créer un Google personnalisé pour chaque utilisateur

- Sundar Pichai, PDG de Google

Comment fonctionne Google pour trouver les intentions de recherche et les pièces individuelles qui correspondent à cet objectif ? Il utilise RankBrain, son système d’apprentissage automatique et d’intelligence artificielle. Beaucoup de gens (y compris nous, parce que parfois c’est plus facile) parlent de RankBrain comme si c’était un algorithme, mais ce n’est pas tout à fait vrai.

optimisez votre traffic

Même si nous savons que cela est très important en ce qui concerne le classement dans les résultats de recherche, le classement n’est pas sa fonction principale. Il est plutôt un algorithme d'interprétation. En effet, c’est Hummingbird qui déduit ce que «sans» signifie dans la requête sur les jeux vidéo et se connecte à une page qui fournit un guide. C’est également la partie qui lit la demande "quelle est la taille de la terre", et en déduit que nous recherchons la circonférence de la Terre.

requête taille de la terre

Développements

Comme vous pouvez probablement le deviner, le développement du Web sémantique peut avoir un impact assez profond sur l'optimisation des moteurs de recherche et le marketing digital en général. Le SEO va, à certains égards, devenir beaucoup plus complexe, tandis que d'autres aspects seront un peu plus simples. Cependant, une chose est sûre, le web sémantique est là pour rester. Restez à l'écoute,dans la prochaine partie de notre série web sémantique, nous vous apprendrons à accueillir nos nouveaux maîtres : les robots !