icon/dark/fileicon/dark/foldericon/dark/folde-openicon/dark/hashtagicon/dark/line-graphicon/dark/listicon/dark/localicon/dark/lock

Le SEO a pour but de vous aider à vous classer plus haut dans les résultats de recherche Google. Cependant, le succès de votre SEO dépend d'une seule chose : la façon dont Google indexe votre site.

Vous pourriez avoir le site Web le plus rapide avec le meilleur contenu, si Google ne l'indexe pas, personne ne le verra.

Alors, comment savoir si Google indexe vos pages et que pouvez-vous faire si ça n’est pas le cas ?

site-crawl-cta

Qu’est-ce que l’index Google ?

La meilleure analogie pour comprendre le fonctionnement des moteurs de recherche est probablement celle de la bibliothèque. Si vous recherchez des livres sur un sujet particulier, vous utilisez le catalogue de la bibliothèque :

Google fonctionne essentiellement de la même manière. Lorsque vous cherchez quelque chose sur Google, vous ne cherchez pas vraiment sur le Web, vous cherchez dans le catalogue de Google. Google renvoie les résultats qu'il juge pertinents pour votre requête sous la forme de pages de résultats.

Google construit son index en cliquant sur les liens présents sur le Web (exploration), en enregistrant les informations recueillies sur les pages sur lesquelles il a atterri et en stockant ces informations dans son index (indexation).

Voilà pourquoi il est essentiel que votre site soit explorable et indexable pour avoir un bon référencement. Peu importe la qualité de vos pages, si elles ne figurent pas dans le catalogue, Google ne pourra pas les afficher.

Votre site est-il indexé ?

Il existe plusieurs façons de vérifier si votre site a été indexé. Pour les membres Pro et Premium WooRank, votre Rapport Avancé inclus le critère “Pages découvertes”. Ce critère correspond au nombre de pages que nous avons trouvées dans l'index de Google.

Vous pouvez vérifier “l'État d’indexation” dans Google Search Console :

Vous pouvez aussi utiliser les opérateurs de recherche. Effectuez la recherche suivante dans Google “site:example.com" (en remplaçant "example.com" par votre site). Cela vous donnera une idée approximative de la quantité de pages que Google a indexées pour votre domaine.

Enfin, vous pouvez vérifier l’état d’indexation de certaines pages en utilisant l’opérateur de recherche “cache:page”. Il suffit de rechercher une page individuelle avec "cache:" devant (sans espaces !). Ainsi vous pourrez visualiser la version la plus récente de la page que vous avez spécifié telle qu'elle est indexée par Google.

Qu'est-ce qui peut empêcher Google d'indexer vos pages ?

Vous avez vérifié votre Rapport Avancé (ou votre rapport d'état d’indexation), et vous constatez que celui-ci montre beaucoup moins de pages que vous n’en avez sur votre site. Vous avez un problème d’exploration et/ou d'indexation. Quelles sont les causes de ce(s) problème(s) ?

Vous n’allez pas aimer la réponse qui suit : les causes peuvent être très variées. Et bon nombre d'entre elles sont techniques.

Mais voici une réponse que vous aimerez : vous n’avez pas à faire de recherches compliquées pour le découvrir. Vous avez juste besoin d'un bon outil d’exploration SEO. Et vous savez quoi ? Le Site Crawl de WooRank peut vous aider à identifier les origines techniques de vos problèmes.

Dites à Google ce qu’il ne doit pas indexer

Certains éléments sur votre site - ou sur certaines de vos pages - permettent d’indiquer à Google d'ignorer une page. Le problème pourrait venir du fait que votre fichier robots.txt a exclu une page ou un dossier par accident ou que vous ayez ajouté accidentellement une balise "NoIndexed" à une page.

Pour retrouver ces pages, ouvrez l’outil Site Crawl dans votre Rapport Avancé et accédez à la section "Indexation". Cette section vous montrera les pages :

  • Interdites par le fichier robots.txt
  • Qui ont une étiquette NoFollow
  • Qui sont hébergées sur une version non canonique de votre URL (nous reviendrons sur ce sujet plus tard)

Site Crawl vous indiquera également si une page non indexable apparaît dans votre Sitemap. Le Sitemap permet d’indiquer à Google les pages à explorer, par conséquent ne pas avoir sa page listée dans le Sitemap rend la tâche beaucoup plus difficile pour Google.

Cependant, le fichier robots.txt et l’étiquette nofollow ne sont pas les seules façons que vous avez de dire à Google de ne pas indexer votre contenu.

Les balises canoniques permettent de préciser aux moteurs de recherche la version originale d'une page, sa version «canonique». Ces balises aident à traiter les contenus dupliqués et à consolider le “link juice”.

Si vous n’utilisez pas bien vos balises canoniques, il se peut que Google n’explore pas la page que vous souhaitez indexer.

Les problèmes canoniques pouvant faire qu’une page ne soit pas indexée sont les suivants :

  • Des balises liées à des pages cassées
  • Plusieurs balises canoniques sur une seule page
  • Des URL canoniques qui ne correspondent pas aux URL dans votre Sitemap

Site Crawl identifiera ces instances et vous aidera à trouver où vos balises canoniques indiquent à Google de ne pas indexer une page.

Vos pages ou vos liens sont brisés

Si une page ne se charge pas, elle n'est pas indexée. Et puisque Google trouve de nouvelles pages en suivant des liens, un lien brisé signifie que Google sera moins susceptibles d'explorer la page de destination. C'est pourquoi l'analyse fournie par Site Crawl comprend une liste des pages qui renvoient des erreurs HTTP qui empêchent Google d'accéder à celles-ci :

  • 5xx : les serveurs renvoient généralement ce type d’erreur quand ils rencontrent une erreur provenant du serveur. Ces erreurs incluent des problèmes de temps d’attente (time-out) et de surcharge des serveurs.

  • 4xx : les serveurs renvoient des codes d’erreur de ce type lorsque le client (le navigateur Web) fait une demande non valide. L'erreur 404 not found est l'erreur la plus connue de cette catégorie.

  • 3xx : les codes de type 300 indiquent une redirection. Ce ne sont techniquement pas des erreurs, mais une utilisation incorrecte fera que Google n'atteindra pas certaines pages. Les URL qui redirigent vers des URL brisées ne seront évidemment pas indexées, mais Google pourrait également décider de ne pas indexer des pages dans des boucles de redirection. Si Google se retrouve dans une boucle de redirection, il ne pourra pas explorer ou indexer une page.

Vous avez des problèmes de SEO on-page

La mission de Google est de fournir les meilleurs résultats de recherche en fonction de la requête d’un l'utilisateur. Donc, Google n'a pas intérêt à garder dans son index les pages qu'il perçoit comme étant de mauvais résultats de recherche. L'un des plus gros problèmes on-page empêchant une page d'être indexée est le contenu dupliqué.

Vous savez probablement si votre site présente l’un des exemples les plus évidents de contenu dupliqué : le plagiat. Mais vous pouvez aussi créer des pages dupliquées sans le savoir, par accident. Heureusement, Site Crawl vous permet d’identifier ces pages dupliquées, ainsi que les pages non dupliquées pouvant présenter une forte ressemblance.

Consultez la section “erreurs de contenu body”, afin de trouver les pages que Site Crawl a identifié comme ayant un contenu dupliqué. Ces problèmes peuvent provenir des tris de listes, de la pagination ou d'autres paramètres d'URL dynamiques, et peuvent être corrigés à l'aide de l'outil “Paramètres d’URL” de Google et/ou grâce aux balises canoniques.

Cependant, vous pouvez également avoir des pages avec un contenu différent mais qui se ressemblent. Pourquoi ?

  • Balise titre : les titres de page sont une introduction à ce qui se trouve sur une page. Et puisque chacune de vos pages a un contenu unique, Google pourrait percevoir les titres en double comme des signes de contenu copié.

  • Meta description : tout comme les titres, chaque page devrait avoir une description unique pour un contenu unique.

Jetez un oeil aux pages ayant des titres ou des descriptions en double. En fonction du nombre de copies que vous trouverez, vous pourriez avoir un problème de template ou tout simplement vous être un peu emporté avec le copier/coller…

Être indexé est très important !

Si vous avez des difficultés à indexer vos pages, réalisez une exploration de votre site pour en trouver les causes. Identifier les problèmes qui empêchent Google de trouver et d’indexer vos pages est l’étape numéro 1 pour obtenir un bon référencement dans les résultats de recherche.

Si vous avez un nouveau site et que vous souhaitez que Google le trouve facilement, jetez un oeil à notre guide pour une meilleure indexation (disponible en anglais pour le moment).