Catégorie: Actualités
Site indépendant sans témoin espion

Se servir des moteurs de recherche

Pour qu’un moteur de recherche soit efficace il faut que l’internaute sache comment faire sa recherche. Il faut aussi que ceux qui construisent des sites internet sachent comment indexer les pages qu’ils publient. Il y a une multitude de sites internet très intéressants que personne ne visite jamais car ils ne respectent pas les normes pour que les moteurs de recherche les indexent.

Faire une recherche

Les résultats de recherche dépendent de 2 facteurs: les termes de la requête et les pages qui ont été indexées par le moteur de recherche pour cette requête.

Si je cherche histoire de Lanaudière le moteur va aller voir dans son index pour trouver toutes les pages où ces 3 mots sont dans le texte de la page (8.990.000 résultats sur Google). Pour histoire Lanaudière il n’y a plus que 1.180.000 résultats et pour Lanaudière histoire j’ai 767.000 résultats. Les termes de la requête et leur ordre modifient les résultats.

Si je cherche « histoire de Lanaudière » entre guillemets il y a seulement 58.000 résultats car je cherche l’expression exacte, la liste de résultats est beaucoup mieux ciblée. Pour « histoire de Lanaudière » 1800..1850 il n’y a plus que 10.300 résultats.

Les chiffres varient d’un jour à l’autre, ils sont approximatifs.

Recherche histoire de Lanaudière

Apprendre à maîtriser quelques opérateurs et comprendre la théorie des ensembles permet d’utiliser efficacement l’algorithme des moteurs de recherche pour trouver ce qu’on cherche. La case de recherche est une machine à calculer à laquelle il faut donner les bonnes instructions.

L’ordre des résultats de la recherche

Selon la requête les résultats sont mieux ciblés et l’ordre des résultats est différent. Mais ce sont toujours quelques mêmes sites qui arrivent les premiers dans la liste. Pourquoi eux et pas les autres?

C’est parce que la plupart des gens qui créent des sites internet ne savent pas les indexer normalement. Et c’est bien malheureux parce qu’il y en a beaucoup de très intéressants.

Le site montrealbb.ca est toujours bien classé pour ces recherches et pourtant je ne suis pas le seul à écrire sur l’histoire de Lanaudière. Le site de la Société d’Histoire de Joliette de Lanaudière devrait normalement être classé en premier mais ce n’est pas le cas; en plus le texte de sa description ne donne pas envie de cliquer pour aller voir sa page.

La société d'Histoire de Joliette de Lanaudière

Indexer son site dans les moteurs de recherche

Sans entrer dans les détails techniques on remarque que sur mon site il y a une page intitulée Histoire de Lanaudière qui regroupe tous les articles que je publie sur ce sujet. Si je veux faire connaître mon site je sais que c’est une requête qui peut y amener des visiteurs potentiels et j’ai créé une page pour y répondre.

Histoire de Lanaudière

Les mots histoire et Lanaudière sont dans le titre de cette page et dans son URL; ils sont repris dans le texte du court paragraphe ainsi que dans les métadonnées destinées aux robots (balises title et description). Ce sont les mots-clefs que je voulais indexer, j’ai fait mon travail en suivant les instructions des moteurs de recherche et le résultat est garanti.

Quand le moteur de recherche doit trier des milliers de pages de résultats il fait un calcul sur les mots de la requête. Si ils sont dans le titre d’une page et qu’ils ont été mis en valeur dans le reste du texte la page obtient le score maximum; si il sont seulement quelque part dans le texte comme des mots ordinaires le score est très bas.

Dans le code HTML chaque balise a une valeur sémantique et les titres sont les plus importantes. Mettre un mot en italique signifie le mettre en valeur (balise <em> emphase), mettre un mot en gras signifie lui donner une valeur sémantique forte (balise <strong>). Le robot d’indexation donnera du poids à ces mots et le robot de lecture automatique mettra de l’emphase en les lisant. Si les balises sont mal utilisées les robots ne comprennent plus.

La bonne (ou mauvaise) réputation d’un site

SHJL

Le site de la Société d’Histoire de Joliette de Lanaudière était mieux classé que le mien pour la requête histoire de Lanaudière, c’est normal c’est sa raison d’être. Mais depuis au moins 6 mois son site a été piraté pour diffuser des pages de spam. Comme ses responsables ont tardé à réagir le site a été sanctionné par les moteurs de recherche et son score baisse dans la liste des résultats.

Avoir bonne réputation influence le classement.

Les moteurs de recherche comprennent les sites qu’ils indexent, ils sont intelligents. Si on écrit sur l’histoire et qu’on publie des niaiseries pleines de fautes d’orthographe et de texte copié/collé, le moteur de recherche va vite le savoir et traiter le site en conséquence.

Si au contraire on écrit des articles que les visiteurs envoyés par le moteur de recherche lisent et que ces visiteurs reviennent en lire d’autres, notre réputation augmente. Quand d’autres sites créent des liens vers le notre elle monte encore plus.

Le fonctionnement de l’index des moteurs

Les moteurs de recherche sont des bases de données; ce sont aussi des obsédés textuels. Les robots parcourent la toile en recensant tous les mots de toutes les pages et en donnant une valeur sémantique à chaque mot; un mot dans le titre de la page pèsera plus lourd. Plus on écrit de mots plus on est présent dans l’index.

Chercher sur internet

L’index des moteurs de recherche recense toutes les requêtes faites par les internautes et il leur fait correspondre une liste de réponses classée, continuellement remise à jour. La réponse est instantanée, il n’y a pas de calcul à faire. Si une requête inédite est faite un calcul très rapide trouve le résultat.

D’autres critères influencent le calcul de l’algorithme: l’historique de recherche de l’internaute et sa localisation en particulier.

Travailler avec (ou contre) les moteurs de recherche

Sans les moteurs de recherche mon site internet ne serait accessible qu’à mes amis. Pour rejoindre un public plus large j’ai besoin d’eux; je dois leur faciliter la tâche.

Le site internet de la Société d’Histoire a été refait fin décembre et il semble que le piratage ait été corrigé. On peut vérifier l’index de Google pour savoir comment il a indexé les pages du site en faisant la requête: site:societedhistoire.ca

Fichier piraté
Une page de spam dans l’index de Google

Des milliers de pages de spam sont toujours dans l’index de Google et elles y resteront tant que personne ne les enlèvera. Le site a été refait, les anciennes pages ont été supprimées et remplacées par d’autres avec d’autres URL. Mais pas dans l’index de Google. Toutes ces pages renvoient maintenant à une page d’erreur. Il aurait mieux fallu faire le ménage en même temps que le site, il y a des outils.

L’indexation de son site par les moteurs de recherche est un travail qui se construit avec le temps. Le but du moteur de recherche est de donner la meilleure réponse à une question, il connaît les bons sites et il n’aime pas se tromper. À force d’envoyer ses clients vers des pages d’erreur (et à cause du piratage) Google a commencé à pénaliser ce site qui avait bonne réputation. Remonter la pente est plus difficile que de la descendre, la SHJL va devoir travailler très fort juste pour revenir là où elle était.

Profiter du manque de compétition

Le panier bleu du Québec

Le Québec fait son virage numérique, on nous parle d’Intelligence Artificielle en oubliant les notions de base. Pratiquement tous les sites internet que j’analyse semblent ignorer les règles du référencement naturel d’un site internet. Le référencement naturel ne coûte rien, il suffit de suivre quelques règles basiques pour se donner un gros avantage sur la compétition.

Pour faire du commerce en ligne on peut payer très cher pour se positionner avec de la publicité. On peut aussi profiter gratuitement du travail des moteurs de recherche, c’est très simple mais on dirait que personne ne le sait, autant en profiter.

Le travail des administrations

Le manque de compétition ça marche pour l’histoire locale mais si on veut faire du commerce international la compétition est pas mal plus forte et chaque détail compte! On peut vérifier le travail des concepteurs du site Le Panier Bleu créé par le gouvernement du Québec pour le commerce en ligne et de la boutique culturelle en ligne de Lanaudière Le 4673°. Voici comment les produits sont indexés par Google:

On se demande pourquoi chaque description du Panier Bleu commence par Découvrez ce commerce sur Le Panier Bleu! Ça n’aide pas à valoriser chaque produit, les premiers mots de la description sont plus importants que la suite. Les vrais termes à indexer sont parfois tronqués car il n’y a plus assez de place. Dans les 2 cas on pourrait faire mieux.

On peut aussi comparer le plan de leurs pages d’accueil avec celui de ce site:

Le plan d’une page internet doit être clair pour que les robots comprennent la page le plus facilement possible. Un robot de lecture a besoin du plan pour permettre d’aller au titre suivant. Le plan du Panier Bleu est juste incohérent. Celui du 4673° est beaucoup mieux sauf que le webmaster ne sait pas faire la différence entre un titre et un paragraphe. Pour mettre un texte en gros caractères il en fait un titre très très long. Dans les 2 cas on constate l’ignorance de notions basiques.

Le plan de mon site est différent, c’est un blog. Mais il est parfaitement clair avec son titre principal H1 et les titres H2 des derniers articles parus. Quand le robot vient sur le site il voit immédiatement les nouveaux articles à indexer; comme le site est souvent mis à jour ses visites sont fréquentes.

Pour comprendre la différence entre une société commerciale concurrentielle et une société d’état administrée par des fonctionnaires il suffit de comparer les plans des pages d’accueil des sites internet du Journal de Montréal et de Radio-Canada:

Quand on ne sait pas ce que c’est qu’un plan on est mal parti!

L’utilisation du plan de la page par Bing

Le moteur de recherche Bing a commencé à faire une utilisation très pratique du plan de la page. Pour certains résultats de recherche il présente un contenu enrichi: on peut parcourir les sous-titres H2 de la page en cliquant sur les onglets. C’est très pratique et ça met le site en évidence puisqu’il y en a peu pour qui ça fonctionne.

Carte du Québec

Laisser un commentaire