Les moteurs de recherche sont en constante évolution. Pour trier les milliards de pages web ils s’efforcent d’être de plus en plus intelligents afin de mieux comprendre les questions posées par les internautes et le contenu des pages qu’ils indexent. Pour pouvoir être plus intelligents ils ont besoin de trouver des données fiables dans du contenu structuré.
Les moteurs de recherche doivent donner des réponses justes et précises aux questions posées par les internautes, c’est leur métier. Cette semaine la réponse erronée du logiciel d’Intelligence Artificielle Bard à une question scientifique a fait chuter l’action de Google de 7%. Depuis quelques mois Bing le moteur de recherche de Microsoft a beaucoup évolué et présente des résultats de recherche nettement plus inteligents que ceux de Google, la soupe est chaude!
Bing devenu plus intelligent que Google
Les moteurs de recherche se contentaient d’indexer des mots. En faisant la recherche histoire de Joliette de 1823 à 1850 Google trouve une liste de pages où les mots histoire, Joliette, 1823 et 1850 figurent et essaie de les classer selon leur intérêt. Il ne comprend pas vraiment le sens de la phrase.
La même recherche sur Bing donne à peu près les mêmes résultats mais la présentation est plus intéressante. Le premier résultat est le site de la ville de Joliette suivi d’une liste de 5 sites permettant d’en savoir plus.
Plus bas la page Wikipedia de Joliette s’est positionné automatiquement sur l’onglet Histoire et présente le début du paragraphe racontant l’histoire de Joliette; on peut parcourir les onglets en cliquant sur les flèches.
En continuant la page on voit qu’un article des Chroniques anachroniques sur la construction des moulins en 1823 a aussi été positionné sur l’onglet Histoire de Joliette dans L…
Le site de Wikipedia et le mien respectent les normes, ils présentent un contenu structuré qui peut être mis en évidence par le moteur. Les autres sites n’ont pas cette chance, leurs pages ne respectent pas les normes. Je remarque surtout que pour une recherche sur l’histoire de Joliette le site de la Société d’Histoire de Joliette ne figure pas dans les résultats alors qu’elle devrait être en première place, ce sont d’autres sites qui parlent d’elle.
Ce n’est qu’un début, Microsoft annonce un nouveau moteur de recherche encore plus intelligent pour bientôt et Google essaie de suivre.
Présenter un contenu structuré aux moteurs de recherche
Un moteur de recherche intelligent peut interpréter des pages structurées et se positionner au bon endroit pour donner une réponse précise. Il suffit d’afficher le plan des pages web pour voire leur structure. La page du site de Joliette racontant son histoire n’a pas de plan, elle n’est pas structurée.
Celle de la construction des moulins a un plan très clair, Bing s’est positionné sur le deuxième titre H2 Histoire de Joliette dans les livres. Dans ce paragraphe on trouve le texte: Entre 1823 et 1850 d’autres bâtiments ont été construits… Le moteur est déjà intelligent, il a fait son travail; tous les mots de la question sont là.
Un plan clair avec des titres précis et des paragraphes ordonnés aide l’Intelligence Artificielle à interpréter la page facilement. Comme elle va avoir besoin de beaucoup de données fiables elle va consulter les sites les plus intelligents et les mettre en avant.
Rédiger des textes intelligents
L’intelligence des moteurs de recherche va leur permettre de mieux comprendre les questions posées en langage naturel. Pour y répondre ils ne chercheront plus juste des mots figurant sur une page mais un texte cohérent répondant à la question posée.
Et pour s’assurer que les données publiées par un site sont fiables le moteur intelligent va vérifier les sources de ses informations. Si elles sont claires et vérifiables la réputation du site va gagner en popularité. Plus le moteur sera intelligent plus il cherchera des sites intelligents fournissant des données fiables.
La plupart des sites internet d’aujourd’hui présentent de très belles images mais très peu de texte et donc de données. Jusqu’ici quelques mots-clefs pouvaient suffire à indexer une page, plus maintenant. Ils vont devoir s’adapter ou disparaître des résultats de la recherche intelligente.
Des données intelligentes, fiables et vérifiables
Les webmasters sont inquiets de l’arrivée de l’Intelligence Artificielle dans les moteurs de recherche. Ceux-ci vont faire une synthèse des données analysées pour donner la meilleure réponse à la question posée. Ils donneront ensuite la liste des sources de données leur ayant permis de faire cette synthèse pour permettre de vérifier leur exactitude. Les autres site viendront ensuite.
Le site de Joliette ne disparaîtra pas, les données qu’on y trouve sont précieuses. Si ses pages étaient mieux structurées les moteurs pourraient mieux les exploiter. Beaucoup d’autres sites ne présentent aucune donnée originale exploitable par les moteurs, ce ne sont que des annonces publicitaires sans contenu textuel. Ce n’est pas étonnant que le site de la société d’Histoire de Joliette ne soit pas indexé, il n’est pas intelligent.
Les limites de l’intelligence des moteurs de recherche
L’intelligence des robots n’est pas la même que la nôtre. Elle absorbe des données mais peut difficilement les mettre en contexte (pour l’instant). Pour la recherche Histoire de Lanoraie Bing s’est positionné sur l’onglet Histoire de la page Wikipedia.
La fiabilité de Wikipedia est bonne, l’information est exacte et documentée. Mais il n’y a qu’une machine qui peut raconter l’histoire de Lanoraie comme ça sans se rendre compte qu’elle est absurde. Le nouveau moteur de recherche devrait être plus intelligent, il fera la synthèse de cette information avec celles des autres sources de données pour raconter une histoire plus cohérente.
Ce sera beaucoup plus intéressant et plus facile de faire des recherches mais on ne pourra jamais se fier aveuglément à une machine qui n’est là que pour nous aider, pas nous remplacer.
La recherche Loedel Joliette
Pour la recherche Loedel Joliette Bing présente le premier résultat d’une autre manière intelligente. Un menu à gauche reprend les titres du contenu de l’article qu’on peut ainsi parcourir, c’est pratique. Pour cette recherche sur l’autre fondateur de la ville de Joliette, Peter-Charles Loedel, le site montrealbb.ca est partout dans la page des résultats, aucun autre site n’a sérieusement raconté son histoire!
bravo, les explications sont claires et m’apportent une meilleure compréhension sur le moteurs de recherches. merci.
Salut Guillaume,
Toujours très intéressant. J’espère que vous allez bien toi et ton conjoint. J’aimerais pouvoir de lire plus souvent. Je suis très occupée.
N’oublie pas de mettre un accent dans la phrase: L’ intelligence des robots n’est pas la même que la nôtre.