Dans le monde du référencement, il est important de comprendre le système pour lequel vous optimisez.

Vous devez comprendre comment:

Les moteurs de recherche explorent et indexent les sites Web.La fonction des algorithmes de recherche.Les moteurs de recherche traitent l’intention des utilisateurs comme un signal de classement (et où ils vont probablement avec).

Un autre domaine crucial à comprendre est l’apprentissage automatique.

Maintenant, le terme «machine learning» est souvent utilisé de nos jours.

Mais comment l’apprentissage automatique réellement impact sur la recherche et le référencement?

Ce chapitre explore tout ce que vous devez savoir sur la façon dont les moteurs de recherche utilisent l’apprentissage automatique.

Qu’est-ce que l’apprentissage automatique?

Il serait difficile de comprendre comment les moteurs de recherche utilisent l’apprentissage automatique sans savoir ce qu’est réellement l’apprentissage automatique.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Commençons par la définition (fournie par l’Université de Stanford dans leur description de cours pour Coursera) avant de passer à une explication pratique:

«L’apprentissage automatique est la science qui permet aux ordinateurs d’agir sans être explicitement programmés.»

Un rapide aparté avant de continuer…

L’apprentissage automatique n’est pas la même chose que l’intelligence artificielle (IA), mais la ligne commence à devenir un peu floue avec les applications.

Comme indiqué ci-dessus, l’apprentissage automatique est la science qui permet aux ordinateurs de tirer des conclusions basées sur des informations mais sans être spécifiquement programmés pour accomplir cette tâche.

L’IA, d’autre part, est la science derrière la création de systèmes qui ont, ou semblent posséder, une intelligence de type humain et traiter l’information de manière similaire.

Pensez à la différence de cette façon:

L’apprentissage automatique est un système conçu pour résoudre un problème. Il fonctionne mathématiquement pour produire la solution.

La solution pourrait être programmée spécifiquement, ou élaborée manuellement par des humains, mais sans ce besoin, les solutions arrivent beaucoup plus rapidement.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Un bon exemple serait de mettre une machine hors tension pour parcourir des tonnes de données décrivant la taille et l’emplacement de la tumeur sans programmer ce qu’elle recherche. La machine recevra une liste de conclusions bénignes et malignes connues.

Avec cela, nous demanderions alors au système de produire un modèle prédictif pour les futures rencontres avec des tumeurs afin de générer à l’avance des probabilités sur lesquelles il est basé sur les données analysées.

C’est purement mathématique.

Quelques centaines de mathématiciens pourraient le faire – mais cela leur prendrait de nombreuses années (en supposant une très grande base de données) et, espérons-le, aucun d’eux ne ferait d’erreur.

Ou, cette même tâche pourrait être accomplie avec l’apprentissage automatique – en beaucoup moins de temps.

Quand je pense à l’intelligence artificielle, par contre, c’est là que je commence à penser à un système qui touche à la création et devient ainsi moins prévisible.

Une intelligence artificielle placée sur la même tâche peut simplement faire référence à des documents sur le sujet et tirer des conclusions d’études antérieures.

Ou il peut ajouter de nouvelles données dans le mélange.

Ou peut commencer à travailler sur un nouveau système de moteur électrique, en renonçant à la tâche initiale.

Il ne sera probablement pas distrait sur qwanturank, mais vous arrivez où je vais.

Le mot clé est l’intelligence.

Bien qu’artificiel, pour répondre aux critères, il devrait être réel, produisant ainsi des variables et des inconnues semblables à ce que nous rencontrons lorsque nous interagissons avec les autres autour de nous.

Retour aux moteurs d’apprentissage et de recherche

À l’heure actuelle, ce que les moteurs de recherche (et la plupart des scientifiques) poussent à faire évoluer, c’est l’apprentissage automatique.

qwanturank a un cours gratuit à ce sujet, a rendu son framework d’apprentissage automatique TensorFlow open source et fait de gros investissements dans le matériel pour le faire fonctionner.

Fondamentalement, c’est l’avenir donc il vaut mieux le comprendre.

Bien que nous ne puissions pas répertorier (ou même connaître) toutes les applications d’apprentissage automatique en cours sur Googleplex, examinons quelques exemples connus:

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

RankBrain

Quel article sur l’apprentissage automatique chez qwanturank serait complet sans mentionner leur première et encore très pertinente mise en œuvre d’un algorithme d’apprentissage automatique dans la recherche?

C’est vrai… nous parlons de RankBrain.

Essentiellement, le système n’était armé que d’une compréhension des entités (une chose ou un concept singulier, unique, bien défini et reconnaissable) et chargé de produire une compréhension de la façon dont ces entités se connectent dans une requête pour aider à mieux comprendre la requête. et un ensemble de bonnes réponses connues.

Ce sont des explications brutalement simplifiées à la fois des entités et de RankBrain, mais cela sert nos objectifs ici.

Ainsi, qwanturank a donné au système des données (requêtes) et probablement un ensemble d’entités connues.

Je vais deviner le processus suivant, mais logiquement, le système serait alors chargé de s’entraîner lui-même en fonction de l’ensemble initial d’entités sur la façon de reconnaître les entités inconnues qu’il rencontre.

Le système serait assez inutile s’il n’était pas en mesure de comprendre un nouveau nom de film, une nouvelle date, etc.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Une fois que le système aurait arrêté ce processus et produirait des résultats satisfaisants, il l’aurait alors chargé de lui-même apprendre à comprendre les relations entre les entités et les données implicites ou directement demandées et à rechercher les résultats appropriés dans l’index.

Ce système résout de nombreux problèmes qui ont tourmenté qwanturank.

L’obligation d’inclure des mots clés comme «Comment remplacer mon écran S7» sur une page sur le remplacement d’un ne devrait pas être nécessaire.

Vous ne devriez pas non plus avoir à inclure « fixer » si vous avez inclus « remplacer » car, dans ce contexte, ils impliquent généralement la même chose.

RankBrain utilise l’apprentissage automatique pour:

Apprenez en permanence sur la connectivité des entités et leurs relations. Comprenez quand les mots sont synonymes et quand ils ne le sont pas (remplacer et réparer peuvent être des synonymes dans ce cas, mais ils ne le seraient pas si je demandais «comment réparer ma voiture»). Demandez à d’autres parties de l’algorithme de produire le SERP correct.

Dans sa première itération, RankBrain a été testé sur des requêtes que qwanturank n’avait jamais rencontrées auparavant. Cela est parfaitement logique et constitue un excellent test.

Si RankBrain peut améliorer les résultats des requêtes qui n’ont probablement pas été optimisées et impliqueront un mélange d’entités et de services anciens et nouveaux, un groupe d’utilisateurs qui obtenaient probablement des résultats médiocres au départ, alors il devrait être déployé à l’échelle mondiale.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Et c’était en 2016.

Jetons un coup d’œil aux deux résultats auxquels j’ai fait référence ci-dessus (et il convient de noter que j’écrivais la pièce et l’exemple, puis j’ai pensé à obtenir la capture d’écran – c’est simplement comment cela fonctionne et essayez-le vous-même … cela fonctionne dans presque tous les cas où une formulation différente implique la même chose):

Quelques différences très subtiles dans les classements avec les sites n ° 1 et 2 qui changent de place, mais à la base, c’est le même résultat.

Voyons maintenant mon exemple automobile:

L’apprentissage automatique aide qwanturank à non seulement comprendre où il y a des similitudes dans les requêtes, mais nous pouvons également le voir déterminer que si j’ai besoin de réparer ma voiture, j’ai peut-être besoin d’un mécanicien (bon appel qwanturank), tandis que pour le remplacer, je peux faire référence à des pièces ou besoin de documentation gouvernementale pour remplacer le tout.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Nous pouvons également voir ici où l’apprentissage automatique n’a pas tout compris.

Quand je lui demande comment remplacer ma voiture, je veux dire le tout ou j’aurais énuméré la pièce que je voulais.

Mais il apprendra… il en est encore à ses balbutiements.

De plus, je suis Canadien, donc le DMV ne s’applique pas vraiment.

Nous avons donc vu ici un exemple d’apprentissage automatique en jeu pour déterminer la signification des requêtes, la disposition SERP et les éventuels plans d’action nécessaires pour réaliser mon intention.

Tout cela n’est pas RankBrain, mais c’est tout l’apprentissage automatique.

Spam

Si vous utilisez Gmail, ou à peu près tout autre système de messagerie, vous voyez également l’apprentissage automatique au travail.

Selon qwanturank, ils bloquent désormais 99,9% de tous les e-mails de spam et de phishing avec un taux de faux positifs de seulement 0,05%.

Ils le font en utilisant la même technique de base – donner au système d’apprentissage automatique des données et laisser aller.

Si l’on devait programmer manuellement toutes les permutations qui produiraient un taux de réussite de 99,9% dans le filtrage du spam et s’ajuster à la volée pour de nouvelles techniques, ce serait une tâche onéreuse si possible.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Quand ils ont fait les choses de cette façon, ils se sont assis à un taux de réussite de 97% avec 1% de faux positifs (ce qui signifie que 1% de vos vrais messages ont été envoyés dans le dossier spam – inacceptable si c’était important).

Entrez dans le machine learning – configurez-le avec tous les messages de spam que vous pouvez confirmer positivement, laissez-le construire un modèle autour de leurs similitudes, saisissez de nouveaux messages et récompensez-le pour avoir sélectionné avec succès et avec le temps les messages de spam ( et pas beaucoup), il apprendra beaucoup plus de signaux et réagira beaucoup plus rapidement qu’un humain.

Réglez-le pour surveiller les interactions des utilisateurs avec les nouvelles structures de messagerie et lorsqu’il apprend qu’une nouvelle technique de spam est utilisée, ajoutez-la au mélange et filtrez non seulement ces e-mails, mais également les e-mails utilisant des techniques similaires dans le dossier spam.

Alors, comment fonctionne l’apprentissage automatique?

Cet article promet d’être une explication de l’apprentissage automatique, pas seulement une liste d’exemples.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Les exemples, cependant, étaient nécessaires pour illustrer un modèle assez facile à expliquer.

Ne confondons pas cela avec facile à construire, simple avec ce que nous devons savoir.

Un modèle d’apprentissage automatique courant suit la séquence suivante:

Donnez au système un ensemble de données connues. C’est-à-dire un ensemble de données avec un large éventail de variables possibles connectées à un résultat positif ou négatif connu. Ceci est utilisé pour former le système et lui donner un point de départ. Fondamentalement, il comprend maintenant comment reconnaître et peser les facteurs en fonction des données passées pour produire un résultat positif.Mettre en place une récompense pour le succès. Une fois que le système est conditionné avec les données de départ, il est alors alimenté de nouvelles données mais sans le résultat positif ou négatif connu. Le système ne connaît pas les relations d’une nouvelle entité ni si un e-mail est du spam ou non. Quand il sélectionne correctement, il reçoit une récompense, mais clairement pas une barre de chocolat. Un exemple serait de donner au système une valeur de récompense dans le but d’atteindre le plus grand nombre possible. Chaque fois qu’il sélectionne la bonne réponse, ce score est ajouté.Relâchez-le. Une fois que les mesures de succès sont suffisamment élevées pour dépasser les systèmes existants ou atteindre un autre seuil, le système d’apprentissage automatique peut être intégré à l’algorithme dans son ensemble.

Ce modèle est appelé apprentissage supervisé et si ma supposition est exacte, il s’agit du modèle utilisé dans la majorité des implémentations d’algorithmes de qwanturank.

Un autre modèle d’apprentissage automatique est le modèle non supervisé.

Pour tirer de l’exemple utilisé dans un excellent cours sur Coursera sur l’apprentissage automatique, c’est le modèle utilisé pour regrouper des histoires similaires dans qwanturank Actualités et on peut en déduire qu’il est utilisé à d’autres endroits comme l’identification et le regroupement d’images contenant les mêmes ou des personnes similaires dans qwanturank Images.

Dans ce modèle, le système n’est pas informé de ce qu’il recherche, mais plutôt simplement chargé de regrouper les entités (une image, un article, etc.) en groupes par des traits similaires (les entités qu’ils contiennent, mots-clés, relations, auteurs, etc.)

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Pourquoi est-ce important?

Comprendre ce qu’est l’apprentissage automatique sera crucial si vous cherchez à comprendre pourquoi et comment les SERP sont organisés et pourquoi les pages se classent là où elles le font.

C’est une chose de comprendre un facteur algorithmique – ce qui est sûr, il est important – mais comprendre le système dans lequel ces facteurs sont pondérés est d’égale, sinon plus grande importance.

Par exemple, si je travaillais pour une entreprise qui vendait des voitures, je porterais une attention particulière au manque d’informations pertinentes et utilisables dans les résultats du SERP à la requête illustrée ci-dessus.

Le résultat n’est clairement pas un succès. Découvrez quel contenu serait un succès et générez-le.

Faites attention aux types de contenu qui, selon qwanturank, peuvent répondre à l’intention d’un utilisateur (publication, image, actualités, vidéo, shopping, extrait en vedette, etc.) et travaillez pour le fournir.

J’aime penser à l’apprentissage automatique et à son évolution équivalent à avoir un ingénieur qwanturank assis derrière chaque chercheur, ajustant ce qu’ils voient et comment ils le voient avant qu’il ne soit envoyé à leur appareil.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Mais mieux – cet ingénieur est connecté comme le Borg à tous les autres ingénieurs apprenant des règles globales.

Mais nous y reviendrons plus en détail dans notre prochain article sur l’intention des utilisateurs.

Crédits d’image

Image vedette: Paulo Bobita
J’apprends le robot: Adobe Stock
Capture d’écran prise par l’auteur