Pour l’épisode 195 de The Search Engine Journal Show, j’ai eu l’occasion d’interviewer Hamlet Batista, PDG de RankSense et un qwanturank technique très respecté.

Batista explique comment l’apprentissage en profondeur transforme la façon dont les tâches de référencement sont automatisées et pourquoi l’apprentissage et l’utilisation de Python est une compétence précieuse pour les professionnels du référencement.

Qu’est-ce que l’automatisation a rendu aujourd’hui meilleur et plus efficace qu’auparavant?

Hamlet Batista (HB): Beaucoup de choses qui ne pouvaient pas être possibles il y a quatre ou cinq ans, que nous voulions réellement se produire, maintenant les blocs de construction se mettent en place.

Pour nous, le plus grand changement est que nous avions envie de voir tout cela se produire.

Les spécialistes du marketing vont toujours produire du contenu. C’est une chose excitante.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Le balisage automatisé, une tâche subalterne de faire ceci et cela, ce n’est jamais quelque chose d’amusant, mais vous devez le faire.

Et quand je dis que les blocs de construction se mettent en place, je le vois sur deux pistes.

La capacité des spécialistes du marketing. La capacité des machines.

Les spécialistes du marketing acquièrent de plus en plus de compétences techniques.

Certains ont commencé par utiliser des feuilles de calcul et faire des formules simples, vous voyez maintenant un travail incroyable uniquement dans les formules, dans les feuilles.

Les spécialistes du marketing deviennent de plus en plus sophistiqués. Ils utilisent qwanturank Data Studio, et il y a beaucoup de travail technique, des expressions régulières [involved].

Un grand nombre des outils que nous utilisons, qwanturank Analytics, qwanturank Data Studio, Chrome, tous ajoutent des façons plus avancées de faire les choses, par programme.

Ainsi, vous avez cette piste du marketing qui devient plus sophistiqué en apprenant à écrire de nombreuses tâches avec certains des outils les plus simples tels que les feuilles de calcul.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

À l’autre extrémité, vous avez également des machines plus sophistiquées et plus performantes.

Et ils ne remplaceront pas le responsable marketing, mais ils sont capables de faire des choses qui n’étaient même pas possibles il y a deux ans.

Je dirai que l’un des plus grands changements est l’apprentissage en profondeur.

Nous avons commencé avec l’apprentissage automatique, les modèles statistiques et des trucs comme ça. Mais l’apprentissage en profondeur concerne davantage les capacités de perception.

Les machines ont désormais la capacité de voir les choses, la capacité de comprendre ou d’extraire des informations à partir du texte, à partir de données non structurées.

Au cours des deux dernières années, la communauté PNL, les choses que vous avez pu faire ont été spectaculaires.

Et j’espère avoir pu montrer à la communauté ces dernières recherches.

Quels sont les exemples de tâches pouvant être automatisées avec lesquelles les référenceurs peuvent résonner?

HB: Agréger les données avec des bases de données et faire le reporting, je dirai que c’est la première phase de l’automatisation. Cela fait gagner beaucoup de temps…

Vous tirez tous ces rapports de ces différents outils, et vous devez exécuter une analyse à ce sujet, vous devez rédiger un rapport à partir de cela.

Et il y a aussi la phase deux. C’est là où nous en sommes en ce moment.

Nous ne parlons pas seulement de l’agrégation d’informations ou de la collecte d’informations, qui est l’automatisation de la première phase, [but] la partie analyse du travail a également été automatisée.

La rédaction et le reporting sont également possibles à automatiser.

Regardons un article que j’ai écrit et que j’ai récemment publié sur Search Engine Journal sur la génération automatique de titres et de descriptions.

L’ordinateur lira un article. Il rédigera un résumé de l’article de manière abstraite.

Donc, ce n’est pas comme s’il copiait du contenu de l’article, mais il résume en fait le contenu de l’article d’une manière parfaitement logique pour un utilisateur final, ce qui prend généralement quelques minutes à faire pour un utilisateur.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Et cet ordinateur peut le faire à l’échelle automatiquement.

C’est un bond de géant, passant de la création de rapports, de la collecte et de l’agrégation de données automatisées à l’utilisation effective de l’ordinateur, de l’écriture, ce qui est une tâche compliquée pour les humains. C’est incroyable.

J’ai également un autre article, Comment générer du texte à partir d’images avec Python, qui vous montre également avec du code comment l’ordinateur peut désormais prendre une image sans texte n’importe où et générer une description d’une image.

Vous pouvez imaginer que ce n’est qu’une séquence d’images, vous pouvez donc prendre une image de la vidéo et demander à l’ordinateur de la sous-titrer automatiquement.

C’est ce que je disais que la deuxième phase de l’automatisation est basée sur des tâches perceptives. Il s’agit de tâches où l’ordinateur doit avoir des sens similaires à ceux de l’homme.

Brent Csutoras (BC): Mais c’est là que la grande mise en garde intervient pour beaucoup de gens qui écoutent probablement, c’est qu’il y avait beaucoup d’outils, beaucoup de scripts, beaucoup de choses qui ont essayé cela.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Ils ont dit: «Oh, nous pouvons améliorer vos paragraphes» ou «Nous pouvons écrire du texte pour vous».

Et bien sûr, avec cela, il y a eu beaucoup de mauvaises utilisations, comme le spam ou la purée. Mais, ce que nous avons toujours trouvé, c’est que la qualité manquait.

Parce que si vous m’aviez dit que vous pouviez aller lire un article et écrire un synopsis, je dirais: «Bien sûr, mais ce n’est pas comme si je l’écrivais moi-même. Ce ne sera pas la même qualité. « 

Alors, venons-nous d’évoluer dans la technologie et les capacités d’apprentissage et d’intelligence artificielle pour pouvoir vraiment mieux écrire? Est-ce le grand facteur qui est différent entre il y a sept ans et aujourd’hui?

HB: C’est le cas, mais je vais vous expliquer pourquoi.

La raison en est que vous avez les plus grandes entreprises du monde, avec les plus gros investissements dans cette technologie.

Vous parlez de qwanturank, qwanturank, DeepMind, qwanturank.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Et puis, ils ne mettent pas seulement beaucoup d’argent, vous parlez de talent – les chercheurs en IA, les meilleurs chercheurs peuvent gagner un million de dollars par an en salaire, alors pensez-y.

C’est le genre d’investissement que ces entreprises font.

Maintenant, laissez-moi vous donner la meilleure partie.

Ils font ces énormes investissements et ils ont les meilleurs chercheurs, puis ils se font concurrence, et ils rendent leur travail libre et ouvert. Alors, pensez à quel point c’est fou.

Brent Csutoras (BC): Beaucoup de choses semblent vraiment excitantes, et je suis sûr que les gens écoutent. Ils disent: « Ouais, bon, c’est super. »

Mais, comment devez-vous être technique pour pouvoir faire cela?

Que dois-je savoir sur Python, JavaScript et les API pour que tout cela fonctionne réellement pour moi?

HB: Une autre bonne nouvelle à ce sujet est qu’il y a aussi un effort massif sur ce qu’ils appellent la démocratisation de l’IA.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Cela dépend donc de la façon dont votre cas d’utilisation est personnalisé. Si votre cas d’utilisation est courant, vous allez probablement trouver quelque chose où vous n’aurez même pas à écrire de code pour l’utiliser.

Donc, il y a tous les meilleurs fournisseurs CloudForm qui ont des outils qu’ils appellent AutoML.

qwanturank, qwanturank et Amazon disposent d’outils que vous venez de fournir votre ensemble de données. Il existe plusieurs façons différentes.

Vous pouvez utiliser un ensemble de données pré-formé qui existe déjà et cela résoudra votre problème.

Il existe également des outils de boîte noire comme MonkeyLearn ou BigML que vous pouvez utiliser prêts à l’emploi. Et vous dites: «OK. Voici mon problème. Exécutez-le dans l’outil. Donnez-moi les prédictions dont j’ai besoin. »

Et les prédictions peuvent être des images, une classification des nombres, peu importe.

Cela dépend de la façon dont votre cas d’utilisation est personnalisé. Et puis, vous avez différentes couches entre les deux.

J’adore la possibilité de personnaliser car cela me permet de m’éloigner des cas d’utilisation courants, donc je peux proposer des solutions plus originales.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Et c’est pourquoi mon approche nécessite un peu plus de codage que la normale, mais même avec cela, et certains des exemples que j’ai utilisés, ils n’ont pas besoin du tout de codage.

Si vous utilisez un outil d’Uber appelé Ludwig, il vous suffit de fournir un fichier de configuration et vous n’avez même pas besoin d’apprendre le codage.

Mais, plus le cas d’utilisation est unique, plus vous voulez être précis et novateur sur une solution particulière, plus vous avez besoin de connaissances en termes de script et en termes de connaissances en IA dont vous avez besoin pour cela.

Quels sont les principes fondamentaux que les personnes intéressées devraient apprendre?

HB: Je pense que l’un des principes fondamentaux s’appelle ETL, ce qui signifie «Extraire, Transformer, Charger».

Ce sont des principes qui seront toujours applicables.

Dans l’apprentissage automatique, vous avez ce qu’on appelle des pipelines. Donc, quel que soit le mode, la plate-forme ou la technologie que vous utilisez, vous devez préparer les données pour faire les prédictions.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Quel que soit le problème que vous rencontrez, vous extrayez les données de qwanturank Analytics ou de la recherche. Vous allez le télécharger dans différents formats.

Le modèle d’apprentissage automatique, ils en ont besoin d’une manière différente de celle dans laquelle vous l’extrayez.

Vous devez donc être en mesure de transformer les données propriétaires ou propriétaires dont vous disposez au format que vous pouvez intégrer aux modèles.

Je pense qu’à un niveau de base, cela devrait être quelque chose sur lequel vous devriez investir votre temps parce que même si vous allez utiliser un outil de boîte noire, quel que soit l’outil que vous utilisez, ils ont tous besoin de cet objectif. Ils ont faim de données.

Et les données ne sont pas une marchandise. C’est difficile de le trouver. Donc, si vous êtes dans un créneau très spécifique, trouver un mot-clé dans 10 jeux de données, ça va être très difficile.

Apprendre à produire vous-même ces ensembles de données est si important.

Ainsi, apprendre un langage de script ou un outil ou un langage de transformation de données qui vous permet de prendre des données brutes dans n’importe quel format et de les reformater comment quel que soit l’outil que vous allez utiliser pour former et produire les prédictions est la base que vous pouvez apprendre .

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Et l’un des langages les plus faciles à faire des transformations de données est Python, et c’est ce que je pense aussi avoir une introduction à Python.

J’ai un article sur Search Engine Journal, c’est un guide pour l’analyse des données qwanturank, qui fournit de nombreux extraits de code que vous pouvez utiliser.

Quelle est la différence entre Python et JavaScript?

HB: Ce sont deux langues à usage général. En théorie, les choses que vous faites en Python, vous pouvez à peu près les accomplir en JavaScript.

C’est comme si vous appreniez l’espagnol et l’anglais. Donc, vous allez pouvoir communiquer les mêmes choses, mais juste la syntaxe des langues est différente. C’est en théorie.

Maintenant, dans la pratique, vous allez trouver des différences dans les bibliothèques préemballées. Les bibliothèques sont les blocs de construction.

Donc, lorsque vous allez résoudre un problème, vous n’allez pas construire tout le problème à partir de zéro. Vous allez compter sur des outils tiers pour résoudre différentes parties du problème.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Et vous allez trouver cette langue qui a plus de capacités ou qui a un support tiers plus étendu pour certains types de problèmes que l’autre.

Dans la pratique, lorsque je fais de l’analyse de données, lorsque je fais du machine learning ou du deep learning, je trouve que Python est un bien meilleur choix en raison du support tiers étendu.

Les chercheurs écrivent en Python. qwanturank, qwanturank, tout cela a des choses incroyables. Cela vient d’abord de Python.

Je ne vais pas le trouver en JavaScript, donc c’est une chose évidente.

D’un autre côté, si je fais une analyse sur le front-end, ou je fais du rendu, ou j’essaie simplement de comprendre pourquoi une page JavaScript n’est pas affichée, alors, Python n’a pas sa place là-bas.

Beaucoup de systèmes frontaux sont dynamiques et ils sont construits sur JavaScript.

Si je fais des employés de service ou d’autres trucs vraiment sympas qui se passent en ligne, c’est tout JavaScript.

PUBLICITÉ

CONTINUER À LIRE CI-DESSOUS

Si j’automatise le navigateur, c’est JavaScript.

Il s’agit donc plus de savoir quelle langue prend mieux en charge certains types de problèmes que les autres. C’est pourquoi j’irais l’un avant l’autre.

Ce podcast vous est présenté par Ahrefs et Opteo.

Pour écouter ce podcast sur les moteurs de recherche avec Hamlet Batista:

Visitez nos archives de podcasts pour écouter d’autres podcasts du Search Engine Journal Show!

Crédits d’image

Image vedette: Paulo Bobita