Comment l’intelligence artificielle transforme l’industrie des médias? – Partie 2
Cet article est présenté dans le cadre d’un partenariat éditorial entre FMC Veille et Méta-Media. © [2019] Tous droits réservés.
Par Kati Bremme
La semaine dernière, nous vous présentions six grandes tendances en matière d'intelligence artificielle appliquée dans les médias. Réalité étendue, outil d'information, lutte contre les fausses nouvelles, haut-parleurs intelligents... Voyons comment nous pouvons pousser encore plus loin les usages de l'IA dans nos industries.
7. L’intelligence artificielle pour indexer, archiver et optimiser les recherches
Avant, les moteurs de recherche fonctionnaient exclusivement sur du texte. Avec l’avènement de l’IA, la recherche est désormais possible sur des images, vidéos et sons. Grâce à la combinaison des technologies de reconnaissance d’image, apprentissage automatique, logiciels parole-texte (speech-to-text en anglais), NLP, reconnaissance de visages, d’objets et de lieux, l’IA peut automatiser la création de métadonnées sur les contenus pour améliorer leur archivage et surtout favoriser leur découvrabilité. La structuration des données, à l’instar du format EBUCore, est l’étape incontournable à leur exploitation automatique. Conversions de formats de données, transcodage, extraction d’audio et de sous-titres ou encore déplacements-copies-purges (FTP, HTTP) sont autant de tâches automatisables de la gestion des contenus permettant presque un catalogage en temps réel. L’indexation automatique accélère aussi le travail des journalistes et facilite la vérification de l'information.
La durée de vie d’un contenu est très courte et, sans métadonnées appropriées, il reste impossible de retrouver un sujet spécifique parmi tout ce qui a été produit. D’où l’importance d’une optimisation de la fabrication des métadonnées. L’IA rend la fabrication de métadonnées plus rapide, moins coûteuse et plus précise, sous condition de l'entraîner avec suffisamment de données.
Développer des solutions privées et maîtrisées à 100% est presque impossible pour un média. De nombreux outils clés en main sont proposés, souvent relayés à des systèmes d'infonuagique de Microsoft, Google, Amazon, IBM, OpenText, Oracle ou tant d’autres.
Newsbridge, très présent dans le secteur des médias, propose une solution d’indexation automatique et en temps réel des documents, par l'entremise de la reconnaissance d’image. Cela permet en même temps d’optimiser le processus de production d’un sujet et de pérenniser les contenus en facilitant leur réutilisation plus tard. Une fonctionnalité de traduction en direct est également proposée pour les entrevues.
Editor est un outil à base d’IA utilisé depuis 2015 par le New York Times pour simplifier la vérification et la mise en forme de l’information. Lorsqu’il rédige son article, le journaliste utilise des tags pour signaler les éléments clés — la machine apprend à repérer ces éléments, à comprendre le sujet de l’article et fait une recherche en temps réel pour extraire des informations sur ce sujet. Le BBC News Lab a lancé une technologie d'identification similaire appelée Juicer et un autre outil appelé Summa qui utilise la reconnaissance du langage pour mieux indexer les contenus. Leankr permet une indexation fine de vidéos, avec une identification automatique, une création de vignettes intelligentes, et un moteur de recherche dans la vidéo grâce au Natural Language Processing, aux logiciels parole-texte et à la reconnaissance optique de caractères.
L’IA aide en effet à optimiser la justesse des résultats de recherche. Des technologies de vision ordinateur permettent aussi de mieux traiter les contenus images et d'accélérer le processus de production. Les machines peuvent aujourd’hui facilement identifier des individus ou situations dans des photos, pour générer des légendes ou alimenter des bases de données plus complètes.
8. L’intelligence artificielle pour cibler et personnaliser
Les algorithmes de recommandation ne datent pas d’hier. Leur pionnier, Tapestry, a même fêté son 25e anniversaire en 2017. Par les algorithmes de recommandation, l’IA est un outil parfait pour adapter la stratégie de distribution des contenus en temps réel: analyse des tendances des réseaux sociaux pour identifier le moment de diffusion le plus opportun, analyse d'auditoire, génération automatique de titres-résumés-illustrations avec des mots-clés et hashtags qui garantissent d’apporter de la visibilité au contenu, infolettres personnalisées, listes d'écoute sur mesure...
Des contenus taillés sur mesure selon le profil de chaque utilisateur, personnalisés selon son profil, son parcours, en prenant en compte des données contextuelles (lieu, moment, météo...). Les groupes de discussion sont désormais remplacés par la base de comportements réels des utilisateurs existants.
Les cas d'école de la personnalisation sont Amazon, Facebook et Netflix. Cette dernière adapte entièrement sa page d’accueil. Son système Meson couplé à l'apprentissage automatique (par la collecte de données pour une évolution constante) propose même le visuel personnalisé (9 versions) sur lequel l’utilisateur est le plus susceptible de cliquer selon son parcours d’utilisation et son contexte. L'objectif: trouver la plus grande combinaison de séries qui pourrait convenir à des segments pour satisfaire les utilisateurs plutôt que du contenu qui correspond au plus grand nombre. L'algorithme est alors à la base de créativité et diversité plutôt que de standardisation.
L’IA peut automatiser la curation de contenus, mettre à jour régulièrement les listes d'écoute thématiques, profiler les utilisateurs pour faire de la recommandation personnalisée. Selon une étude de Reuters, 59% des médias utilisent l'intelligence artificielle pour recommander des articles ou projettent de le faire. Your Weekly Edition est une infolettre personnalisée du New York Times lancée en juin 2018 qui envoie une sélection personnalisée (au moyen d'une curation algorithmique et humaine) de contenus dans un seul but: ne montrer à l’utilisateur que des contenus qu’il n’a pas encore vus. Amazon Personalize permet aux développeurs sans expérience en apprentissage automatique de créer facilement des fonctionnalités de personnalisation. Freshr est un «bot Messenger» qui résume les actualités les plus importantes du moment en fonction des goûts de l'utilisateur chaque matin en seulement cinq minutes, destiné aux 20-35 ans.
Les algorithmes de recommandation sont loin d’être parfaits. L'économiste Matthew Gentzkow parle même d’un «personalization paradox» pour décrire leur côté déceptif. Combien de fois nous a-t-on proposé un contenu déjà acheté, ou juste du contenu publié par nos amis sur Facebook? Là aussi, les progrès de l’IA pourront aider à trouver le bon équilibre entre personnalisation et promotion intelligente de contenu. Et peut-être que les méthodes traditionnelles sont parfois aussi efficaces: RAD, le laboratoire de journalisme de Radio-Canada, utilise des sondages en ligne auprès de leur auditoire pour leur proposer un contenu adapté à leurs attentes.
9. L’intelligence artificielle pour rendre accessible
Les technologies de retranscription automatique facilitent d’un côté la vie des journalistes en optimisant leur temps de travail et rendent en même temps accessibles des contenus aux personnes en situation de handicap grâce à l’automatisation des sous-titres (avec les logiciels parole-texte), la mise en son des textes (avec les logiciels texte-parole), la reconnaissance contextuelle des images pour l’audiodescription ou encore la traduction en temps réel.
AI Media TV propose sous-titrages et transcriptions pour des événements en direct en rediffusion. Ils viennent de lancer le service Scribblr.ai. Trint est un outil de transcription financé par Google DNI, qui sert à transcrire automatiquement des flux audio et vidéo. Il est utilisé par l’AP et intégré dans Adobe Première. Mediawen gère la traduction de contenus vidéo en temps réel à l’aide d’IBM Watson et de la technologie texte-parole, en voix de synthèse ou en sous-titrage. L’AFP a développé l’outil Transcriber, qui permet à ses journalistes d’automatiser la retranscription des entretiens.
10. L’intelligence artificielle pour la production vidéo et la création
Avec le besoin grandissant des médias de fabriquer des formats courts adaptés aux réseaux sociaux, de nombreuses start-up proposant des solutions clés en main se sont développées. On peut alors utiliser l’IA pour générer automatiquement du texte à partir de documents graphiques, ou une vidéo à partir de textes. L’IA assiste aussi dans les différentes étapes techniques de la captation et de la diffusion. Elle intervient dans la postproduction de l’image et les effets spéciaux. Le nombre de solutions contenant des briques IA dans le développement de l’édition vidéo et de la gestion des médias a augmenté de façon exponentielle ces dernières années.
Grâce à la reconnaissance d’image, l’IA est capable d’analyser des documents vidéo pour produire un montage cohérent. La plupart des grands éditeurs de logiciels de montage, comme Adobe, Avid et Elemental (filiale d’Amazon) ont, eux aussi, déjà ajouté des fonctions de traitement automatique des vidéos pour faire gagner du temps aux monteurs. Adobe et Stanford ont par exemple développé des logiciels d'IA qui automatisent une partie du travail de montage vidéo tout en laissant la main à l’homme sur la partie créative. L’outil peut par exemple faire différentes propositions de montage d’une scène de dialogue. Gingalab crée des vidéos automatisées et personnalisées et génère automatiquement des best-of selon une ligne éditoriale prédéfinie (humour, tension, focus sur un protagoniste…), en mettant à disposition des outils de montage simplifiés, pour publier ensuite automatiquement sur les réseaux sociaux et agréger les statistiques.
En septembre 2018, la BBC a diffusé une émission entièrement fabriquée par un robot. Made by Machine: When AI Met the Archive a assemblé une partie des riches archives de la BBC dans un format d’une heure, pas forcément toujours cohérent (le même reproche que l’on faisait déjà aux IA scénaristes des Sunspring, It’s No Game et Zone Out).
Même si la technologie des GAN (Generative Adversarial Networks, ou «réseaux génératifs antagonistes») aide à améliorer la reproduction des créations par robot, du côté de l’art, l’IA n'est clairement pas prête à remplacer les artistes: elle reste fondée uniquement sur des systèmes probabilistes et combinatoires qui n’ont aucune intelligence symbolique ni capacité émotionnelle.
11. L’intelligence artificielle pour monétiser et prédire le succès
De l’analyse d’auditoire avancée à la détection de la bonne cible, les algorithmes de l'apprentissage automatique aident le marketing à séparer les conjectures des tâches essentielles. L’IA, en recoupant données comportementales, analyse d’auditoire et détection des tendances, est capable de prévoir les potentiels succès commerciaux des contenus avant leur diffusion. L’analyse avancée de données sert ainsi à découvrir des modèles, des corrélations et des tendances permettant d’améliorer les processus décisionnels. L’IA intervient dans toute la chaîne marketing: l'acquisition de clients (analyse d'auditoire et segmentation, ciblage, identification visuelle du contexte), la transformation (personnalisation et recommandation, création de contenus, optimisation de sites et de supports, pilotage automatisé des campagnes) et la fidélisation (agents conversationnels, automatisation du programme client, analyse comportementale, calcul de l'attribution et prédictions).
L’IA est même capable désormais de collecter la «donnée émotionnelle» pour analyser nos comportements non seulement par nos clics, mais aussi par nos émotions. C’est le dernier degré de la personnalisation: des médias qui proposent des contenus adaptés à notre contexte émotionnel du moment. Frank Tapiro de Datakalab décrit cette transformation de la façon suivante: «Pendant 30 ans, j’ai créé de l’émotion. Aujourd’hui, j’utilise les neurosciences et les données pour mesurer l’émotion». Amazon prépare même un bracelet pour détecter nos émotions.
Prevision.io est une plateforme en ligne (SAAS) qui permet de créer automatiquement des modèles prédictifs à partir de jeux de données (internes ou externes, structurées ou non) et de visualiser les résultats sur des tableaux de bord. Cette plateforme d'apprentissage automatique identifie des scénarios prédictifs pour prévoir des baisses d’auditoire, des désabonnements et pour gérer des tarifs d'écrans publicitaires. Elle promeut la transparence de sa solution, en expliquant chaque résultat et en proposant des recommandations d'actions et/ou des évaluations d'impact. Le groupe Les Échos-Le Parisien a remporté récemment un financement Google DNI pour un programme anti-désabonnement. Intitulé High Fidelity, ce projet doit permettre la mise en commun des données provenant des centres d'appel, des infolettres, des envois de courriers et des interactions provenant des applis et des sites Web, et prédire les désabonnements en cascades pour éviter la perte massive de lecteurs. Avec Project Feels, le New York Times de son côté vend des espaces publicité premium en fonction du sentiment du lecteur. Vionlabs est une société suédoise qui intervient dans l'indexation des contenus à partir de la reconnaissance automatique des émotions.
Elle analyse les contenus, constitue des graphiques en représentant les différents moments émotionnels. Ces données vont ensuite pouvoir alimenter un moteur de recommandation basé sur les émotions. L’IA est utilisée pour connaître le plus finement possible les utilisateurs et être capable de cibler le meilleur moment – et la meilleure façon – de leur proposer de passer à un abonnement payant. L’IA devient ainsi une aide à la prise de décision et un outil antidésabonnement.
12. L’intelligence artificielle et l’éthique appliquée aux médias
En pleine crise de confiance, l’utilisation de l’IA et d’algorithmes opaques de recommandation impliquant l’analyse de comportements n’est peut-être pas un choix évident pour les médias. L’usage de l’IA nécessite en effet l’instauration de règles claires et une documentation transparente à destination de l’auditoire. Le Big Data qui alimente l’IA est basé sur la collecte massive de données (y compris personnelles). La propriété des données et l'indépendance à l'égard de sources tierces sont cruciales pour le développement d'un écosystème indépendant, et pourraient être déterminantes pour la survie à long terme des entreprises, en particulier pour celles du secteur des médias.
Or, la plupart des jeux de données et des algorithmes disponibles dans les clouds des GAFAs sont biaisés, voire même racistes.
Comment alors intégrer les valeurs du service public (information, éducation) dans un algorithme de recommandation?
Comment fédérer autour d’un sujet pour animer le débat public?
Comment continuer à jouer le rôle de la recommandation dans la cohésion sociale?
Quel est le degré de recommandation que nous souhaitons?
Où se trouve le juste équilibre entre personnalisation et découverte de contenus?
Le gouvernement anglais a lancé un observatoire de l’utilisation de l’IA dans le service public. La BBC applique ses règles éthiques dans le programme Responsible Machine Learning in the Public Interest, rejoint par l’Union européenne de radio-télévision (UER), dont le groupe de travail Big Data, qui réfléchit à une utilisation éthique des algorithmes dans les médias de service public pour éviter les biais et répondre aux enjeux de cet outil encore peu maîtrisé: l’inégalité face à l’intelligence artificielle, le neurohacking, la souveraineté technologique, et surtout la nécessité de la complémentarité du cerveau avec l’intelligence artificielle.
L’interprétabilité et l'explicabilité de l’IA, deux néologismes anglais, sont le plus grand défi. L’intelligibilité des algorithmes en général et particulièrement ceux de l’intelligence artificielle est devenue un critère prépondérant, évoqué notamment dans le rapport Villani en France et mis en exergue depuis le Règlement général sur la protection des données en Europe. Le premier moyen d’être transparent étant déjà d’indiquer clairement qu’un contenu ou une recommandation sont totalement ou en partie proposés par un algorithme.
Par ailleurs, les possibilités de l’IA permettent aussi d’atteindre des auditoires de niche pour lesquels un média n’avait pas les moyens de créer du contenu. Les algorithmes permettent de créer des listes d'écoute entièrement personnalisées sur des sujets très ciblés. Et peut-être que les médias peuvent aussi laisser la place au vide. En ce sens, Jonnie Penn, auteur invité à l'atelier The Impact of AI on Media de l’UER en novembre 2018, clame le besoin de «data deserts» (ou déserts de données), de «protected areas from data» (zones protégées des données), pour laisser la place à des «healthy differences of opinions» (saine diversité des opinions).
Conclusion
L'engouement autour de l’IA peut aussi déclencher des attentes trop élevées: l’IA n’est pas la solution miracle — dans la plupart des cas que l’on a détaillés ci-dessus, elle a besoin d’être associée à l’humain, notamment pour créer du contenu. Elle est néanmoins déjà opérationnelle du côté de la demande dans les domaines de la diffusion, de l’accès au contenu et de la monétisation. Elle a un grand potentiel de bien social pour aider à naviguer dans la masse de contenus par l'optimisation de la recherche et la recommandation personnalisée, et pour prévenir la manipulation.