Rapport sur les tendances 2019 – Ch. 1: Technologie et innovation

Création et histoire humaine vont de pair. C’est en faisant exister ce que son imagination lui permet d’entrevoir que l’humain exprime sa créativité. Or, il semblerait que la machine soit possiblement capable d’une certaine forme de créativité.

Téléchargez ce rapport

Technologie et innovation: l'intelligence artificielle créatrice

Création et histoire humaine vont de pair. C’est en faisant exister ce que son imagination lui permet d’entrevoir que l’humain exprime sa créativité. Or, il semblerait que la machine soit possiblement capable d’une certaine forme de créativité.

Toutes sortes d’expérimentations ont eu lieu ces 50 dernières années. La question de la créativité des machines n’est donc pas nouvelle. Cependant, l’année 2018 aura été celle qui aura ramené cette question sur le devant de la scène avec les avancées qui ont pu être observées dans le domaine. À plus ou moins long terme, l’industrie de l’audiovisuel devra-t-elle se préoccuper de ces nouveaux développements?

Que ce soit pour des images fixes, en mouvement ou encore dans le son, les essais nous poussent à redéfinir les contours de la créativité, la nôtre, mais aussi celle des machines, le tout dans un esprit de collaboration. Raconter des histoires ensemble, entre humains et machines. Le public peut déjà s’approprier cet élan d’exploration de la cocréation avec les histoires interactives des haut-parleurs intelligents. Serait-ce là un premier pas vers la démocratisation de ces processus ?

Les frontières de plus en plus floues de la créativité

La première vente aux enchères d’une toile réalisée par une intelligence artificielle (IA) a certainement contribué à raviver le débat entourant le rôle de la technologie dans l’univers de la création.

Le Portrait d’Edmond de Belamy a été créé par le collectif français Obvious à partir d’un algorithme GAN (generative adversarial networks ou réseaux antagonistes génératifs) qui s’est inspiré d’une base de données de 15 000 toiles peintes entre les 14e et 20e siècles.

Cette œuvre, comme toutes les autres créées à partir d’algorithmes GAN, s’inscrit dans une nouvelle approche au recours à l’intelligence artificielle dans l’art. Auparavant, l’artiste programmait l’ordinateur en fonction du résultat qu’il souhaitait. Aujourd’hui, grâce à l’apprentissage machine, on entraîne un algorithme à partir de milliers d’exemples d’un certain type d’œuvres pour ensuite lui permettre d’en générer de nouvelles qui respecteront les mêmes codes esthétiques.

Bien qu’on soit tenté de croire que l’ordinateur est capable de créer seul, ce n’est pas encore possible sans intervention humaine, indique Ahmed Elgammal, directeur de l’Art and Artificial Intelligence Laboratory de l’Université Rutgers. Ce sont des humains qui choisissent les exemples à partir desquels les algorithmes « apprennent ». Dans le cas d’Edmond de Belamy, le résultat est un portrait inspiré des formes classiques ayant servi d’exemples. Par la suite, une intervention humaine est à nouveau requise pour trier les résultats et établir ceux qui sont les plus valables.

En quoi est-ce de l’art alors? Pour M. Elgammal, il ne fait aucun doute que ce n’est pas le résultat qui fait de ces œuvres de l’art, mais plutôt le processus créatif. Tous les choix — humains et non humains à la fois — mènent à un résultat considéré comme de l’art. Qui est donc l’auteur? L’humain qui a programmé la machine ? La machine qui a généré une nouvelle image à partir d’exemples antérieurs? D’ailleurs, dans le cas d’Edmond de Belamy, l’artiste Robbie Barrat a soutenu que c’est lui qui avait mis au point l’algorithme et les exemples utilisés pour le générer.

La machine peaufine l’art de raconter une histoire

Une équipe de chercheurs de l’Université de Californie à Santa Barbara a récemment mis au point un réseau neuronal capable de créer des histoires à partir d’images. L’intelligence artificielle est en mesure de faire des déductions à partir d’une proposition visuelle et d’aller au-delà de la simple description. Aussi, elle est en mesure d’imaginer une histoire que l’image ne raconte pas d’emblée et, selon les chercheurs, elle réussit le test de Turing trois fois sur cinq, c’est-à-dire qu’il devient impossible de savoir si c’est l’humain ou la machine qui a généré l’oeuvre.

Encore une fois, ce type de technologie n’en est qu’à sa phase expérimentale. Elle n’égale pas encore l’imagination humaine pour raconter des histoires complexes; cependant, d’éventuelles améliorations, comme une meilleure compréhension des structures sociales des humains, pourraient changer la donne.

De la création fixe à la création en mouvement

Si la création est possible à partir d’images fixes, qu’en est-il des images en mouvement ?

En matière d’intelligence artificielle, les essais passés n’ont été guère fructueux. Par exemple, en 2016, l’algorithme Benjamin mis au point par Oscar Sharp et Ross Goodwin n’a pas épaté la galerie avec sa première oeuvre Sunspring. L’année suivante, It’s No Game ne s’est point avérée plus épatante.

Par contre, en 2018, sa création Zone Out a suscité davantage d’intérêt… et d’inquiétude. Créée à partir du même type de réseau neuronal que la toile Portrait d’Edmond de Belamy vendue aux enchères, Benjamin a écrit le scénario, sélectionné les scènes à partir de milliers de films et de séquences de jeu et placé le visage des acteurs sur les personnages choisis (une technologie de remplacement de visages qu’on a aussi connue avec le deepfake, utilisé pour produire de fausses vidéos pornographiques à partir de visages de célébrités).

Avec Benjamin, les créateurs envisagent l’intelligence artificielle comme une possibilité d’augmenter les capacités de l’humain plutôt que de viser à le remplacer. Leur film représente un pas de plus vers l’automatisation de la création vidéo. Une oeuvre entièrement créée par une intelligence artificielle est-elle valable ? Peut-elle être présentée dans un concours contre celles des humains ? Saura-t-on faire la différence entre l’oeuvre d’un humain et celle d’une machine ? Est-ce important ? Autant de questions soulevées par ces expérimentations autour de l’IA créatrice.

QU’EST-CE QUE LE DEEPFAKE?

Le nom deepfake qualifie les vidéos créées à partir des GAN. Le principe consiste à générer de nouvelles données à partir de sources préexistantes. Par exemple, en se servant de milliers de vidéos d’un individu, on peut en créer une ressemblante, sans que ce ne soit la copie d’aucune des vidéos précédentes. La technique était surtout connue des milieux de recherche jusqu’à la fin 2017 lorsqu’un utilisateur de Reddit l’a utilisée pour produire de la pornographie truquée en remplaçant le visage d’actrices du X par celui de célébrités. Maintenant que le grand public a accès à cette technologie qui continue de se raffiner, certains craignent que l’on confonde de plus en plus les vraies vidéos et leurs versions trafiquées.

 

L’intelligence artificielle dans l’audio

Ce type d’expérimentation autour de l’intelligence artificielle génératrice d’histoires s’est produit également en baladodiffusion, sans supports visuels. Le balado Sheldon County est l’idée du doctorant James Ryan de l’Université de Californie à Santa Cruz. En recourant à l’intelligence artificielle, il est en mesure de générer un nombre infini d’histoires procédurales. Ce procédé n’est pas nouveau en soi, des jeux vidéo comme No Man’s Sky l’ayant utilisé pour générer automatiquement de nouveaux environnements à explorer.

Le principe de Sheldon County est le même, mais il s’applique uniquement à l’audio. L’action se déroule dans une ville américaine fictive et raconte la vie de ceux qui y vivent sur une période de 150 ans. Chaque comté simulé est peuplé de ses propres personnages générés par l’IA et chacun a ses propres histoires et motivations. Dès le premier épisode, un comté est assigné à l’auditeur et l’intrigue de toute la série de balados sera basée sur le choix des personnages. Théoriquement, aucun auditeur n’aura accès à la même série.

Pour Ryan, ce n’est pas tant l’avancée technique que la participation du public qui rend l’expérience intéressante. Sans lui, l’oeuvre ne voit pas le jour. À l’Halloween 2017, le générateur d’histoires d’horreur du MIT a utilisé cette même collaboration humain-machine pour générer de nouvelles histoires. En partant d’une graine aléatoire, un nombre utilisé pour démarrer l’aventure, l’IA nommée Shelley amorçait des histoires qu’elle complétait à partir d’idées recueillies sur Twitter.

Dans un cas comme dans l’autre, la contribution humaine — que ce soit pour donner l’impulsion à un projet, pour lui conférer des balises créatives ainsi qu’un corpus de données ou encore pour déterminer la valeur du résultat — est essentielle à la créativité de la machine. Et si cette dernière permettait à plus d’humains de créer à partir de leur propre individualité ? La perspective d’une collaboration de plus en plus grande avec la machine dans un but de créer nous apparaît comme une tendance qui vise essentiellement l’augmentation des capacités humaines par la machine. Les producteurs de contenu peuvent y voir les possibilités de repousser les frontières de la créativité humaine sans que celle-ci ne soit pour autant remise en cause. Encore en phase expérimentale, les créateurs devront cependant éventuellement s’adapter à un monde où ce type de coopération sera de plus en plus courant.

Le contenu audio interactif : retrouver l’écoute collective

Le retour vers le futur de l’audio

Le contenu audio continue de se tailler une place de choix dans les habitudes de consommation des Canadiens. Dans le rapport sur les tendances 2018, l’an dernier, nous soulignions la popularité grandissante de la baladodiffusion tant aux États-Unis qu’au Canada.

Chez nous, c’est maintenant 61 % des adultes qui connaissent le phénomène, un pourcentage à peine inférieur à celui des États-Unis où 64 % de la population estime connaître la baladodiffusion (Edison Research). Au Canada, sans grande surprise, ce sont les 18-34 ans qui témoignent le plus d’enthousiasme pour ces contenus audio. 41 % des membres de ce groupe d’âge en écoutent chaque mois. La moyenne canadienne s’établit à 28 %.

Cela dit, ce qui ressort d’une comparaison entre les États-Unis et le Canada, c’est que la consommation de balados ne se fait pas de la même manière.

Les Canadiens sont encore nombreux à apprécier leurs balados à partir de leur ordinateur (40 %), bien qu’un appareil mobile soit l’outil de prédilection (57 %). Les Américains préfèrent aussi écouter leurs balados en mobilité (68 %) même si près de 30 % des adeptes utilisent un ordinateur. Ces différences se répercutent aussi sur le lieu de l’écoute. Les Canadiens (61 %) sont plus nombreux que les Américains (49 %) à consommer leurs balados à la maison, où de nouveaux appareils ont fait une entrée remarquée au cours de la dernière année. En effet, parmi les Américains qui écoutent assidûment des balados, ils sont 24 % à écouter régulièrement ce type de contenu sur un haut-parleur intelligent. Il faut dire que, contrairement aux Canadiens, ils ont accès à cette technologie depuis 2014.

Les haut-parleurs intelligents et le contenu créatif

Les Canadiens n’ont pas tardé à se procurer un haut-parleur intelligent.

Ces haut-parleurs sont vendus au pays depuis juin 2017 et c’est déjà 8 % de la population qui en possède un (Edison Research). D’ailleurs, la moitié des propriétaires d’un tel appareil l’aurait placé dans leur salon (OTM), ce qui pourrait inciter à l’écoute de contenus moins utilitaires (comme demander la météo, poser une question générale ou encore écouter un bulletin de nouvelles) pour se tourner vers des expériences d’écoute collectives et des contenus créatifs interactifs.

Les haut-parleurs intelligents rappellent les débuts de la radio dont l’histoire est intimement liée à l’écoute collective. Que ce soit par des séances d’écoute publiques ou des rassemblements plus intimes à l’intérieur de la sphère familiale, la radiodiffusion a permis à diverses générations de se réunir autour d’une même technologie. L’audio, à travers ces enceintes intelligentes, semble avoir maintenu ses capacités rassembleuses.

Notre rapport 2018 faisait déjà état de quelques initiatives en matière d’histoires interactives développées pour Alexa d’Amazon. L’industrie a continué d’expérimenter de ce côté en lançant d’autres productions interactives rattachées à une série ou à un film. Entre autres, Netflix a fait la promotion de sa série Lost in Space au moyen d’une aventure audio interactive destinée à Google Home.

Les histoires audio interactives ciblent les enfants

L’offre de contenu interactif pour enfants s’est multipliée au cours de la dernière année.

Amazon a même mis en vente une version pour enfants de son appareil Echo avec contrôle parental. La BBC Kids, LEGO et Nickelodeon sont parmi les entreprises ayant produit du contenu pour ce type d’appareil.

Au cours de la dernière année, Universal et Earplay ont également dévoilé Jurassic World Revealed pour Alexa. Aussi, Earplay a coproduit avec la station de radio publique américaine WBUR le récit You and the Beanstalk, destiné aux 6 à 12 ans.

Au Canada, Groupe Média TFO a lancé son application Boukili Audio, un jeu interactif qui favorise l’apprentissage du français des 4 à 8 ans. De plus, l’entreprise torontoise Storyflow, en plus de lancer sa plateforme de création pour haut-parleurs intelligents, s’est aussi lancée dans le contenu interactif pour enfants de type « vous êtes le héros ». Destinées aux familles, ces histoires permettent d’interagir avec les personnages et de choisir le déroulement de l’histoire.

Contenu sous surveillance

Bien sûr, l’utilisation d’assistants vocaux en général et de hautparleurs intelligents en particulier ne requiert que la voix.

Contrairement à bien d’autres technologies qui exigent un minimum de compétences en lecture et/ou en écriture ou qui requièrent un degré d’aisance avec les claviers et écrans, il suffit de savoir parler pour utiliser un hautparleur intelligent. Par conséquent, cela rend son utilisation accessible à une très large clientèle, dont les enfants.

Par contre, nous ne savons pas encore quels sont les effets de ces oeuvres sur les jeunes auditeurs. Sara DeWitt, vice-présidente numérique de PBS KIDS, se demande si les enfants comprennent vraiment à qui ou à quoi ils parlent. Il faut donc demeurer vigilant lors de la création d’histoires audio interactives qui ciblent les enfants et les jeunes.

Au-delà de ces considérations importantes, avec la popularité croissante de ces appareils, ce terreau fertile à l’expérimentation présente plusieurs opportunités à saisir pour les créateurs.