Envers et revers de la cocréation humain-machine
Grâce aux développements spectaculaires des techniques d’apprentissage automatique, la machine est désormais capable de “créer”. Des capacités nouvelles lui permettent de s’approprier du contenu dans son propre langage, de prendre des décisions (relatives), de s’adapter à son environnement et de générer de nouvelles informations.
Il n’est pas peu dire que ces systèmes computationnels, quasi-autonomes, bouleversent et préoccupent. Des initiatives, telles que celles de l’Unesco et du Mila, mettent en garde contre de potentielles dérives et rappellent les enjeux éthiques, d’équité et d’applicabilité sociale qui y sont liés.
Et puis, dans le milieu des arts, les outils de création instantanés (ChatGPT, Midjourney, Blender...), entraînés sur une quantité faramineuse d’oeuvres souvent protégées, soulèvent des questions en matière de droits d’auteur, souvent en zone grise. Face à la menace potentielle concernant la valorisation du travail des artistes, le milieu s’interroge et réagit. L’OMPI a fait part de ses questionnements lors d’une exposition en ligne sur les droits de propriété intellectuelle et l’intelligence artificielle. Des voix se font entendre, comme celle de la European Writers’ Council . Aux Etats-Unis, un recours collectif a été déposé contre les créateurs de l’outil Stable Diffusion pour violation du droit d’auteur. Des artistes poursuivent d’autres artistes, s’estimant lésés par l’intégration d’apprentissage automatique dans les œuvres artistiques créées par ces derniers.
Au cœur de ces controverses, l’actualité juridique permet d’apporter un éclairage sur certains enjeux, telle cette décision récente du Bureau américain du droit d’auteur concernant les œuvres générées par les machines. Il a été ainsi statué, avec certaines nuances, que les images produites mécaniquement par les outils de création instantanés ne peuvent faire l’objet de droit d’auteur, n’étant pas le produit de la créativité humaine.
De son coté, la juridiction canadienne fait état d’un certain statu quo. Le nouveau phénomène requiert le besoin de collecter plus de données, comme le démontre cette consultation.
Afin de nous aider à mieux comprendre les enjeux liés à cette nouvelle technologie confrontant le concept du droit d’auteur (DA), des expert-es juridiques et chercheurs-euses ont généreusement répondu à nos questions.
Des enjeux vastes et complexes
D’emblée, les enjeux juridiques portés par les nouvelles pratiques artistiques fondées sur l’apprentissage automatisé sont complexes dus à leur portée systémique et politique.
Comme le rappelle Éliane Ellbogen, avocate en droit de la propriété intellectuelle chez Fasken, la vocation du DA vise à protéger et favoriser les créations de l’esprit. Elle incarne une fine balance entre la juste rémunération des artistes et l’accessibilité des œuvres créatives, au nom de la recherche, de l’intérêt public et du maintien de la compétitivité en innovation sur le marché mondial. Les éventuelles décisions judiciaires auront des incidences sur l’équilibre que représente la préservation des intérêts économiques des artistes, de la recherche et des industries.
Chose certaine, les industries, en tant que leaders des innovations technologiques dans le domaine de l’apprentissage automatisé, ont un grand pouvoir à faire valoir leurs intérêts en tant que titulaire et utilisateur-trice de droit d’auteur.
Enjeu juridique 1 - La fouille de texte et de données (FTD), pratique inhérente à l’apprentissage automatique, implique une copie des données et donc, porte potentiellement atteinte au DA. Devrait-elle être sous le couvert de l’utilisation équitable?
L’office de la propriété intellectuelle du Canada rappelle qu’il est du droit légal exclusif du titulaire de droit de “produire ou de reproduire la totalité ou une partie importante d'une œuvre sous une forme quelconque”, à moins que l’acte ne soit justifié par le couvert de l’utilisation équitable, soit l’exception en matière de protection du DA.
Communément, nos expert-es s’entendent pour dire que la Loi du Droit d’auteur canadienne, telle qu’elle est stipulée actuellement, qualifie la FTD d’une violation du DA, lorsqu’elle implique la constitution d’une banque de données fondées sur des oeuvres protégées dont l’usage ne détient pas les autorisations requises.
D’autres juridictions dans le monde telles le Japon, le Royaume-Uni, la France, l’Allemagne et l’UE ont prévu une exception particulière pour la FTD. Les réflexions sont en cours au Canada pour évaluer l’ampleur d’une telle décision judiciaire pour les artistes, la recherche et les industries.
“La question ne s'est pas encore posée devant les tribunaux , à savoir si l'utilisation tomberait sous le couvert de la doctrine de l’utilisation équitable. À l’heure actuelle, il y a beaucoup de lobby qui se fait de la part de l’industrie de l’AI pour créer une exception à même la loi qui permettrait le text and data mining, ce qui enlèverait le risque inhérent à cette pratique.” - Éliane Ellbogen
En l’absence d’une telle exception, l’industrie doit obtenir des autorisations pour reproduire des œuvres aux fins de l’apprentissage des machines à moins que ces œuvres ne soient tombées dans le domaine public. Or, comme le souligne Caroline Jonnaert, docteure en droit, associée, avocate et agente de marques chez Robic, l’utilisation de données désuètes peut être problématique : “en entraînant un modèle sur du contenu appartenant au domaine public, on risque de développer des modèles peu actualisés, en plus de perpétuer certains biais et préjugés du passé.”
Enjeu juridique 2 - Les outils de création instantanée, en tant que modélisateurs de style, s’approprient des œuvres. Qu’en est-il lorsque les œuvres générées par la machine ont un degré de similarité trop grand avec les œuvres dont elle s’inspire?
Les outils tels Le nouveau Rembrandt, Stable diffusion, Dall-E, spécialisés dans l’extraction de patterns, sont capables de modéliser des styles d’auteurs et de courants artistiques.
Lorsque des artistes retrouvent leurs œuvres dans les espaces de ces outils de création instantanée, sans les autorisations requises, la question se pose à savoir si ces œuvres, générées par la machine, sont litigieuses.
D’un côté, le style, tout comme l’idée, n’est pas protégeable par le DA.
D’un autre, tel que démontré dans la thèse de Tom Lebrun, juriste spécialisé en droit du numérique et en droit d’auteur, “une oeuvre qui reproduit de manière substantielle le talent et le jugement d’une oeuvre initiale, non libre de droit, n’appartenant pas au domaine public et sans autorisations, est une oeuvre litigieuse, si elle n’est pas couverte pas l’utilisation équitable”. Caroline Jonnaert précise en outre que la reprise d’un élément distinctif, ne serait-ce que 3 secondes d’une chanson par exemple, peut être suffisante pour être qualifiée de contrefaçon.
La limite est mince entre l’acte légal de reproduire un style appartenant au domaine public et ce qui pourrait se qualifier de contrefaçon. À cet effet, la juridiction canadienne n’a pas encore éclairci le statut de ces œuvres “stylisées” sur la question.
Certaines pratiques industrielles, conscientisées, visent à prévenir les répliques d’images trop similaires, comme l’a fait Open AI avec Dall-E.
Et puis, les images stylisées retrouvées dans ces espaces ont une particularité. Elles reflètent la manière dont le modèle algorithmique s’est construit une représentation abstraite du comportement des données. Sofian Audry, artiste chercheur et professeur à l’École des Médias à l’Université du Québec à Montréal, auteur du livre Art in the Age of Machine Learning, explique. "Les images de ces artistes ne sont pas exactement leurs images, elles incarnent une représentation distribuée dans un espace qui permet de générer d'autres images qui n’ont jamais existé auparavant. Ces espaces représentent ainsi une forme de compression des données de 2 milliards d’images par exemple qui, plutôt que d'être stockées directement comme des fichiers numériques, sont représentées dans un réseau de neurones artificiel en utilisant beaucoup moins de mémoire-disque, mais aussi avec la capacité de pouvoir générer une quantité infinie de nouvelles images."
En quoi cette tendance émergente se distingue-t-elle du passé?
L’acte créatif visant la transformation d’un matériel existant n’est pas nouveau. Sofian Audry rappelle que l’émergence des technologies de reproduction d’image et de bande sonore au 20e siècle, a facilité de nouvelles pratiques artistiques fondées sur le collage et l’assortiment d'œuvres, tel le dadaïsme.
Or, les techniques d’apprentissage automatique révolutionnent les techniques de remix. Comme l’explique Sofian Audry, “avant, on remixait des contenus qui existaient déjà, alors qu'aujourd'hui, avec les algorithmes de transferts de style, on remixe des procédés génératifs.”
Du jamais vu dans l’histoire de l’humanité, la machine peut désormais automatiser des processus de création en un modèle qui devient lui-même objet de transformation, pouvant être modifié et mixé. Cette nouvelle capacité représente à la fois des opportunités et des menaces, telles que le phénomène inquiétant du deepfake peut le faire entrevoir.
Comme l’observe Caroline Jonnaert, une nouvelle collaboration humain-machine émerge où le créateur peut désormais créer la création, soit les règles du processus créatif à partir desquelles l'œuvre sera créée.
Un statut quo dans la loi est-il en train d’effacer l’artiste au profit de la machine, de la technologie et des programmeur-euses? À l’inverse, n’y a-t-il pas le risque d’imposer un fardeau trop lourd pour le milieu de la recherche et des industries? Y a-t-il un besoin de modifier la loi ou de créer un régime parallèle comme l’ont fait certaines autres juridictions?
La loi, érigée au 19e siècle sous le sceau d’une certaine intemporalité universelle, a passé à travers de nombreux changements technologiques sans faillir. Voyons voir comment elle s’adaptera à cette nouvelle ère.