Web sémantique 101: la Cinémathèque québécoise s’engage à mettre en valeur ses données

Alors que des institutions comme la Cinémathèque québécoise initient des projets autour du Web sémantique, comment les détenteurs de catalogues documentaires peuvent-ils collaborer à ces initiatives et rendre leurs données libres, ouvertes et interopérables? Sont-ils prêts à intégrer cette révolution à leurs pratiques?

Quand on détient les droits de plusieurs documentaires, on n’est pas seulement préoccupé par leur commercialisation. On veut aussi en assurer la pérennité. Il y a l’enjeu de la préservation des supports, certes, qui est d’une brûlante actualité, et qui, faute d’une attention urgente, condamne nos documentaires à l’extinction pure et simple.

Mais il y a aussi l’enjeu des contenus et de leur mise en valeur.

En tant que documentaristes, nous voulons que nos catalogues soient disponibles partout et pour tous. Nous espérons – nous l’avouerons avec modestie – que notre contribution soit intégrée au monde de la connaissance. La première phase de la réflexion, avant d’être technologique, porte sur l’inventaire et l’évaluation de nos contenus. Nous intégrerons alors la planification du référencement de nos données dans la chaîne de nos actions. Le Web sémantique offre à cet égard bien des promesses. Encore faut-il s’y retrouver dans tout cela. De nouveaux objets, un nouveau langage, une nouvelle méthode de travailler et de collaborer. Bref, nous devons accepter quelques remises en question et nous devons nous remettre en situation d’apprentissage.

LE WEB SÉMANTIQUE, C’EST QUOI?

Pour le théoricien et inventeur du Web, Tim Berners-Lee, le Web sémantique suppose que les informations ne seraient plus seulement stockées sur le Web, mais bien déchiffrées par les ordinateurs, afin d’aider l’utilisateur à trouver ce qu’il cherche, et ce, plus facilement. En ce sens, le Web sémantique permet donc une compréhension des données par non seulement l’homme, mais aussi la machine. Pour y arriver, il est nécessaire de lier et de structurer l’information sur Internet pour accéder simplement à la connaissance qu’elle contient déjà.

Nous pouvons décider d’attendre que le train passe à notre porte, une fois que les routes seront toutes tracées par les autres, et alors mettre en place les pratiques qui ont fait leurs preuves. Ou encore, nous pouvons décider de faire partie de la cohorte des défricheurs.

Une approche collaborative pour faire rayonner le cinéma canadien

L’initiative sur les Savoirs communs du cinéma proposée par la Cinémathèque québécoise met un peu de lumière sur ce nouveau territoire en augmentant la production et la diffusion de connaissances libres sur le cinéma québécois. Démarré en 2018 avec le soutien du Conseil des arts du Canada dans le cadre du fonds Stratégie numérique (volet transformation des modèles organisationnels), ce projet – dont la première phase d’une durée d’un an a été développée en partenariat avec Wikimédia Canada et l’Université de Montréal – vise désormais le long terme.

Marina Gallet, l’instigatrice de cette initiative, est directrice de la préservation et du développement des collections à la Cinémathèque. Elle s’intéresse particulièrement au libre accès de la culture et aux humanités numériques et est titulaire de deux maîtrises liées à ces questions, dont une en gestion des patrimoines audiovisuels de l’Institut national de l’audiovisuel (INA). Par ailleurs, elle a évoqué les grandes lignes du projet lors de la 3e édition du colloque sur le Web sémantique organisé par l’Université TÉLUQ en juin 2019, après en avoir annoncé le lancement lors de la 2e édition du colloque, en 2018.

L’objectif visé par le projet est de devenir un point d’accès de référence sur la mise en valeur des données cinématographiques canadiennes par leur diffusion sous licences libres. Son originalité repose sur un modèle collaboratif qui permet aux équipes de la Cinémathèque d’échanger avec des spécialistes de domaines liés, allant de la muséologie numérique au droit en passant par des aspects plus techniques et le codesign. Qui plus est, le citoyen participe lui aussi, puis se réapproprie ces données. Les ressources et les savoirs que la Cinémathèque a conservés depuis plus d’un demi-siècle peuvent ainsi être réutilisés.

De la mise en œuvre technique à la transformation des pratiques

Le projet se déroule en trois phases. Dans sa phase initiale de développement, l’équipe de la Cinémathèque, en lien avec les acteurs culturels associés au projet, a pu amorcer une réflexion sur les enjeux du Web sémantique et développer une vision commune autour de la valorisation et de la mise en réseau de contenus culturels, ce qui lui a permis d’établir comment elle pouvait adapter ses méthodes et outils de travail à ce nouveau contexte.

Au terme de cette première phase, la Cinémathèque s’est dotée d’une politique d’ouverture de données. Les phases subséquentes de preuve de concept et de déploiement permettront d’accoucher d’un plan d’action pour la sémantisation et la valorisation des données et des contenus.

La Cinémathèque choisira par la suite les premières données à traiter selon ses critères en fonction du potentiel de réutilisation ainsi que de considérations juridiques et techniques. Mentionnons au passage que les données qui seront versées sur la plateforme collaborative Wikidata seront diffusées sous licence Creative Commons. De plus, au sein de l’organisation, un responsable de la politique des données ouvertes verra à ce que chaque direction définisse et transmette des données dont elle assurera la qualité.

Par ailleurs, l’enjeu des droits d’auteur dans ce nouvel environnement numérique est central. La Cinémathèque a d’ailleurs demandé à Olivier Charbonneau, LLD, bibliothécaire-chercheur à l’Université Concordia, de produire un rapport sur la question qui identifie les questions juridiques soulevées par la diffusion de métadonnées culturelles sous licence libre.

Quelle place pour les documentaristes et les détenteurs de collections?

Y aura-t-il un espace de collaboration ouvert aux détenteurs de droits pour les données qui ne feront pas partie du premier corpus sélectionné par la Cinémathèque?

Dans ce contexte, le partage d’expertise constitue un enjeu prioritaire. En rendant accessibles des guides de pratique (comme les normes de catalogage), des institutions comme la Cinémathèque permettront au milieu du documentaire de se faire une place au sein de cette communauté, ce qui l’encouragera à mettre l’épaule à la roue et à participer à cette mutualisation.

Le développement d’une culture de données ouvertes à la Cinémathèque québécoise peut avoir un effet d’entraînement sur l'industrie et inciter le milieu du documentaire à s’inscrire dans ces Savoirs communs et à collaborer à l’archivage des données.

Pour rendre ses données libres, ouvertes et interopérables, le détenteur de collections qui désire s’inspirer de ce projet devra intégrer la planification du référencement de ses données dans la chaîne de ses actions. Soucieux du respect du droit d’auteur, il devra se familiariser avec de nouveaux objets, un nouveau langage et une nouvelle méthode de travail et de collaboration. Bref, il devra accepter quelques remises en question.

Au-delà du défi de la préservation des supports, prioritaire dans tout projet de conservation, l’enjeu de la mise en valeur des collections nécessite une réflexion qui, avant d’être technologique, porte sur l’inventaire et l’évaluation des contenus et qui inclut évidemment, comme le souligne Josée Plamondon dans son article sur la recherche du Graal de la découvrabilité, la promotion et le marketing. La technologie, on l’aura compris, n’est pas une fin en soi.

Si la mise en place de cette nouvelle culture demande du temps aux institutions, il est à prévoir qu’il en sera de même pour les artisans de la communauté du documentaire.

Pour comprendre et faire comprendre ce qu’est le Web sémantique et à quoi servent les données liées, la Cinémathèque organise notamment des séances de formation visant à démystifier Wikipédia et Wikidata.

Pour le créateur du documentaire, le Web offre la possibilité de faire connaître sa réflexion au plus large public possible. Le Web sémantique nourrit la promesse que ces contenus deviennent accessibles non seulement par quelques mots-clés, mais aussi en exploitant la sémantique des informations.

En créant de nouvelles formes de production du savoir qui profitent aux citoyens et aux institutions, la Cinémathèque joue son rôle de chef de file dans la valorisation du cinéma.
En participant à ce projet, Marina Gallet entrevoit la grandeur du chantier. «Tout commence à prendre de l’ampleur», conclut-elle.

Il ne fait aucun doute que nous sommes au début d’une révolution.


Catherine Viau
Productrice à la télévision, Catherine Viau est vice-présidente du Groupe Via le Monde Inc., un consortium de production audiovisuelle fondé en 1967 par son associé Daniel Bertolino. Avec lui, Catherine a produit tous les films du Groupe depuis 1983 en plus d'assurer la distribution du catalogue à l’international et de participer aux grands marchés. Elle est aussi l’auteure et la réalisatrice de plusieurs documentaires. De plus, elle a initié de nombreuses coproductions internationales dans le domaine du documentaire, de la fiction et du contenu jeunesse. Elle pilote aussi les dossiers relatifs à la conservation, la numérisation et la commercialisation du riche patrimoine du groupe. Finalement, elle dirige la programmation du Festival cinéma du monde de Sherbrooke depuis sa création en 2014.
En savoir plus