DOCUMENTATION ET TRANSMISSION DE LA DANSE CONTEMPORAINE ET ACTUELLE QUÉBÉCOISE / FONDATION JEAN-PIERRE PERREAULT
EC2
guidemetadonnees-joseeplamondon

Bien documenter pour favoriser la découverte en ligne

Travailler avec des métadonnées

Guide rédigé par Josée Plamondon avec la Fondation Jean-Pierre Perreault dans le cadre de l’initiative La danse dans le web des données – Novembre 2019

Table des matières
Objectifs de ce guide

Le numérique, c’est de l’information traduite en nombres de façon à être traitée par des machines.

Produire des métadonnées, être découvrable et laisser des traces numériques sont les fruits d’un travail de documentation. Celui-ci est trop souvent escamoté par la recherche d’une solution technologique et par des choix qui sont ceux de spécialistes de domaines autres que celui de la danse.

Ce guide pratique présente aux acteurs du milieu de la danse une méthode et des outils faciles à utiliser qui leur permettront de réaliser un travail d’équipe autour de la production et de la réutilisation de métadonnées. Documenter correctement des contenus et des offres est la base d’un projet numérique, qu’il s’agisse de fournir des balises pour les moteurs de recherche ou de concevoir une base de données commune.

Les moyens techniques qui rendent toute information exploitable dans un contexte numérique requièrent les compétences de spécialistes. Mais l’expertise fondamentale est d’abord et avant tout celle des praticiens et théoriciens de la danse. C’est à eux que reviennent les choix concernant la représentation et la documentation de leurs connaissances et réalisations.

Nous verrons ainsi comment cartographier notre écosystème numérique, comment représenter de l’information sous forme de métadonnées et comment collaborer à un projet de documentation, en équipe, au sein d’une organisation ou avec des partenaires.

▼ suite
Crédits et licence

Le guide Bien documenter pour favoriser la découverte en ligne. Travailler avec des métadonnées est une production de la Fondation Jean-Pierre Perreault.

AUTEURE
Josée Plamondon

RÉVISION ET CORRECTION
Romy Snauwaert

CONCEPTION GRAPHIQUE DU PDF
Emilie Allard

DESIGN ET INTÉGRATION WEB
Christian Aubry

DÉPÔT LÉGAL – BIBLIOTHÈQUE ET ARCHIVES NATIONALES DU QUÉBEC, 2019
DÉPÔT LÉGAL – BIBLIOTHÈQUE ET ARCHIVES CANADA, 2019
ISBN : 978-2-924805-01-5

La Fondation Jean-Pierre Perreault est soutenue par le Conseil des arts et des lettres du Québec, le Conseil des arts du Canada et le Conseil des arts de Montréal.

noir_Logo_CAM+Montreal

La réalisation de ce guide bénéficie du soutien financier du Conseil des arts et des lettres du Québec, dans le cadre de la mesure Exploration et déploiement numérique.

Licence

Cette œuvre est mise à disposition sous licence Attribution–Pas d’utilisation commerciale 4.0 International.

▼ suite

Concepts clé

Donnée
Lucie Grégoire Danse

Une donnée est un élément d’information qui n’a pas de signification lorsqu’il est considéré séparément par rapport à d’autres données. Pour les familiers du milieu de la danse, cette donnée a un sens précis. Il peut s’agir d’une compagnie de danse, mais ce peut être également un extrait de texte ou la légende d’une photographie. Il manque de l’information pour donner un contexte à cette donnée et en comprendre le sens.

▼ suite ▲ retour
Métadonnée

Une métadonnée est une donnée qui donne sens à la donnée en question. Par exemple : « Lucie Grégoire Danse » pourrait avoir « compagnie » pour métadonnée.

La métadonnée fournit le sens et le contexte qui sont nécessaires pour interpréter la donnée et faire des liens entre les données.

On peut interpréter ces données comme suit : l’œuvre Eye a été créée par la compagnie Lucie Grégoire Danse, avec la collaboration de Yoshito Ohno.

œuvre Eye
compagnie Lucie Grégoire Danse
collaboration Yoshito Ohno
▼ suite ▲ retour
Métadonnée - Usage

Exemple de métadonnées dans une page WebImage: Numeridanse.

Les métadonnées servent à organiser et à trier de l’information et des documents.

Grâce à elles, nous pouvons interroger des catalogues, des répertoires et des bases de données.

▼ suite ▲ retour
Modèle de données

Un modèle de données fournit la liste des métadonnées qui servent à décrire quelque chose ainsi que la façon dont les données sont représentées.

Voici une version simplifiée d’un modèle de données qui permet de structurer l’information concernant des œuvres chorégraphiques, des interprètes et des spectacles.

Un ensemble de personnes et d’organisations qui souhaitent faciliter les échanges entre leurs systèmes d’information devraient mettre en commun un modèle de données.

Symbole d'un modèle de données

▼ suite ▲ retour
Base de données

Symbole d'une base de donnéeUne base de données est un dispositif informatique qui permet de stocker des données, de les structurer, de les analyser et de les interroger à l’aide d’applications diverses.

Une base de données peut également alimenter les pages d’un catalogue en ligne qui contient des images et des textes.

Symbolisée par un cylindre, dans les diagrammes décrivant les processus de traitement de l’information, une base de données permet d’entreposer les données de façon structurée et d’y accéder par le biais d’applications.

▼ suite ▲ retour
Base de données - Modèle

Diagramme de base de données Image: Wikimedia Commons – Wise Coders Solutions – Licence Art Libre (copyleft).

C’est la structure de la base de données, composée de tables et des relations entre celles-ci, qui donne du sens aux données.

Cette remarque est d’une très grande importance pour comprendre les défis de la mise en commun de données provenant de sources différentes.

Si nous extrayons toutes les données de la base, celles-ci ne font plus sens.

Il n’existe pas de modèle standard de structures de bases de données.

Les modèles de données sont rarement conçus pour être interopérables, c’est-à-dire qu’ils ne peuvent être connectés les uns aux autres, car ils n’utilisent pas de langage commun et ne sont pas conformes aux standards du web.

▼ suite ▲ retour
Balise

Le mot « balise » fait référence au dispositif de signalement utilisé dans le domaine des transports pour marquer un chemin à suivre ou pour signaler un accident.

Une balise désigne, par analogie, un marqueur intégré dans le code HTML d’une page web.

Invisible pour les internautes, elle fournit une information aux moteurs de recherche.

Certains types de métadonnées peuvent être intégrés au code HTML d’une page web sous forme de balises pour attirer l’attention des moteurs de recherche sur une information qui s’y trouve.

Par exemple, ce peut être une offre de spectacle de danse.

Page Web de Danse danse.
Page Web : Danse danse.

Outils de test de données structurées Image: outil de test des données structurées avec affichage des balises.

▼ suite ▲ retour

Stratégie

Évaluer et améliorer l’organisation de votre information

Produire des métadonnées n’est ni une stratégie ni une finalité.

La finalité des données est de générer l’information la plus riche possible afin de répondre à des questions à la satisfaction des publics cibles.

Les données, qui sont de l’information structurée afin d’en faciliter le traitement, sont des moyens.

Avant de produire des données, il est important de connaître le contexte dans lequel notre information est publiée sur un site web en particulier, et dans le web en général.

Il devient ainsi possible de déployer des liens qui relient notre information à toute autre information pertinente. Plus il y a de liens entre des œuvres, des personnes, des organisations, des lieux et des événements, plus le potentiel est grand, pour toutes ces informations, d’être trouvées et réutilisées.

Rendre une information découvrable, dans un monde numérique, c’est la rendre accessible sous forme de données, la lier à d’autres informations pour que nos traces numériques se déploient, à l’image des réseaux de neurones dans le corps humain.


Laisser des traces numériques : une démarche stratégique et spécifique à chacun
Quels sont les moyens qui sont à la portée des acteurs du milieu de la danse pour réaliser la partie la plus stratégique d’un projet numérique ?

▼ suite ▲ retour
Questions à se poser pour bien démarrer un projet

La finalité de projets de données est de générer l’information la plus précise possible, afin de répondre à des questions à la satisfaction des publics cibles. Toute initiative devrait donc débuter par un diagnostic quant à la disponibilité et à la qualité des données.

Cependant, comment effectuer un tel exercice sans savoir à quels besoins elles répondront ou, plus exactement, à quelles questions elles devront répondre?

La dimension cognitive des projets numériques se rapporte à la sélection, à l’organisation et au traitement de l’information. Ces activités doivent réunir des perspectives et compétences diversifiées : de la connaissance du domaine et des publics jusqu’à la modélisation de l’information.

Il s’agit d’un travail collaboratif, qui doit être réalisé en amont de la conception technique. Cette étape est rarement bien planifiée et réalisée, faute de budget, de ressources ou de bonne méthode de travail. Pourtant, elle constitue le cœur du projet. Ce processus permet d’améliorer la littératie numérique et de développer des pratiques collaboratives au sein d’une organisation ou dans le cadre d’un partenariat.

▼ suite ▲ retour
Exercice 1 – Évaluation de l’information sur votre site web

Un répertoire ou une collection de documents qui est difficilement repérable pour des humains le sera également pour les robots qui ratissent le web afin d’alimenter les moteurs de recherche.

Réalisée en équipe, avec prise de notes, cette évaluation est une activité de démarrage de projet qui devrait permettre de bien cerner l’écosystème de liens qui peut se constituer autour du contenu à mettre en valeur.

Exercice :

Analyser votre site web
  • Présentez-vous ce que vous avez à offrir sur un site web?
  • Y a-t-il une page web spécifique pour chacune de vos offres?
  • Y a-t-il des données à exploiter?
  • Avez-vous une base de données?
Trouver l’information qui concerne vos œuvres ou vos pratiques sur votre site
  • Parcours : quels chemins les internautes doivent-ils emprunter pour trouver votre répertoire? Analyser les parcours des internautes vers votre répertoire à partir de vos autres présences numériques (Facebook, YouTube, Vimeo et autres). Y a-t-il des chemins sans issue (sans lien évident vers le répertoire)?
  • Arborescence : votre répertoire est-il enfoui dans les profondeurs de votre site?
  • Menus : le répertoire ou l’information à mettre en valeur sont-ils facilement repérables dans le ou les menus du site?
  • Libellés : le vocabulaire permet-il d’identifier clairement le répertoire?
Évaluer la valeur informationnelle de vos données (dans un répertoire ou dans une base de données)
  • Quel est le rôle ou la mission de votre organisation?
  • Quels sont vos publics cibles?
  • À quels besoins d’information répondent (ou répondraient) vos données?
  • Quelles sont les formes d’organisation ou de catégorisation privilégiées?
  • Quels sont les attributs ou caractéristiques employés pour décrire le contenu de votre répertoire?
  • Comment le contenu du répertoire est-il relié au reste du site web?
  • Y a-t-il des liens vers d’autres sites qui peuvent offrir plus d’information (plateformes vidéo, centres d’artistes, institutions d’enseignement, Wikipédia)?
▼ suite ▲ retour
Exercice 2 – Cartographie de l’écosystème de liens

Établir votre identité, vos réalisations, votre historique, votre réseau de partenaires pour qu’à la fois des humains et des machines puissent suivre les liens qui les mèneront vers votre répertoire ou tout contenu que vous souhaitez mettre en valeur.

Cet exercice doit être réalisé en groupe, au sein d’une organisation ou avec les représentants de différentes organisations, lorsqu’il s’agit d’une initiative collective.

Visualisation graphique de l'écosystème de liens

Cartographier votre écosystème de liens
Volet stratégique: Comment cartographier notre écosystème numérique et dresser un portrait de nos interactions avec nos partenaires et nos publics ?

▼ suite ▲ retour
Cartographie de l’écosystème : tableau de l’inventaire des liens

Cartographier l’écosystème des liens qui mènent à votre répertoire :

  • Identifier les points qui permettent d’établir des liens.
  • Classifier les points selon le degré de contrôle que vous exercez sur le contenu, le choix des informations à publier et la façon dont ces informations sont publiées (publics, durée, visibilité, formats, mise à jour, etc.).
  • Qualifier les liens à l’aide d’un tableau (voir ci-dessous).
  • Identifier les points manquants, les liens à solidifier (rencontres en personne).
  • Planifier les améliorations à apporter à votre site (arborescence, menus, libellés) et relativement à vos présences sur des plateformes (rédaction, mots clés, optimisation).

Nous pouvons constater, avec cet exercice, que la documentation et la mise en valeur du contenu du répertoire sont intimement liées aux stratégies de promotion et de communication.

Les différents points qui ont été identifiés seront inventoriés et analysés dans un tableau.

Tableau d'inventaire des liens Capture d’écran d’un tableau d’inventaire des liens (feuille de calcul).

Comment compléter le tableau?
  • Site web : identifier les parcours (liens, menus, arborescence) qui mènent aux pages de votre répertoire.
  • Plateformes et référents : identifier les liens qui mènent vers le site web et, le cas échéant, vers le répertoire.

Préciser la nature des contenus qui peuvent comporter des liens, comment ces contenus sont publiés ou mis à jour et par qui.

Réalisée en groupe, cette activité permet à tous de mieux connaître les stratégies de rayonnement : activités de communication, partenariats, médias sociaux. Elle permet également d’identifier de nouveaux points (plateformes et référents) et liens potentiels.

La cartographie et le tableau vous aident à comprendre comment les mots, et donc les métadonnées, que vous allez produire peuvent être utilisés, et surtout, dans quels contextes.

Ces documents peuvent être mis à jour lors de rencontres de travail ou d’activités de planification.

▼ suite ▲ retour

Information

Pourquoi s’intéresser aux données?

Dessin ancien d'un classeur de bibliothèque Image: Wikimedia Commons.

L’organisation de documents ou d’objets à l’aide de métadonnées (titre, sujet, auteur, catégorie) est une pratique établie qui est antérieure à la naissance de l’informatique.

Dans un monde numérique, les données de nos répertoires et catalogues génèrent plus de valeur lorsqu’elles sont exposées et accessibles sur le web plutôt que lorsqu’elles sont stockées dans des bases de données. Elles permettent :

  • l’attribution des œuvres et la reconnaissance des créateurs et contributeurs.
  • la réduction de l’ambiguïté par croisement d’information (homonymie, crédits incomplets, description erronée, etc.).
  • l’accumulation de «traces numériques » (identité, réalisations, réseau d’influence).
  • le potentiel de connexions entre une création et toute autre information pertinente. Par exemple : artiste, lieu, thématique, média.
▼ suite ▲ retour
Pour représenter l’information sous forme de données
titre Boîte chorégraphique Cartes postales de Chimère
auteur Fondation Jean-Pierre Perreault, Poirier, Isabelle et Bédard, Louise
éditeur Fondation Jean-Pierre Perreault
ISBN 9782981549969
date 2016
chorégraphe Bédard, Louise
ISNI 0000 0000 7526 6744

Nous accédons à la culture et à la connaissance principalement par le biais de services et de réseaux numériques.

Ce sont les données qui permettent de structurer de l’information pour en faciliter le traitement par des machines.

Sur le web, les métadonnées permettent aux algorithmes d’interpréter l’information et de la relier à d’autres informations.

Dans un monde numérique, lier une information sur le web permet à des humains et à des machines d’en découvrir l’existence, de l’utiliser et de l’enrichir en créant de nouveaux liens.

▼ suite ▲ retour
Pour trouver et organiser de l’information

Les métadonnées qui sont utilisées pour décrire les vidéos de cette plateforme sont également des critères de recherche et de tri.

Page Web avec métadonnées comme critères de recherche et de tri
Image: Numeridanse

▼ suite ▲ retour
Pour relier des données qui représentent la même information

Grâce à la mise en relation de métadonnées (par exemple : rôle, œuvre, personne), un système peut générer de l’information sur la carrière d’une artiste (ses œuvres, les documents à son sujet et les auteurs liés à elle).

Documents et auteurs liés à Marie Chouinard.Marie Chouinard – Auteurs liés en tant qu’éditeur scientifique (BNF).

▼ suite ▲ retour
Exercice 3 – Création d’un modèle de métadonnées descriptives

Quelles sont les métadonnées et données qui servent à décrire l’œuvre, l’événement ou l’artiste de votre choix?

Exemple de tableau pour la création de métadonnées descriptives

Compléter ce tableau, dans le cadre d’une démarche collective, permet de définir les modalités de la mise en valeur et de la découverte d’un répertoire, sur votre site et ailleurs sur le web (voir exercice 1) :

Dans cet exemple :

  • La première ligne permet d’indiquer à quels usages sont destinées ces métadonnées : à titre de critère de recherche, de critère de tri et d’affichage de résultats, et de balise pour les moteurs de recherche (nous aborderons cet élément dans la section suivante).
  • La ligne Métadonnées contient les types d’information nécessaires ou souhaités pour décrire une production.
  • La ligne du dessous précise si ces métadonnées sont obligatoires ou optionnelles.
  • La ligne Format requis permet de spécifier sous quelle forme l’information doit être fournie. Par exemple : aaaa-mm-jj pour une date ; nom, prénom pour un nom ; la longueur maximale d’une description ; la référence à une liste d’options.
  • Les lignes Objet de la description contiendraient les données correspondant aux types d’information requis pour chacun des objets à documenter.
  • Il est possible d’insérer des colonnes supplémentaires pour ajouter de nouvelles métadonnées.

Exercice:

  1. Reporter dans le tableau les données qui pourraient être utilisées pour décrire un objet du répertoire en pensant aux usages des métadonnées.
  2. Déterminer les types d’information qui constituent un attrait et une valeur pour les différents publics.
  3. Bien documenter les images et les vidéos : nommer les fichiers en employant des mots clés (description du sujet) facilite la recherche et l’association des images aux autres types de contenu.
  4. Déterminer les catégories qui permettent de comprendre la nature des contenus.
  5. Identifier les étiquettes qui permettent de constituer des regroupements intéressants pour les publics cibles.
  6. Utiliser des hyperliens pour fournir de l’information additionnelle provenant d’autres sources sur le web.
  7. Fournir des éléments descriptifs qui permettent d’imaginer différents usages.


Volet documentaire: Comment transposer sous forme de données l’information qui décrit ce que vous souhaitez représenter?

▼ suite ▲ retour

Technologie

Optimiser la recherche et la découverte dans le web des données

Cette section se penche sur les deux avenues qui s’offrent à nous pour documenter la danse dans le web des données :

  1. Balises pour moteurs de recherche
    La description de contenu web sous forme de balises à l’usage des balises des moteurs de recherche.
  2. Données ouvertes et liées
    L’utilisation des standards du web pour mettre à la disposition de tous des données qui peuvent être interprétées, réutilisées et liées à d’autres données, indépendamment des systèmes informatiques.
▼ suite ▲ retour

1 – Balises pour moteur de recherche

Métadonnées sous forme de balises pour moteurs de recherche

Les moteurs de recherche deviennent de plus en plus intelligents.

En effet, les nouveaux algorithmes ne cherchent pas des mots clés, mais de l’information sous forme de données structurées et interprétables grâce à des métadonnées.

Au-delà de la liste des liens des résultats de recherche, les réponses données par les algorithmes peuvent maintenant prendre la forme d’un ensemble de connexions à des contenus et à des personnes.

Ce sont des métadonnées qui aident les moteurs de recherche à comprendre un contenu et son contexte pour le lier à son système d’organisation des connaissances.

Ce sont ces liens, comme ceux qui sont mis en évidence ci-dessous, qui permettent de générer les résultats les plus précis possible pour les utilisateurs.

C’est pourquoi, afin de gagner en découvrabilité, les sites web doivent dorénavant contenir de l’information destinée à la fois à des humains et à des machines.

Exemple d'utilisation des métadonnées par Google Image: résultats de recherche Google pour «Paul-André Fortier».

▼ suite ▲ retour
Exercice 4 – Validation de la présence de métadonnées pour moteurs de recherche dans une page web

Les moteurs de recherche recommandent aux éditeurs de sites web d’utiliser des métadonnées pour décrire certains types de contenu, notamment des offres et des profils d’entreprises.

Il est possible de vérifier si ces métadonnées sont bien présentes dans des pages web avec l’outil de test des données structurées de Google :

Formulaire de test

Exercice :

Y a-t-il des métadonnées pour moteurs de recherche dans cette page?

Vous pouvez valider la présence de métadonnées destinées aux moteurs de recherche dans les pages de répertoires en ligne ou dans toute offre d’information, comme des spectacles.

  • Cliquez sur le lien pour ouvrir la page de l’outil de test. La boîte « Tester vos données structurées » est ouverte, en premier plan.
  • Copiez l’URL de la page web que vous souhaitez tester et collez-la dans le champ « Saisir une URL ».
  • Cliquez sur le bouton « Tester » et laissez l’outil travailler.
  • La section gauche de la page présente maintenant le code HTML qui permet à votre navigateur d’afficher le contenu de la page web analysée.
  • La section droite de la page présente, sous une forme lisible pour les humains, les métadonnées qui ont été repérées par les moteurs de recherche.
  • Si cette section reste vide, c’est que la présence de ces métadonnées n’a pas été détectée.

Les données erronées et les problèmes de syntaxe sont signalés (cliquez sur « Erreur » ou « Avertissement », placés sous la rubrique « Nouveau test ») et peuvent être corrigés.

Cependant, certaines informations manquantes (acteurs, pays d’origine, langue) et incohérences (description d’un contenu qui n’est pas le sujet de la page) ne seront pas signalées.

Vous pouvez effectuer l’analyse d’une autre page web en cliquant sur « Nouveau test », dans le coin supérieur droit de la page. N’oubliez pas de supprimer l’URL que vous aviez testée antérieurement avant de saisir la nouvelle.

▼ suite ▲ retour
Balises : les métadonnées selon le vocabulaire des moteurs de recherche

Schema.org est un modèle de données structurées pour produire les balises sémantiques qui permettent aux moteurs de recherche de repérer et d’interpréter les ressources décrites.

Cependant, la conception du vocabulaire et l’organisation des connaissances correspondent davantage aux modèles d’affaires des moteurs de recherche qu’aux besoins de documentation des différents domaines d’activité.

Par exemple, en danse contemporaine, il est impossible avec Schema.org de bien documenter le processus de création, les rôles des différents contributeurs et les différentes interprétations d’une même œuvre.

Page we du groupe de danse de Schema.org. Image: Schema.org DanceGroup.

Dans la catégorie CreativeWork (œuvre de création), il n’y a pas de modèle de métadonnées pour décrire une œuvre chorégraphique. Il existe toutefois un modèle pour décrire un spectacle de danse (offre commerciale).

La catégorie CreativeWork comprend une grande variété de modèles descriptifs qui ne s’appliquent pas nécessairement aux domaines culturels et artistiques, comme les diètes d’amaigrissement, les conversations ou les routines d’exercice physique (voir image ci-dessus).

▼ suite ▲ retour
Décrire un spectacle et une vidéo pour Google

Schema.org est le vocabulaire commun des moteurs de recherche. Cependant, ces derniers exploitent les balises selon leurs propres règles. À titre d’exemple, voici comment Google recommande d’utiliser les balises et les modèles du vocabulaire Schema pour décrire un spectacle et une vidéo.

Décrire un spectacle :

Quelles sont les informations qui doivent être fournies sous forme de balises et qui doivent être visibles sur la page?

Page web de la création UNFOLD | 7 perspectives. Image: Page web de UNFOLD | 7 perspectives, une création du Carré des Lombes.

  • Un événement = une page (URL)
  • Données balisées = information dans la page

Données essentielles

  • Nom de l’événement
  • Lieu de l’événement
  • Adresse
  • Date de début

Données recommandées

  • Description de l’événement
  • Date de fin
  • Image
  • Artiste
  • Billets

Plus de détails: Marqueur de données : événements (Google Search Console)

Décrire une vidéo :

Quelles sont les informations qui doivent être fournies sous forme de balises et qui doivent être visibles sur la page?

Recherche Google: «Louise Bédard Danse». Image: Recherche Google pour «Louise Bédard Danse».

  • Une vidéo = une page (URL) pour résultat optimal
  • Données balisées = information dans la page
  • Développer les liens (site web, plateforme vidéo, agrégateur, médias sociaux)

Données essentielles

  • Nom
  • Description
  • URL de la vignette (image de la vidéo)
  • Date de la première publication vidéo

Données recommandées

  • URL de visionnement (plateforme de visionnement ou fichier vidéo sur le site même)
  • Durée

Plus de détails: Guide et modèle de métadonnées pour vidéos (Google Search Console)

▼ suite ▲ retour
Exercice 5 – Se familiariser avec les métadonnées grâce à l’outil d’aide au balisage de Google

L’outil d’aide au balisage de Google explique comment créer des métadonnées sous forme de balises pour certains types d’offres.

Google Markup Helper

  • Sélectionnez, parmi les types d’offre présents, celui qui correspond à l’offre qui est présentée dans la page que vous avez choisie.
  • Copiez l’URL de la page et collez-le dans le champ « url », puis cliquez sur le bouton « Commencer le balisage ».
  • L’outil affiche la page dont vous avez fourni l’URL afin que vous indiquiez les éléments d’information qui s’y trouvent et qui décrivent l’offre.
  • Il vous propose, dans la partie droite de l’écran, une liste des métadonnées qui fournissent une description de base pour le type d’offre que vous avez choisi.
  • Sélectionnez avec le pointeur de la souris, dans la page affichée, des éléments d’information qui y sont présents pour faire apparaître un choix de métadonnées. Cliquer sur une option et fournir l’information requise permet d’ajouter des métadonnées dans la liste qui se trouve à droite de l’écran.
  • Lorsque les métadonnées sont complètes, cliquez sur le bouton rouge « Créer le code HTML », qui se trouve dans le coin supérieur droit de l’écran. L’application générera les métadonnées sous forme de balises Schema. Vous remarquerez que ces balises sont encodées dans un langage informatique. Celui-ci est appelé JSON-LD; « LD » signifie « Linked Data », ou données liées, et il est préconisé par Google.
  • Cliquez sur le bouton « Télécharger », dans le coin supérieur droit de l’écran, pour obtenir un fichier contenant le code du balisage. Si vous avez les droits d’accès au code source des pages de votre site web, vous pourriez copier et coller le code dans le code HTML de la page afin d’y intégrer les balises.
  • Vous pourriez également tester la présence et la qualité des balises avec l’outil de test des données structurées dont vous vous êtes servi plus tôt.

Cet outil d’aide au balisage permet de comprendre, en suivant les instructions affichées à l’écran, quelles sont les métadonnées recherchées par Google. Vous pouvez alors constater l’importance de l’utilisation des balises lors de la conception des pages web, ainsi que la pertinence du choix des éléments d’information et des images.

▼ suite ▲ retour

2 – Données ouvertes et liées

Web des données : le web comme base de données

En 2001, plus d’une décennie après avoir inventé le web afin de partager des documents en réseau, Tim Berners-Lee propose de renforcer cet espace de collaboration en rendant les données plus facilement utilisables et interprétables par des machines.

Dans cette nouvelle extension du web, appelée web sémantique, des données peuvent être échangées et réutilisées, indépendamment des environnements matériels et logiciels. Une donnée devient alors une ressource, au même titre qu’un document.

  • Dans le web des documents, les pages (ou ressources) sont localisées sur le web et identifiées par une URL (Uniform Resource Locator).
  • Dans le web des données, les données, qui sont aussi des ressources, peuvent être identifiées sur le web par un URI (Uniform Resource Identifier).

Diagrammes: sous le web, sur le web, dans le web. Image de droite (web des données): Société des musées du Québec.

Que les ressources décrites soient tangibles ou intangibles, c’est leur représentation qui se trouve exposée dans le web.

Le web de données permet donc de profiter des avantages de la séparation du contenu et de la forme.

Il bénéficie également des standards permettant de décrire des connaissances et de les rendre accessibles sur le web dans des formats lisibles par des machines.

Concrètement, cela signifie que des créateurs et des organisations peuvent faire préparer les données qui décrivent leurs répertoires et collections afin qu’elles puissent être repérées sur le web, réutilisées et croisées avec d’autres données par des chercheurs, par d’autres institutions ou par des développeurs d’applications.

▼ suite ▲ retour
Données ouvertes et liées : qu’est-ce que c’est?
Données ouvertes

Libérer des données est, en soi, un projet qui demande des ressources spécialisées. Il s’agit de constituer un ensemble de données qui décrivent une collection, par exemple, et de le mettre à la disposition d’utilisateurs sous forme de fichier en lui attribuant une licence d’utilisation ouverte.

Données liées

Lier des données est un projet complexe qui demande une bonne démarche de préparation. De manière similaire à une page web, on publie une donnée dans le web en lui fournissant une adresse ou URI (Uniform Resource Identifier) selon le même protocole de transmission que dans le cas d’une page web (HTTP).

Grâce aux URI qui les identifient, les données ouvertes sont référencées sur le web. À l’aide des ressources qui sont décrites par les URI, le web sémantique propose deux notions très importantes, soit référer à des concepts (et non à du texte) et faire des liens entre ces concepts.

The Linked Open Data Cloud

Les données ouvertes et liées présentent un grand potentiel d’innovation et de promotion de la culture, aussi bien pour les institutions et les gouvernements que pour l’ensemble de la société. En effet, elles :

  • favorisent l’adoption des standards du web ;
  • accordent à leurs utilisateurs la maîtrise de leurs modes de description ;
  • réduisent la dépendance aux grands acteurs du web ;
  • accroissent le potentiel de découvrabilité des collections (ouverture des données, interconnexions) ;
  • favorisent le développement de compétences essentielles à l’ère de l’intelligence artificielle (logique, représentation des connaissances) ;
  • font émerger de nouvelles pratiques davantage collaboratives et efficaces (interdisciplinarité, décentralisation).
▼ suite ▲ retour
Relier les données de différentes institutions et organisations culturelles

Plus les données qui décrivent des collections sont variées et complètes, plus le potentiel de liens entre celles-ci est grand.

Ce qui est fondamental dans un projet de données ouvertes et liées, ce n’est pas la technologie, mais la grande diversité des perspectives que différents contributeurs et partenaires peuvent avoir sur l’objet de la documentation.

Il est donc important d’identifier tous les contributeurs d’une œuvre ou d’une performance, quels que soient leurs rôles, et de fournir l’information nécessaire pour comprendre l’origine d’une œuvre et son évolution dans le temps.

Plus ces perspectives sont diversifiées, plus la documentation sera riche et plus la possibilité d’établir des liens augmentera.

Visualisation de données ouvertes et liées à propos de Marie Chouinard Visualisation de données ouvertes et liées à propos de Marie Chouinard (LodLive).

Situation fictive

Voici la représentation de liens potentiels entre les données de différentes sources, si on imaginait que ces données étaient mises à disposition des utilisateurs selon les standards du web.

Diagramme de données ouvertes et liées

Les initiatives visant à produire des données ouvertes et liées et à exploiter les avantages des technologies du web sémantique sont des projets complexes.
On peut cependant mesurer le potentiel des données ouvertes et liées, dans le cadre de la mise en valeur du patrimoine de la danse, avec des réalisations comme celles-ci :

  • Joconde Lab propose différentes façons de visualiser l’information concernant des œuvres, à l’aide de données ouvertes et liées de collections muséales et d’articles issus de Wikipédia.
  • Europeana est une plateforme qui relie les données de collections du patrimoine européen sous différentes thématiques et qui donne accès aux sites des différents contributeurs.
▼ suite ▲ retour
Optimiser la recherche et la découverte : deux objectifs
1 – Rendre des offres interprétables pour les moteurs de recherche
  • Langage de balisage (aussi appelé données structurées) pour moteurs de recherche et assistants vocaux.
  • Forme d’optimisation à présent essentielle pour tout site web (assistants vocaux).
  • À utiliser en complémentarité avec les techniques de référencement de pages web pour, notamment, valoriser les répertoires, catalogues et collections.

Résultats attendus : pas de visites ni de ventes, mais une augmentation de la capacité des moteurs de recherche à utiliser vos métadonnées pour fournir une information précise à un utilisateur.

2–Relier des connaissances, des collections et des projets
  • Données ouvertes : mises à la disposition d’utilisateurs, en format tabulaire, sous forme de fichiers prêts à télécharger.
  • Données liées : mises à disposition dans le web, dans un format qui permet de relier des données à d’autres données sur la danse.
  • Technologies et concepts complexes qui ne sont pas accessibles à tous. Type de projet qui convient à de grandes organisations ou à des démarches collectives, comme la mise en commun de connaissances.

Résultats attendus : écosystèmes informationnels qui alimentent des services et transcendent les disciplines, pratiques, langues et cultures ; développement de nouvelles connaissances, perspectives et compétences, notamment en lien avec l’intelligence artificielle.

▼ suite ▲ retour
Bien documenter la danse : définir votre propre modèle

Assurément, la représentation d’information sous forme de balises est désormais aussi essentielle pour des moteurs de recherche que l’est le respect des conventions de référencement de pages web (qui ont également été établies par les moteurs de recherche).

Cependant, la connaissance ne peut se limiter à l’indexation du web par des plateformes.

Le vocabulaire de balisage utilisé par les moteurs de recherche repose sur une représentation uniformisée et une perspective unique : cela ne permet pas de servir adéquatement la diversité des besoins de documentation et de recherche des acteurs du domaine de la danse en particulier, et de la culture en général.

Par où commencer?

Que vous souhaitiez documenter pour des moteurs de recherche, pour contribuer à une initiative de données ouvertes et liées ou, tout simplement, pour mettre votre répertoire en valeur sur votre site web, les trois premiers exercices de ce guide sont fondamentaux :

  • Évaluation de l’information sur votre site web.
  • Cartographie et inventaire de l’écosystème de liens.
  • Création d’un modèle de métadonnées descriptives.

Ils fournissent des bases qui facilitent le travail d’équipe et permettent de visualiser de façon plus concrète les métadonnées et les relations qui documentent des entités (personnes, œuvres, lieux, objets).

Lorsque vous disposerez d’un modèle de données, vous pourrez sélectionner les métadonnées qui vous serviront de critères de recherche et de critères de tri pour exploiter un catalogue en ligne, ou qui formeront des balises pour les moteurs de recherche.

Comment mettre en valeur vos réalisations sur votre site web?
  • Définir les modalités de la mise en valeur et de la découverte sur votre site.
    • Déterminer les éléments d’information qui constituent une valeur pour les différents publics.
    • Préparer votre modèle de métadonnées.
    • Identifier, pour chaque contenu, les informations qui permettent de faire des liens afin de créer des regroupements (thématique, culture, etc.).
  • Faciliter le travail des moteurs de recherche sans leur livrer toutes vos données et contenus.
    • Suivre les bonnes pratiques de référencement pour votre site web.
    • Identifier les balises élémentaires exigées pour décrire vos offres.
    • Combiner l’optimisation de pages web, l’intégration des balises et le développement de liens pour accroître vos traces numériques.
▼ suite ▲ retour

Collaboration

Documenter la danse : un projet qui crée du lien

Travailler en groupe ou avec des partenaires, sur des données, est une opportunité d’apprentissage et d’acquisition de pratiques collaboratives au sein d’une organisation.

Mise en place de nouvelles façons de travailler :

  • Décentralisation des prises de décision.
  • Abolition des silos d’information.
  • Mise en commun de l’information.

Réaliser un projet de documentation, avec des partenaires, crée du lien.

  • L’atteinte des objectifs est tributaire de l’élaboration d’une vision stratégique partagée par tous les acteurs concernés.
  • Il est essentiel que les objectifs individuels des partenaires soient alignés sur une compréhension commune de l’objectif central.
  • Les enjeux sémantiques, techniques, juridiques et organisationnels doivent être cernés, définis et priorisés par les contributions de chacun des partenaires.
  • Les objectifs stratégiques doivent guider le développement technologique (et non l’inverse).
  • Si vous envisagez de produire des données ouvertes et liées, c’est un défi qui ne saurait être mené à bien qu’avec des partenaires.

Volet technologique : Données ouvertes et liées et balises pour moteurs de recherche: quelles différences y a-t-il entre ces deux moyens techniques pour rendre des données interprétables ?

▼ suite ▲ retour
Bien planifier son projet pour augmenter son incidence

À qui est destinée l’information?
Accessibilité et réutilisation des données : des outils à la portée des utilisateurs.

À quelles questions répondent les données?
Être à l’écoute des problèmes, des intérêts et des besoins (grand public, chercheurs, institutions).

Les données ouvertes et liées sont-elles soutenues par l’esprit de l’organisme?
Le projet est pensé et porté par une équipe interdisciplinaire ayant une démarche ouverte et collaborative.

Les applications et interfaces s’interposent-elles trop entre les contenus et les utilisateurs?
Les technologies et les compétences numériques requises ne doivent en aucun cas être un frein à l’engagement des utilisateurs.

Le projet bénéficie-t-il du soutien de l’écosystème élargi (local, international)?
Assurer la continuité et l’évolution du projet en établissant des liens avec d’autres initiatives pertinentes.

▼ suite ▲ retour
Anticiper les défis de la collaboration ou de la mise en commun de données

Voici les principaux défis que comportent les projets collaboratifs à propos des données :

  • Définition des rôles de chacun dans un cadre décisionnel collectif.
  • Existence de silos disciplinaires, technologiques et organisationnels à éviter ou à éradiquer.
  • Établissement des priorités, par exemple à quels besoins devront répondre les données.
  • Hétérogénéité des formats, des vocabulaires et des structures et approches d’harmonisation possibles.
  • Libération de données ; concevoir un ensemble de données ouvertes est en soi un projet.
  • Accessibilité des données, les droits d’auteur sur les images et les vocabulaires exclusifs.
▼ suite ▲ retour

Conclusion

Transformation, maturité ou stratégie numérique : penser «réseau»

Ce ne sont pas les mises à niveau technologiques ni l’acquisition de nouveaux usages qui opèrent la transformation numérique des organisations. Ce sont l’adoption de nouveaux modes de gestion de l’information : la décentralisation des prises de décision, l’abolition des silos disciplinaires et la mise en commun de documents et de données.

La finalité de tels projets communs est de faire émerger l’intelligence collective permettant de produire de la connaissance, et non de développer des systèmes.

Documenter la danse dans le web des données nous amène à considérer le numérique comme un écosystème d’acteurs, de domaines de connaissances et de moyens technologiques interdépendants.

Pour demeurer pertinents dans un contexte numérique, nous ne pouvons faire autrement que d’expérimenter des méthodes de travail collaboratives dans l’organisation et la gestion de l’information.

Ce guide fournit au milieu de la danse des moyens qui sont à la portée de chacun afin de réaliser la partie la plus stratégique d’un projet numérique : décider de la façon dont une œuvre, par exemple, doit être documentée et déterminer ce qui la relie à d’autres informations dans le web des données.

N’oublions pas que le numérique, c’est d’abord de l’information.

▲ retour