Métadonnées des scènes eCorpus et interopérabilité

Métadonnées des scènes eCorpus

:warning: ce document fait référence à des fonctionnalités en cours de développement
:warning: Les informations présentées sont susceptibles d’être modifiées

TODO

  • relever toutes les équivalences eCorpus ↔ Dublin Core
  • Annoter les vocabulaires applicables selon LIDO-MC
  • Finaliser le vocabulaire des relations (voir: :black_flag: )

Normes applicables

dcterms DCMI: DCMI Metadata Terms

Quand applicable, les métadonnées sont structurées en respectant la norme ISO 15836-2:2019, dite dcmi-terms. Le prefixe dcterms: est omis dans un soucis de concision et de lisibilité. Seuls les champs pertinents sont définis mais l’ensemble des termes dcterms sont considérés comme réservés.

Vocabulaires contrôlés

La capacité à diffuser les métadonnées propres d’eCorpus au format :xml: LIDO est un objectif envisagé. Ce format suppose l’utilisation d’un vocabulaire contrôlé pour un certain nombre de champs. On peut se référencer à la specification LIDO elle-même, qui utilise le système SKOS mais délègue la définition des Thésaurus aux profils d’application. Dans le cas de la France c’est LIDO-MC qui s’applique (
Profil d’application LIDO-MC.pdf (2,1 Mo)). Concrètement, on appliquera généralement des thésaurus de getty.edu ou de data.culture.fr.

La terminologie « de base » pour LIDO est documentée ici : xTree.public

Title

:fr: localisé: oui

Texte extrait du document scene.svx.json, champ titre dans l’onglet collection.

Language

:fr: localisé: oui

code alpha2 ISO 639-1)

Rights Holder

:fr: localisé: non

Le « copyright holder » peut être extrait du champ asset.copyright du fichier scene.svx.json.

License

:fr: localisé: non

Un [LicenseDocument]DCMI: DCMI Metadata Terms). Devrait idéalement être une URL. à défaut une chaîne libre.

DCMI ne précise pas le vocabulaire utilisé mais le type RigthsType de LIDO recommende un vocabulaire contrôlé issu de rightsstatements.org ou les licences Creative Commons

Exemples:

Une license applicable pourrait être déduite du champ asset.copyright (ex: chercher CC-*) mais c’est probablement une mauvaise pratique. :black_flag: Ajouter un champ asset.license au vocabulaire contrôlé pourrait être adapté (permet de stocker la license avec la scène y compris lors d’un export ZIP).

Contributor

:warning: eCorpus utilise des username / emails, pas vraiment compatibles

:fr: localisé: non

Liste des contributeurs pour cette scène. Idéalement, URI désignant le contributeur. à défaut son identifiant

Created

:fr: localisé: non

Date (ISO 8601) de création de la scène telle que renvoyée par le champ ctime de celle-ci.

Modified

:fr: localisé: non

Date (ISO 8601) de création de la scène telle que renvoyée par le champ mtime de celle-ci.

Creator

:fr: localisé: non

Identifiant (URL ou nom) du créateur de la scène

Description

:fr: localisé: oui

Résumé non-exhaustif des contenus textuels de du fichier scene.svx.json selon pertinence

Format

:fr: localisé: non

MIME non-standard (pas répertorié par l’IANA) application/si-dpo-3d.document+json.

:question: Le mime du document devrait-il être remonté sur la scène via le champ meta ?

Subject ( :black_flag: proposition)

:fr: localisé: oui

Elements de language décrivant le sujet de la scène. Idéalement faisant référence à une ontologie ou un vocabulaire contrôlé.

:question: Pouvoir associer des tags à des éléments de vocabulaire? Pouvoir associer des métadonnées à des tags (pour marquer la signification « sujet » du tag)?

relations ( :black_flag: proposition)

Liste des relations utiles identifiées:

  • isFormatOf si la scène est une représentation canonique d’un objet identifié.
  • source si la scène découle évidemment d’un objet identifié
  • references si la scène est en relation avec un objet sans lien de parenté précis
  • isPartOf: Référence possible vers les différents modèles 3D présents dans la scène.

:no_entry_sign: Le support des références inverses (hasFormat, hasPart) n’est pas prévu. Elles pourront être générées à l’export.

:question: Ajouter les relations supplémentaires définies dans dublin-core: replaces, requires, conformsTo, isVersionOf?

:question: Ajouter une relation générique?

Les relations sont de type Relation. Les URI (Idéalement, URN. à défaut une URL) ne sont pas strictement requises par le standard mais devraient l’être par eCorpus.

L’adjonction de relations externes à une scène eCorpus permet d’informer le type de contenu représenté. Typiquement, une référence à l’oeuvre en question via une relation source ou isFormatOf.

Si applicable, des éléments de métadonnées du sujet pourront être récoltés pour fournir des informations complémentaires sous forme libre.

Ces données ne sont pas supposées faire autorité et seront exclues des exports de métadonnées d’eCorpus à l’exception du champ uri qui servira à l’établissement d’une relation

:question: les relations doivent-elles être localisées? si non, comment localise-t-on les métadonnées? Difficile de vérifier l’applicabilité puisque les sources explorées ne sont pas multi-locales.