En naviguant sur notre site vous acceptez l'installation et l'utilisation des cookies sur votre ordinateur. En savoir +

Menu Logo Principal

Datapartage

Principes FAIR

Principes FAIR (Findable, Accessible, Interoperable, Reusable)

L’objectif des principes FAIR est de favoriser la découverte, l’accès, l’interopérabilité et la réutilisation des données partagées. Ce tableau décrit les principes FAIR et les préconisations de l’INRA pour leur mise en œuvre.

Utilisez la barre en bas du tableau pour  visualiser la colonne de droite.

Principe

Traduction

Mise en œuvre et recommandations INRA

Questions à se poser lors de la rédaction d’un DMP[1]

Findable

F1 Les données et les métadonnées sont identifiées par un identifiant global unique et pérenne.

F2 Les métadonnées décrivant les données sont riches.

F3 Les données et les métadonnées sont enregistrées et indexées dans un dispositif permettant de les rechercher.

F4 Les métadonnées spécifient l’identifiant de la donnée.

Exemples de systèmes d'identification respectant ce principe et préconisés par l'INRA : DOI (Digital Object Identifier), Handle.

Si vous souhaitez utiliser des URI uniques et pérennes, un guide de bonnes pratiques est disponible ici [2].

Comment mettre en œuvre ce principe à l'INRA?

  • Identifiez vos données avec des DOI (ou des URI pérennes  si vous êtes dans une démarche Web sémantique. Voir le guide des URI INRA ici[1])
  • Référencez vos données dans le portail des données de l'INRA
  • Utilisez des standards de métadonnées pertinents pour votre communauté, de manière expressive (inférences possibles dans les recherches)
  • Mettez en œuvre des mécanismes d'interrogation standards (SPARQL, SQL, APIs standards)
  • Quelles données seront découvrables avec des métadonnées? Sont-elles identifiables et localisables par un mécanisme d'identification standardisé (identifiants pérennes et uniques tels que le DOI)?
  • Quelle convention de nommage utilisez-vous?
  • Avez-vous prévu des mots clés pour faciliter la réutilisation?
  • Quelles métadonnées sont utilisées pour décrire les données ?

Accessible

A1 Les données et les métadonnées sont accessibles par leur identifiant via un protocole de communication standardisé.

A1.1 Le protocole utilisé est ouvert, libre et peut être implémenté de manière universelle.

A1.2 Le protocole utilisé permet l’authentification et l’autorisation si besoin.

A2 Les métadonnées sont accessibles même quand les données ne le sont plus.

Exemple de protocole respectant les principes d'accessibilité et recommandé par l’INRA : HTTP

Si vous mettez vos données à disposition via des API, nous vous recommandons l'utilisation d'API REST basées sur le protocole http

Préférez le dépôt dans des entrepôts certifiés qui proposent un accès ouvert 

De préférence, les données et les métadonnées doivent correspondre aux standards des communautés indiquées 

  • Quelles données seront accessibles de manière ouverte? Avez-vous documenté les raisons pour lesquelles certaines données ne peuvent pas être partagées (ou doivent être partagées sous conditions particulières)?
  • Comment les données sont rendues accessibles (exemple : dépôt dans un entrepôt)?
  • Quelles méthodes et outils sont nécessaires pour accéder aux données?
  • Y a-t-il besoin d'une documentation des logiciels nécessaires pour accéder aux données?
  • Est-il possible de mettre à disposition les logiciels nécessaires (code open source)?
  • Où seront déposés les données, les métadonnées, la documentation et le code associés? 
  • Avez-vous pris contact avec l'entrepôt visé?
  • Si vous avez prévu des restrictions pour l'utilisation des données, comment comptez-vous donner accès aux personnes autorisées?
  • Y a-t-il besoin d'un organe de décision pour l'accès aux données?
  • Avez-vous décrit les conditions d'accès (par exemple une licence)?
  • Comment les personnes accédant aux données seront-elles authentifiées?

Interoperable

I1 Les données et les métadonnées utilisent un langage formel, accessible, partagé et largement applicable pour la représentation des connaissances.

I2 Les données et les métadonnées utilisent des vocabulaires qui respectent les principes FAIR.

I3 Les données et les métadonnées incluent des liens  vers d’autres (méta)données.

Exemples de langages pour la représentation des connaissances : OWL, RDF, RDFS, SKOS

En particulier, Les données et les métadonnées correspondent aux standards des communautés indiquées

  • Les données sont-elles interopérables ? Peuvent-elles être échangées et utilisées avec d'autres chercheurs, organismes, pays, etc.? Sont-elles conformes aux formats standards, compatibles avec les logiciels ouverts, combinables avec des données provenant de différentes autres sources?
  • Quels méthodologies et standards de données et de métadonnées utilisez-vous pour rendre les données interopérables?
  • Utilisez-vous des vocabulaires standards pour tous les types de données présents dans le jeu de données afin de permettre une interopérabilité interdisciplinaire?
  • Dans le cas où vous devez utiliser des ontologies ou des vocabulaires non standards, prévoyez-vous de faire des liens (mapping) vers des ontologies ou des vocabulaires communs ?

Reusable

R1 Les données et les métadonnées ont des attributs multiples et pertinents.

R1.1 Les données et les métadonnées sont mises à disposition selon une licence explicite et accessible.

R1.2 Les données et les métadonnées sont associées à leur provenance.

R1.3 Les données et les métadonnées correspondent aux standards des communautés indiquées.

Exemples de licences : voir notre section sur les licences : https://www6.inra.fr/datapartage/Partager-Publier/Choisir-une-licence 

Exemples de standards de métadonnées : voir section sur les métadonnées : https://www6.inra.fr/datapartage/Partager-Publier/Documenter-ses-donnees 

 

En plus de ces règles, nous recommandons que les données soient mises à disposition dans des formats ouverts et pérennes (voir https://www6.inra.fr/datapartage/Gerer/Choisir-des-formats-de-fichier)

  • Quelle licence sera associée aux données pour permettre une large utilisation?
  • Quand les données seront-elles mises à disposition pour de potentiels ré-utilisateurs?
  • Quel délai pour un éventuel embargo?
  • Les données sont-elles utilisables par des tiers, en particulier après la fin du projet? Quelles données sont à accès restreint et pourquoi?
  • Pour quelle durée les données seront-elles disponibles pour réutilisation?
  • Avez-vous décrit les processus d'assurance qualité des données?

 

[1] Guidelines on FAIR data Management in Horizon 2020 https://goo.gl/CsBvuH

[2] Lien vers le guide sur les URI du projet inter-cati sur les linked data