Juillet-Août 2019 : ouvrir les données de la recherche

Tous les mois, les BU de l’Université Bordeaux Montaigne envoient à ses abonnés la « newsletter Open Access » qui revient sur les actualités du libre accès du mois écoulé à travers une courte sélection thématisée avec soin par vos bibliothécaires. Pour être certain de la recevoir directement dans votre boîte mail, abonnez-vous ! : http://eepurl.com/bR0O3H

Quand on parle de « libre accès », on pense plus généralement aux publications scientifiques, c’est-à-dire aux produits « finis » de la recherche. Mais la notion de « Science Ouverte », plus générale, comprend aussi un enjeu important, celui de l’ouverture des données de la recherche, conçues comme l’ensemble des informations collectées ou produites par le chercheur. Là, la Science Ouverte rejoint un autre enjeu du débat contemporain : l’Open Data, et l’ouverture des données produites par des institutions publiques. Alors : pourquoi et comment ouvrir les données de la recherche ?

Qu’entend-on par « ouvrir » les données de la recherche ? Diffuser les matériaux de travail du chercheur en libre accès sur le Web pour permettre à d’autres chercheurs, ou même au monde non-académique, de les réutiliser. Oui, mais pas seulement. Le mot clé fondateur de l’ouverture des données de la recherche est le principe « FAIR », un concept pour exprimer l’objectif attendu par un projet de recherche quant aux données sur lesquelles il s’appuie : elles doivent être Faciles à trouver (indexation sur le Web), Accessibles (pas de barrière d’accès), Interopérables (ouverture au moissonnage dans des formats non propriétaires) et Réutilisables (juridiquement et techniquement). Ces quatre adjectifs constituent le fondement du Guide pratique pour une harmonisation internationale de la gestion des données de recherche, dont l’objectif est de s’assurer d’un socle minimal d’exigences auquel tout chercheur, quel que soit son pays et la politique nationale en la matière, peut se référer quand il souhaite « libérer » ses données. Ce guide peut donc être vu comme un point de départ lors de la rédaction de Plan de Gestion de Données, ou du choix d’entrepôts de données, pour éviter une trop grande dispersion des pratiques et des efforts alors même que l’enjeu des données de la recherche est encore récent.

https://www.ouvrirlascience.fr/science-europe-guide-pratique-pour-une-harmonisation-internationale-de-la-gestion-des-donnees-de-recherche/

La démarche de libération des données n’est pas anodine, et demande souvent un travail supplémentaire, et donc des moyens. C’est donc avant tout des financeurs de la recherche publique que l’incitation à l’ouverture des données émane. En France, l’Agence Nationale de la Recherche (ANR) ne s’était pas encore complètement alignée sur les recommandations européennes allant dans le sens de l’application de l’Open Data à la donnée de recherche. Maintenant qu’elle a signé le Plan S, elle semble faire évoluer plus nettement sa politique en la matière. Ainsi, un second de l’ANR, complémentaire du plan d’action ANR 2020, vient fournir les recommandations en matière de rédaction de Plan de Gestion de Données, ces derniers étant désormais obligatoires dans les projets. Il invite les chercheurs à « Encourager et suivre l’ouverture des données », et on y retrouve l’adage des défenseurs de la donnée ouverte : « aussi ouvert que possible, aussi fermé que nécessaire » ; en d’autres termes : tant que d’autres obligations légales (confidentialité, secret professionnel, secret défense, respect de la vie privée et du droit d’auteur…) n’en limite pas la diffusion, ces données doivent être accessibles à tous sur le Web, sans restriction.

https://www.ouvrirlascience.fr/plan-de-gestion-de-donnees-recommandations-a-lanr

Point d’orgue de cet engagement de l’ANR en faveur de la science ouverte, l’appel flash science ouverte, lancé en mai 2019 pour financer des projets de recherche spécifiquement tournés vers l’ouverture de données scientifiques, a rendu son verdict. On trouve ainsi 25 projets retenus, dans des domaines aussi variés que l’emblématique médiévale, les neurosciences ou l’anthropologie.

https://anr.fr/fileadmin/aap/2019/aap-data-2019-selection.pdf

Plusieurs de ces projets se concentrent spécifiquement sur les façons de mettre en œuvre pour faciliter l’ouverture des données : quelle interopérabilité ? quelles méthodes ? quelle certification ?

Les Plan de Gestion de Données sont nécessaires car on ne peut mettre en libre accès l’ensemble des données de recherche : une connaissance du contexte juridique est nécessaire, notamment en ce qui concerne les données personnelles. En lançant une consultation publique spécifique sur la recherche scientifique, la Commission nationale de l’informatique et des libertés (CNIL), vient précisément rappeler que l’Open Data de la donnée de recherche doit s’aligner sur d’autres droits fondamentaux. Dans de nombreuses disciplines (médecine, sociologie, histoire…) le matériau traité par le chercheur peut aussi constituer une donnée personnelle, et il importe de faire le point sur ces usages pour adapter les pratiques et ne pas diffuser n’importe quelle donnée. L’enquête permettra d’évaluer la réceptivité et la connaissance du monde académique à la législation sur les données personnelles.

https://www.cnil.fr/fr/webform/consultation-publique-recherche-scientifique

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s