En savoir plus

Notre utilisation de cookies

« Cookies » désigne un ensemble d’informations déposées dans le terminal de l’utilisateur lorsque celui-ci navigue sur un site web. Il s’agit d’un fichier contenant notamment un identifiant sous forme de numéro, le nom du serveur qui l’a déposé et éventuellement une date d’expiration. Grâce aux cookies, des informations sur votre visite, notamment votre langue de prédilection et d'autres paramètres, sont enregistrées sur le site web. Cela peut faciliter votre visite suivante sur ce site et renforcer l'utilité de ce dernier pour vous.

Afin d’améliorer votre expérience, nous utilisons des cookies pour conserver certaines informations de connexion et fournir une navigation sûre, collecter des statistiques en vue d’optimiser les fonctionnalités du site. Afin de voir précisément tous les cookies que nous utilisons, nous vous invitons à télécharger « Ghostery », une extension gratuite pour navigateurs permettant de les détecter et, dans certains cas, de les bloquer.

Ghostery est disponible gratuitement à cette adresse : https://www.ghostery.com/fr/products/

Vous pouvez également consulter le site de la CNIL afin d’apprendre à paramétrer votre navigateur pour contrôler les dépôts de cookies sur votre terminal.

S’agissant des cookies publicitaires déposés par des tiers, vous pouvez également vous connecter au site http://www.youronlinechoices.com/fr/controler-ses-cookies/, proposé par les professionnels de la publicité digitale regroupés au sein de l’association européenne EDAA (European Digital Advertising Alliance). Vous pourrez ainsi refuser ou accepter les cookies utilisés par les adhérents de l'EDAA.

Il est par ailleurs possible de s’opposer à certains cookies tiers directement auprès des éditeurs :

Catégorie de cookie

Moyens de désactivation

Cookies analytiques et de performance

Realytics
Google Analytics
Spoteffects
Optimizely

Cookies de ciblage ou publicitaires

DoubleClick
Mediarithmics

Les différents types de cookies pouvant être utilisés sur nos sites internet sont les suivants :

Cookies obligatoires

Cookies fonctionnels

Cookies sociaux et publicitaires

Ces cookies sont nécessaires au bon fonctionnement du site, ils ne peuvent pas être désactivés. Ils nous sont utiles pour vous fournir une connexion sécuritaire et assurer la disponibilité a minima de notre site internet.

Ces cookies nous permettent d’analyser l’utilisation du site afin de pouvoir en mesurer et en améliorer la performance. Ils nous permettent par exemple de conserver vos informations de connexion et d’afficher de façon plus cohérente les différents modules de notre site.

Ces cookies sont utilisés par des agences de publicité (par exemple Google) et par des réseaux sociaux (par exemple LinkedIn et Facebook) et autorisent notamment le partage des pages sur les réseaux sociaux, la publication de commentaires, la diffusion (sur notre site ou non) de publicités adaptées à vos centres d’intérêt.

Sur nos CMS EZPublish, il s’agit des cookies sessions CAS et PHP et du cookie New Relic pour le monitoring (IP, délais de réponse).

Ces cookies sont supprimés à la fin de la session (déconnexion ou fermeture du navigateur)

Sur nos CMS EZPublish, il s’agit du cookie XiTi pour la mesure d’audience. La société AT Internet est notre sous-traitant et conserve les informations (IP, date et heure de connexion, durée de connexion, pages consultées) 6 mois.

Sur nos CMS EZPublish, il n’y a pas de cookie de ce type.

Pour obtenir plus d’informations concernant les cookies que nous utilisons, vous pouvez vous adresser au Déléguée Informatique et Libertés de l’INRA par email à cil-dpo@inra.fr ou par courrier à :

INRA
24, chemin de Borde Rouge –Auzeville – CS52627
31326 Castanet Tolosan cedex - France

Dernière mise à jour : Mai 2018

Menu Logo Principal DepartementEAtexte

Publier la Science

Edito PLAS 11

Data publishing

Par Joachim Schöpfel, Maître de conférences, GERiiCO, Université de Lille 3

data_publishing
Source : Wikimedia[1]

Vous publiez ? Oubliez les articles. Dépassés. Trop longs. Trop lents. Trop consommateur de temps. En plus, la moitié des manuscrits sont rejetés. Et même si votre article est accepté – sérieusement, qui aura le temps de le lire ? Tout le monde vous le dira : il y a trop de revues, il y a trop d’articles, tout cela coûte cher, la qualité n’est pas toujours au rendez-vous ; et ne parlons pas des failles du facteur d’impact.

Oubliez donc les articles. Ce qui compte aujourd’hui, ce sont les données. Vous avez entendu parler de l’Open Data, de l’ouverture des données publiques. Vous avez du entendre promouvoir leBig Data comme nouveau challenge et eldorado de l’économie numérique. Et à coup sûr, quelqu’un – votre Vice Président recherche, votre directeur IST, votre Ministère, la Commission Européenne – vous a fait remarquer récemment qu’il faut mettre les résultats bruts à la disposition de tout le monde dans la mesure où votre recherche est payée par les contribuables. Et ceci dans un régime aussi libéral que possible, pour stimuler la recherche et l’économie.Open science oblige.

Les précurseurs de l’eScience l’avaient annoncé : la science de l’avenir est faite de données, pas de publications[2]. Les uns, plus sceptiques, affirmaient que les données allaient juste compléter le rôle traditionnel des publications[3]. Les autres, visionnaires, pressentirent qu’elles se substitueraient aux revues et aux livres : “In the age of genomic-sized datasets, the biomedical literature is increasingly archaic as a form of transmission of scientific knowledge for computers”[4]. Certes, le 4e paradigme de la découverte scientifique[5] ne transformera pas toutes les disciplines en même temps et au même rythme, et certains domaines sont plus exposés que d’autres. Mais même les sciences humaines et les arts s’y mettent aujourd’hui.

Archaïque, la littérature scientifique – le ton est donné. Qui a envie d’être archaïque ? Oubliez donc les articles et publiez vos données. Mais comment ? Publier ses données, cela ne s’invente pas. Il faut y penser dès le début – l’organisation des données, leur description, leur mise  en forme et présentation, leur lisibilité, leur format et les éventuels problèmes de droit[6]. D’autres questions se poseront par la suite : où faut-il publier les données ? Vous pouvez déposer vos données dans une archive de données. Il y en a dans toutes les disciplines. Le répertoire re3data.org en recense plus de 1300 dont 64 en France ; HAL[7] à Lyon se positionne comme la future archive de données nationale. Mais vous pouvez aussi préparer un petit data paper pour l’une des nouvelles « revues de données » dont le nombre ne cesse de croître, comme par exemple Data in Brief, Genomics Data, Scientific Data, GigaScience ou Research Data Journal for the Humanities and Social Sciences.

En fait, ces data papers sont un compromis avec les articles traditionnels car ils contiennent, outre une description précise des données, une analyse avec discussion des résultats. Mais ils sont bien plus courts, souvent seulement deux à trois pages. Et très bien structurés, c’est-à-dire « machine-readable » et exploitables par des outils du text and data mining (TDM). Publier la science, oui, mais sous forme de données. C’est l’avenir de la science, et cet avenir commence sous nos yeux.

PS. Vous pensez que j’exagère ? Vous avez raison. Quoique…

[1] https://commons.wikimedia.org/wiki/File:To_deposit_or_not_to_deposit,_that_is_the_question_-_journal.pbio.1001779.g001.png

[2] Hey, T., Trefethen, A. E., 2005. Cyberinfrastructure for e-Science. Science 308 (5723), 817-821. URL http://dx.doi.org/10.1126/science.1110410

[3] Borgman, C. L., Wallis, J. C., Enyedy, N., 2007. Little science confronts the data deluge: habitat ecology, embedded sensor networks, and digital libraries. International Journal on Digital Libraries 7 (1-2), 17-30. http://escholarship.org/uc/item/6fs4559s

[4] Blake, J. A., Bult, C. J., 2006. Beyond the data deluge: Data integration and bio-ontologies. Journal of Biomedical Informatics 39, 314-320. http://dx.doi.org/10.1016/j.jbi.2006.01.003

[5] Hey, T., Tansley, S., Tolle, K. (dir.), 2009. The fourth paradigm. Data-intensive scientific discovery. Microsoft Corporation, Redmond, WA. http://research.microsoft.com/en-us/collaboration/fourthparadigm/

[6] Tenopir, C., Dalton, E. D., Allard, S., Frame, M., Pjesivac, I., Birch, B., Pollock, D., Dorsett, K., Aug. 2015. Changes in data sharing and data reuse practices and perceptions among scientists worldwide. PLoS ONE 10 (8), e0134826+. http://dx.doi.org/10.1371/journal.pone.0134826

[7]https://hal.archives-ouvertes.fr/