Coronavirus et partage des données
Le concept de science ouverte (ou science libre ou libre accès) a pris énormément d’ampleur depuis ses débuts dans les années 90. Ça bouillonne dans le monde du partage des données de recherche!
Aujourd’hui, les banques de données se multiplient, et les organismes subventionnaires fédéraux et provinciaux poussent les scientifiques qu’ils financent à déposer en ligne leurs articles et leurs données scientifiques pour les rendre disponibles à tous gratuitement.
Au labo, nous avons commencé à partager nos données l’an dernier sur la plateforme pancanadienne « Scholar Portal Dataverse » . Nous sommes également en processus pour déposer tous nos articles scientifiques sur le dépôt institutionnel « Corpus UL » de l’Université Laval, ce qui permettra au public d’accéder légalement et gratuitement à toute notre production scientifique. Cette semaine, nous avons aussi préparé et déposé les données de deux projets du labo sur des sites de partage. Pour le moment, ces données ne sont pas accessibles au grand public, mais seulement aux évaluateurs des revues auxquelles nous avons soumis les articles de ces deux projets. C’est la première étape. Lorsque les articles seront publiés, les données seront versées dans le domaine public.
L’un de ces projets, mené par Maxime Perron, étudiant à la maîtrise, implique le partage de données d’imagerie par résonance magnétique (IRM) et de données comportementales : un beau défi! En effet, partager des données de neuroimagerie, demande beaucoup de temps afin de 1) créer une documentation complète des données pour que les utilisateurs et utilisatrices sachent facilement ce qui est disponible, le contexte expérimental, etc., 2) s’assurer de dé-identifier les données IRM pour que les participants ne soient pas reconnaissables, et 3) organiser et au besoin transformer les fichiers dans les formats supportés par la plateforme choisie. Toute la procédure est encadrée par les Comités d’éthique en recherche qui s’assurent que le partage se fait dans le respect de la confidentialité des participants de recherche.
Le partage et la réutilisation des données comportent d’autres défis :
Nombre de plateformes et banques de données
Il existe maintenant un grand nombre de plateformes et de banques de données. Laquelle choisir ? Quelle est la qualité de la documentation accompagnant les données ? Diviser les informations scientifiques dans autant de « paniers » peut rendre leur découverte plus difficile. Ni vu ni connu !
Confidentialité
La gestion des données de recherche est la responsabilité de chaque chercheur et chaque chercheuse et est supervisée par les Comités d’éthique de la recherche créés par le ministère de la santé et des services sociaux du Québec. Le respect de la confidentialité de ces données doit se poursuivre à travers le partage et l’utilisation des données en libre accès. Ainsi, les données partagées ne doivent pas contenir d’informations personnelles sur les participants ou d’éléments permettant de les identifier. La préparation des images IRM comme le fait Maxime est une étape essentielle du processus de partage et des bonnes pratiques en recherche.
Propriété intellectuelle
Est-ce que les équipes de recherche utilisant des données en libre accès citeront correctement leur source ? Seront-elles restreintes dans leur utilisation des données? Après tout, les licences Creative Commons permettent de partager les données originales ou modifiées, sous certaines conditions (il existe différentes licences). Peu importe la licence choisie, la source doit toujours être créditée.
Calculs de l’impact des subventions de recherche
Les organismes subventionnaires souhaitent quantifier les impacts des subventions octroyées aux chercheurs et chercheuses. En plus des découvertes et des publications, la réutilisation des stimuli ou des données par d’autres équipes est également une preuve d’impact. Les mécanismes pour retracer le partage des données sont rares et l’évaluation de l’impact à ce niveau est encore difficile à quantifier.
Le temps investi dans le partage des données en vaut la peine ! En plus de démocratiser l’accès aux données scientifiques – largement financées par des fonds publics – la science ouverte permet une plus grande utilisation des données grâce à leur réutilisation par d’autres équipes de recherche. Le partage des données permet également d’augmenter la transparence et de promouvoir les bonnes pratiques scientifiques en permettant à d’autres équipes de vérifier les résultats obtenus, et surtout de les reproduire, ce qui permet d’en vérifier la fiabilité. Il est possible de partager les données d’un projet entier: tâches expérimentales, stimuli, données de chaque participant (mais sans partager leur nom bien évidemment ou toute information permettant de les identifier !) ou de groupes, etc.
Il est certain que les morceaux du casse-tête se mettront en place dans les prochaines années, et ce sera tout à l’avantage de la société.
Lectures suggérées :