SLDR —> SldrWiki —> SLDR_FR

(Same page in English)

Gestion des droits d’accès en accord avec le Code du patrimoine : une approche générique pour le modèle OAIS implémenté au SLDR

Table Of Contents

  Les données nominatives
  Toutes les archives doivent être publiques
  Diffusion versus archivage pérenne
  Protection de la vie privée
  Consentement éclairé, autorisations de diffusion
  Copyright, propriété commerciale
  Motivation du refus d’accès
  Interventions

La gestion automatisée des droits d’accès est pleinement opérationnelle au SLDR. Ce dispositif permet aux producteurs de données de spécifier les droits d’accès aux objets ou aux documents qu’ils contiennent dans les trois phases de leur cycle de vie : données source, diffusion et archive pérenne.

L’archivage exige la conformité avec les récentes dispositions du Code du patrimoine qui stipulent qu’une archive publique doit être immédiatement accessible. Des dérogations à ce principe sont toutefois prévues (et chiffrées en durée) pour protéger, entre autres, l’accès à des données relevant de la vie privée, du secret médical ou de dispositions contractuelles particulières.

Le SLDR fait apparaître explicitement les motivations des restrictions d’accès (comme la loi l’y oblige) ainsi que l'existence d'autorisations de diffusion. Les producteurs peuvent par ailleurs saisir l'ensemble des paramètres qui régissent l'évolution de ces droits d’accès sur le long terme, ainsi que des métadonnées confidentielles qui pourront basculer dans le domaine public au terme d'une période choisie par le déposant en conformité avec loi.

La mise en pratique de la gestion des droits d'accès est exposée aux producteurs de données sur la page Réglage des droits d'accès, et pour les développeurs sur la page Procédures d'accès sur SLDR. Les requêtes de téléchargement, de traitement ou de visualisation d'un document sont soumises à un arbre de décisions : SLDR_access_decision_tree.


Le SLDR (Speech & Language Data Repository, anciennement CRDO-Aix, http://sldr.org) est un service gratuit permettant aux laboratoires et aux chercheurs indépendants de partager leurs données orales/linguistiques tout en garantissant leur archivage pérenne. Bien qu’ils soient convaincus de l’intérêt de mutualiser et préserver les ressources collectées ou produites par leurs activités, les chercheurs hésitent souvent à passer à l’acte en raison d’une méconnaissance de leurs droits et devoirs : tout ce qui concerne la propriété commerciale et intellectuelle, la protection de la vie privée, l’identité des personnes, le consentement éclairé et autres dispositions légales.

Fin 2010, ces questions ont été inscrites à l’agenda du projet pilote TGE-Adonis/CINES/CC-IN2P3/CRDO pour la mutualisation et l’archivage des données orales, avec pour objectif l’élaboration d’un mécanisme de gestion des droits d’accès adapté au cadre législatif, récemment modifié, des archives publiques.

Cette page décrit les solutions implémentées au SLDR et soumises au groupe de travail du projet pilote. Elle ne prétend pas à l’exhaustivité et aucune information ne devrait être tenue pour définitive en raison de la nouveauté du mode opérationnel. (Le passage en production de l’archivage pérenne date de juillet 2010 pour ce qui concerne le CRDO-Aix/SLDR.) Une synthèse des discussions a été publiée ici : http://sldr.org/wiki/SyntheseDroitsAccesFevrier2011_fr.

Les données nominatives

Le SLDR est enregistré à la Commission nationale de l’informatique et des libertés (CNIL) sous la déclaration No 1222972 en date du 26 mars 2008 qui l’autorise à stocker des données nominatives sous réserve que les personnes concernées aient accès à leur modification, leur rectification ou leur suppression (article 34 de la loi Informatique et libertés du 6 janvier 1978).

Les objets versés en archivage pérenne peuvent contenir des métadonnées confidentielles ainsi que des instructions pour l’évolution de ces informations sur le long terme. Par exemple, (1) les détails d’identité de l’ayant-droit sur le dépôt et (2) les noms complets de tous les informateurs ayant pris part à un entretien. Ces noms deviennent publiables à l’expiration de la période de restriction d’accès destinée à la protection de la vie privée (voir ci-dessous).

Par définition, les métadonnées confidentielles ne sont pas accessibles depuis le site de distribution alors qu’elles sont conservées par le site d’archivage. (Voir page 55 de la présentation du SLDR.)

Toutes les archives doivent être publiques

L’archivage pérenne de données dans une archive institutionnelle doit se conformer aux dispositions légales en vigueur en France, à savoir le Code du patrimoine, loi du 15 juillet 2008 consolidée le 13 janvier 2011.

Les articles importants :

Les implications de ces articles sont doubles :

  1. Tous les documents produits ou collectés par les chercheurs dans le cadre de l'exercice d'une mission de service public sont des archives publiques. (À clarifier pour les chercheurs de droit privé…)
  2. Les archives publiques sont, par défaut, immédiatement communicables.

Cette dernière obligation est un changement radical de perspective puisqu’un délai de 30 ans était en vigueur avant le 15 juillet 2008.

Les contraintes du Code du patrimoine peuvent entrer en conflit avec les intérêts de chercheurs ou de collecteurs de documents à valeur patrimoniale. Toutefois nous allons voir qu’une interprétation flexible (bien que licite) de ces textes permet de gérer la plupart des problèmes rencontrés par la communauté scientifique.

Diffusion versus archivage pérenne

D’un point de vue archivistique, il est dit qu’un document ne devient une archive qu’à l’issue de sa "période d’utilisation courante". On peut donc considérer que l’archivage pérenne n’est obligatoire qu’une fois terminés les travaux sur le projet et les publications qui lui sont associées.

Les chercheurs qui souhaitent préserver et partager un document avant la fin de sa période d’utilisation courante peuvent les placer en mode diffusion qui ne donne pas au document le statut légal d'une archive (publique ou privée).

La durée de la période d’utilisation courante dépend bien entendu du projet. Elle peut inclure :

De manière générale, restreindre l’accès à un document n’est pas contraire à la loi tant qu’il ne s’agit pas d’une archive publique. Les producteurs de données peuvent donc imposer cette restriction sans rendre explicites sa motivation. Ils doivent cependant garder à l’esprit que ce statut coincide avec la période d’utilisation courante des documents.

Une spécificité du SLDR est l’utilisation du même modèle OAIS pour la diffusion et l’archivage pérenne. Du point de vue technique, en simple diffusion les données sont accessibles sur le site de diffusion (au CC-IN2P3) après un court passage sur le site d’archivage (CINES) au cours duquel les formats et l’arborescence des fichiers sont validés. Cette technique est fiable parce que le contenu intégral d’un objet peut être reconstruit à partir des datastreams qui servent à sa distribution sur le site de diffusion, et ce contenu fait l'objet d’une vérification de conformité avec l’objet à sa source (voir les pages 58-60 de la présentation du SLDR). De plus, le SLDR est capable de gérer des URLs invariantes pointant vers des documents lorsqu’un objet bascule de la diffusion vers l’archivage pérenne, y compris lorsque de nouvelles versions sont archivées (voir page 28).

La diffusion avant archivage pérenne serait aussi envisageable sur un service d'archivage intermédiaire comme ceux proposés par le CINES dans le cadre du projet ISAAC. Les statistiques (voir ISAAC) montrent qu’environ 20% des données ainsi partagées sont destinées à l’archivage pérenne. Sachant que seul le CINES est habilité à faire de l'archivage (intermédiaire ou pérenne), le mode diffusion n'est pas légalement équivalent à de l'archivage intermédiaire.

L’expérience montre qu’au terme d’un programme de recherche ses responsables manquent le plus souvent de temps, de ressources humaines (et certainement de motivation) pour déposer en archivage pérenne les données et résultats significatifs. Par exemple, le fait de devoir au dernier moment vérifier et transcoder des formats de fichiers pour garantir leur validation par la plateforme d’archivage (voir Formats) contribue fortement à cette démotivation. Il arrive même que des données primaires nécessaires à ce ré-encodage ne soient plus disponibles - par exemple, les vidéos non comprimées.

Pour ces raisons, nous estimons que le mode opérationnel du SLDR est bien adapté à une pratique vertueuse qui consiste à rendre possible la diffusion (avec accès sélectif) en début de projet. Nous recommandons d’ailleurs la création de fiches descriptives (métadonnées) avant même la collection de données car celles-ci produisent des identifiants que l’équipe peut citer à l’appui de sa recherche de collaborateurs et de financements.

Protection de la vie privée

Bien que classifié comme "archive publique", tout document peut bénéficier de restrictions d’accès si celles-ci sont motivées (et limitées) selon les dispositions de l’Article L213-2.

Les types de dérogations au principe de libre communicabilité sont énumérés et codés dans un tableau. Cette présentation simplifie la déclaration du statut d’un document. La dérogation AR048 s’applique fréquemment aux données collectées au cours d’enquêtes : 50 ans. Documents dont la communication porte atteinte à la protection de la vie privée ou portant appréciation ou jugement de valeur sur une personne physique nommément désignée, ou facilement identifiable, ou qui font apparaître le comportement d’une personne dans des conditions susceptibles de lui porter préjudice. Pour le secret médical cette période peut être étendue à 120 ans (AR061).

Étant donnés le code de la dérogation et la date d’un enregistrement (ou celle du dépôt en archive, si la première est inconnue), le système implémenté au SLDR détermine automatiquement les droits d’accès à la date courante. Ces paramètres peuvent faire l’objet de déclarations différentes pour plusieurs documents appartenant au même objet. Par défaut, tout document hérite des droits d’accès du répertoire dans lequel il se situe.

Consentement éclairé, autorisations de diffusion

L’article L213-2 n’est qu’une dérogation à l’article L213-1 (voir ci-dessus). Il s’ensuit que les responsables de dépôts en archive pérenne devraient s’efforcer d’obtenir des autorisations pour que leurs documents soient accessibles avant l’expiration de la période de restriction associée à la dérogation. À cet effet, ils demandent aux informateurs/locuteurs/auteurs de signer des autorisations de diffusion.

Ces autorisations doivent être conformes au principe du consentement éclairé : elles doivent mentionner clairement que le signataire connaît le type et l’étendue de la diffusion prévue du document. Un exemple de formulaire repris par de nombreuses équipes est fourni dans l’ouvrage Corpus oraux, guide des bonnes pratiques 2006. Une version adaptée au projet ICAR est ici : http://icar.univ-lyon2.fr/projets/corinte/recueil/document_informations.htm. Un formulaire adapté au SLDR est ici : http://sldr.org/doc/forms/ConsentementModele2_fr.doc.

Les signataires peuvent par ailleurs décider qu’un enregistrement audio/vidéo peut être partagé par la communauté de recherche mais pas rendu public. Dans ce cas, la licence SLDR standard signée par les utilisateurs du SLDR devra être complétée par une licence particulière (voir exemple http://sldr.org/sldr000761/licence/LicenceStRemy.pdf) ; cette licence particulière a été présentée aux informateurs/locuteurs/auteurs en annexe du formulaire de consentement.

Voir le formulaire adapté à cette situation : http://sldr.org/doc/forms/ConsentementModele_fr.doc

Pour tout ce qui concerne les données orales, et plus généralement les données primaires "sensibles", il est nécessaire de faire la distinction entre la diffusion du contenu (l’écoute d’un enregistrement, la visualisation d’une vidéo ou de photos) et la distribution de fichiers source en "haute résolution" qui peuvent donner lieu à des falsifications potentiellement dommageables aux locuteurs (imitation de voix etc.). Pour cette raison, le SLDR rend possibles la traçabilité et la transparence des opérations de téléchargement proprement dit (page 44 de la présentation du SLDR) même lorsque les contenus sont diffusés en streaming.

Le SLDR permet aux déposants d’indiquer une date limite de l’autorisation de diffusion, au delà de laquelle le système basculera automatiquement les droits d’accès dans l’état prévu par la dérogation légale si l’autorisation n’a pas été prolongée. Nous pensons qu’inscrire une date limite n’est pas pertinent du point de vue juridique parce qu’un consentement éclairé peut être retiré à tout moment. Du point de vue technique, en cas de retrait du consentement, la date de retrait sera immédiatement saisie comme date limite de l’autorisation de sorte que le système puisse régler en conséquence les droits d’accès.

Les autorisations signées sont scannées et préservées en archivage pérenne aux côtés des métadonnées confidentielles (voir ci-dessus).

Copyright, propriété commerciale

Certains documents destinés à l’archivage pérenne peuvent faire l’objet de restrictions d’accès en raison d’un copyright. C’est le cas de publications dans des revues scientifiques. Bien qu’il soit souhaitable de préserver et de rendre disponible le contenu d’un article ou d’un ouvrage en complément des données primaires et secondaires auxquelles il fait référence, il se peut que son accès soit réservé pendant la période d’embargo imposée par l’éditeur commercial.

Si le document est de ceux auxquels on peut appliquer une dérogation au principe de libre communicabilité conforme à l’article L213-2 (voir supra) et si une autorisation de diffusion a par ailleurs été signée par les auteurs/informateurs/locuteurs, une solution raisonnable consiste à faire démarrer l’autorisation à la date de fin de la période d’embargo. Lorsque ces conditions ne sont pas remplies nous recommandons de ne pas déposer immédiatement le document en archive pérenne afin de limiter le risque juridique.

Il est envisagé d'utiliser le code AR039 (25 ans, "secret industriel ou commercial") pour des documents soumis à copyright, mais cette utilisation demanderait la confirmation de juristes.

Motivation du refus d’accès

Cette disposition découle de l’article suivant :

La motivation de la dérogation au principe de libre communicabilité (voir art. L213-2) est affichée sur les fiches descriptives des objets déposés en archivage pérenne et on la retrouve dans les métadonnées OLAC. Voir par exemple accessRights au sommet de cette page.


Interventions

Valid XHTML 1.0! Valid CSS!
Page Execution took real: 0.856, user: 0.530, sys: 0.260 seconds