15 août 2024
Gestion des données
Contexte et enjeux
Contexte de big data, augmentation importante des données produites et accessibles. Soulève de nombreuses problématiques :
- juridiques : droit d’auteur et propriété intellectuelle, probité (valeur juridique des documents numériques)
Archivage numérique pérenne (2013, CINES)
Éléments de définition
L’archivage numérique n’est pas une simple sauvegarde ou une copie sur bande magnétique.
L’archivage numérique à long terme implique :
- la conservation du document
- l’accessibilité
- la préservation de l’intelligibilité
Difficultés et solutions
À une échelle de 30 ans les difficultés peuvent être importantes :
- obsolescence matérielle
- renouvellement et diversification des supports de stockage
- copies multiples
- veille technologique non pas sur phénomènes émergents, mais sur les techno éprouvées
- obsolescence logicielle
- favoriser les formats durables (ouvert, publié, largement utilisé, potentiellement standard ou norme), dans un cas extrême, il serait alors possible de développer une nouvelle solution de lecture des fichiers
- xml (valide), html, txt, pdf, rtf, tiff, jpg, png, mp3, mpeg, quick time, etc.
- absence de documentation
- métadonnées !
Métadonnées de pérennisation
Étape essentielle mais difficile.
2 niveaux de métadonnées :
- descriptives ou “bibliographiques” : définies par Dublin Core (15 métadonnées pour décrire toutes ressources disponibles sur internet : contributor, coverage, creator, date, description, format, identifier, language, publisher, relation, rights, source, subject, title, type)
- techniques : généralement définies par des normes, mais les préconisations proposents généralement des métadonnées trop complètes, et donc dificiles à mettre en œuvre => gestion des risques (à partir d’une liste prescrite par une norme, élimination des métadonnées jugées inutiles au vu des services futurs prévisibles)
Exemples de normes :
Modèle OAIS : Reference Model for an Open Archival Information System
spécifie de manière très générale l’architecture logique et les fonctionnalités d’un système d’archivage. OAIS ne préjuge pas de la nature des objets à archiver, mais le modèle est particulièrement bien adapté aux objets numériques.
OAIS définit des termes et des concepts :
- Acteurs et rôles :
- archive : opérateur de système d’achivage
- management : décideur, gestionnaire sur le long terme (financièrement)
- producteur : ils fournissent les objets à archiver
- utilisateur : ils ont accès aux objets archivé
- functions d’archivage
- entrées : reçoit les objets à archiver
- stockage : conservation physique des objets
- gestion des données : métadonnées des objets
- administration : gestion du service global
- planification de la pérennisation : veille et recommandations pour évolutions technologiques
- accès : recherche et contrôle d’accès pour les utilisateurs
- migrations numériques, pour garantir la préservation des documents numériques
- rafraîchissement
- duplication
- ré-empaquetage
- transformation
autres
PAIMAS ; AFNOR NF 42-013 ; ISO 15489 ; MoReq ; recommandations de CINES ; voir également le groupe PIN (Pérennisation des Informations Numériques)