Débugue tes humanités Saison 2

Séance 06 - Sauvegarder ses données

Pourquoi et comment sauvegarder ses données dans un contexte de recherche académique. Principes, organisation et implémentation technique.

Chaire de recherche du Canada sur les écritures numériques — antoine.fauchie@umontreal.ca

Plan de la séance

  1. Sauvegarder des données, pourquoi ?
  2. Quelques principes pour la sauvegarde de nos données
  3. Les types de sauvegarde
  4. Rsync : synchronisé vite et bien
  5. Chaîne de sauvegarde

1. Sauvegarder des données : pourquoi ? #

sauvegarder, verbe transit.
Conserver, maintenir intact quelque chose.
CNRTL

2. Quelques principes pour la sauvegarde de nos données #

  1. plusieurs types de données
  2. la fréquence
  3. les lieux/plateformes de stockage
  4. la vérification

2. Quelques principes

2.1. Plusieurs types de données #

  • données actives : utilisations/modifications fréquentes
    • projets actifs
      • textes en cours d’écriture
      • annotations
      • bases de données (corpus, données bibliographiques, etc.)
      • etc.
  • données archivées : accès principalement en lecture
    • livres et documents à consulter (sans annotation)
      • musique et vidéo
      • projet ancien/inactif
      • images
      • etc.

2. Quelques principes

2.2. La fréquence #

  • moins d’une heure : synchronisation continue
  • moins d’un jour : synchronisation régulière
  • moins d’un mois : synchronisation ponctuelle

2. Quelques principes

2.3. Les dispositifs/lieux/plateformes de stockage #

2. Quelques principes

2.3. Les dispositifs/lieux/plateformes de stockage

  • votre ordinateur (portable ou non) : par défaut le dispositif qui produit et contient les données
  • disque dur : avec vous, chez vous, chez quelqu’un d’autre
  • des lieux physiques : votre maison, d’autres lieux
  • plateforme en ligne : l’ordinateur de quelqu’un d’autre accessible en ligne

2. Quelques principes pour la sauvegarde de nos données

2.4. La vérification #

La partie la plus délicate :

  • est-ce que les données ont toutes été copiées ?
  • est-ce que le support de stockage fonctionne bien ?
  • plusieurs solutions : vérifications par échantillonnage notamment.

3. Les types de sauvegarde #

  • sauvegarde : copie conforme (copié/collé)
  • synchronisation : copie si modification
  • fréquence : continue/régulière/ponctuelle
  • versionnement : conservation d’un historique

4. rsync : synchronisé vite et bien #

rsync remote synchronization, (en français : « synchronisation distante ») est un logiciel libre de synchronisation de fichiers, distribué sous licence GNU GPL. La synchronisation est unidirectionnelle, c’est-à-dire qu’elle copie les fichiers de la source en direction de la destination. rsync est donc utilisé pour réaliser des sauvegardes incrémentielles ou différentielles ou pour diffuser le contenu d’un répertoire de référence.

5. Chaîne de sauvegarde #