12. Datenmanagement: Archivierungsprinzipien in einer dateibasierten Umgebung

Die Kernaufgabe einer dateibasierten Archivierung besteht in der „Bitpreservation“ (Bitstream Preservation), das heißt in der Summe von Maßnahmen zur Erhaltung des originalen Bitstreams, die das verantwortliche Institut zu organisieren hat.

Aktionen jenseits von „Bitpreservation“ werden dann notwendig, wenn die Formatierung der Inhalte obsolet zu werden droht. Die gewöhnliche Maßnahme wird dann Formatmigration sein, obwohl (wie im Kapitel 10, Kommentar, erwähnt) es Umstände geben könnte, in denen Emulation erforderlich ist. Während Entscheidungen über „Bitpreservation“ den IT- Spezialisten und geeigneten Softwareund Hardware-Anwendungen überlassen werden können, werden Maßnahmen jenseits von „Bitpreservation“ die Mitwirkung von Mitarbeitern mit archivarischer Erfahrung erfordern. Gefragt sind die Berücksichtigung des grundsätzlichen Charakters der Inhalte, die Zusammensetzung der Benutzergemeinschaft sowie die Beurteilung der Formatobsoleszenz einschließlich der Optionen neuer Formate.

Das Datenmanagement hat folgende Kernprinzipien zu berücksichtigen

  • Dateien werden im Allgemeinen durch Kopieren in Speichersystemen abgelegt. Dieser Prozess muss nachweisbar identische Duplikate produzieren. Die Überprüfung der Datenintegrität kann mit Hilfe einer vorangegangenen Erstellung einer Prüfsumme erzielt werden. Die Überprüfung („Verifikation“) sollte jeweils unmittelbar nach Herstellung einer Kopie stattfinden, idealerweise in automatisierter Form.
  • Die weitere Überprüfung dateibasierter Inhalte muss in regelmäßigen Abständen erfolgen, um sicherzustellen, dass das, was aufgeschrieben wurde, fehlerfrei und ohne Änderungen gelesen werden kann.
  • Abhängig vom originalen Dateiformat kann jedoch eine Transkodierung in ein neues Zielformat bisweilen eher angebracht sein als eine einfache Kopie im selben Format (siehe Kapitel 10 und 11). Diesen Prozess nennt man Formatmigration.
  • Digitale Inhalte, ob träger- oder dateibasiert, müssen auf neue Träger kopiert werden bevor unkorrigierbare Fehler auftreten. Ist das ursprüngliche und das Zielformat das gleiche, spricht man von Refereshment oder Medienmigration.
  • Es ist wesentlich, mindestens zwei, idealerweise noch mehr digitale Archivkopien und je nach Bedarf weitere, für den Gebrauch bestimmte Kopien zu speichern. Die Archivkopien sollten wo immer möglich an zwei verschiedenen geographischen Orten aufbewahrt werden. Zusätzliche Sicherheit kann durch die Verwendung verschiedener Speichertechnologien für jeden Kopiensatz erzielt werden. Bei der Wahl der Technologien sollte bedacht werden, dass die Stärke einer Strategie stets vom ihrem schwächsten Glied bestimmt wird
  • Wenn immer möglich sollten Benutzerkopien gemacht werden. Im Gegensatz zu Archivkopien hingegen können solche für die Benutzung bzw. den Vertrieb bestimmte Kopien subjektiv in Abhängigkeit von den Bedürfnissen der Benutzer modifiziert sein. Auch Datenreduktion kann, im Einklang mit den Ansprüchen der Benutzer, eingesetzt werden. Wie für die Herstellung der Archivkopien ist auch hier die genaue technische Dokumentation der Parameter und des Vorgehens bei der Herstellung notwendig.
  • Wenn möglich, sollten die Maßnahmen zur Prüfung der Datenintegrität automatisiert werden, so wie dies mit den Geräten vertrauenswürdiger digitaler Langzeitarchive der Fall ist. Sollte dies nicht möglich sein, müssten manuelle Überprüfungen auf statistisch gesicherter Basis durchgeführt werden.

Kommentar:

Während diese Prinzipien gleichermaßen für alle Arten der dateiorientierten Bewahrung gelten, erfordern die relativ großen Dateien und die zeitabhängige Natur audiovisueller Inhalte eine sorgfältige Planung der Kapazitäten von Speicherplatz und Bandbreite.

In ihrem Kern sind diese Prinzipien dieselben wie die für die analoge Welt. Ein fundamentaler Unterschied besteht aber in der qualitativen Dimension der dateiorientierten digitalen Welt, die die objektive Beurteilung der Integrität der Aufnahmen ermöglicht. Regelmäßige Überwachung der Datenintegrität ist daher eine der zentralen Pflichten digitaler Bewahrungsroutinen. Digitale Träger und Systeme können tatsächlich ohne Vorwarnung zu jeder Zeit versagen. Die Vernetzung der Arbeit von Primärarchiven, den Nutzern und dem Sicherheitsarchiv kann die Strategie zur Verringerung der Risiken stark unterstützen.