Anekdoten aus der digitalen Langzeitarchivierung

Zu Beginn dieses Jahres begannen wir in der UB Basel mit der Realisierung unserer digitalen Langzeitarchivierung, nachdem in den Monaten davor viel Zeit und Mühe in die Erarbeitung von Konzepten und beispielhaften Workflows geflossen ist (was zwar hilfreich, aber letztlich schnell teilweise auch überholt war – mehr dazu später).

Die letzten Monate waren, neben anderem, der intensiven Auseinandersetzung mit originalen Datenträgern gewidmet. Mit der Vertiefung in die Thematik zeigte sich immer mehr, dass der eigentliche Aufwand bei der digitalen Langzeitarchivierung nicht in der Archivierung und Zugänglichhaltung der aufbereiteten Datenpakete in einem Archivsystem liegt, sondern bei den vorausgehenden Schritten: der Ablösung der Daten von ihren originalen Datenträgern und der Migration in archivtaugliche Formate.

Das beginnt bei der Zusammenstellung des nötigen Equipments (etwa alte Laufwerke für 3,5’’ Floppys, iomega Zip und Jaz Disks oder SyQuest Cartridges) zum Lesen der verschiedensten Datenträger aus der Windows-, Mac- und Linux-Welt der 1980er Jahre bis heute. Dazu gehören auch spezielle Workstations mit verschiedenen Betriebssystemen, wobei bei Mac-Systemen neben einem aktuellen macOS X auch ältere Systeme der Version 7 bis 9 aus den 1990er Jahren wichtig sind – ein Systembruch zwischen diesen Versionen sorgt dafür, dass viele Tools und Dateiformate den Sprung von Version 9 auf Version X nicht geschafft haben und daher mit modernen Mac-Computern nicht gelesen werden können.

Der «Träger-Musterkoffer» der digitalen Langzeitarchivierung

Dazu eine kleine Anekdote: mehrere Floppy Disks konnten mit einem aktuellen Laufwerk unter Windows oder macOS X nicht gelesen werden. Erst mit einem Macintosh PowerBook G3 von 1998 zeigte sich Erfolg (eines jener Geräte, die noch mit 233MHz-Prozessoren und 96MB RAM laufen). Ein Datenträgerimage war auf dieser Maschine mit den regulären Tools jedoch nicht zu erstellen, daher musste in den Tiefen des Internets nach damals gebräuchlichen Tools für diese Aufgabe geforscht werden. Zum Glück gibt es dafür spezialisierte Repositories und Foren der Mac-Community. In einem nächsten Schritt stellte sich die Frage, wie man das abgelöste Image vom PowerBook auf ein modernes System transferiert. USB-Schnittstellen oder WLAN wurden 1998 erst gerade eingeführt und fehlen daher noch, ein LAN-Kabel zur Direktverbindung zeigte ebenfalls keinen Erfolg. Zum Glück hat das PowerBook ein ZIP-Laufwerk und wir noch die richtigen (leeren) Datenträger. Mit etwas Kreativität findet man daher meist eine praktikable Lösung.

Systemvielfalt in der Archivierungspraxis

Hat man die originalen Daten erst gesichert, können sie aber noch nicht zwingend genutzt werden. Einige System- und Software-Generationen später können die Dateien oftmals nicht mehr oder nicht fehlerfrei gelesen werden. Daher arbeitet man in der digitalen Langzeitarchivierung mit der regelmässigen Dateiformat-Migration bzw. der Umwandlung der Dateien in aktuell gebräuchliche Dateiformate. Das funktioniert bei Standard-Formaten in der Regel recht gut. Bereits in diesen ersten Monaten trafen wir aber auf Dateien aus Spezial-Software (bspw. zur Musikkomposition). Die Migration in ein aktuelles Dateiformat hätte unweigerlich den Verlust von Information zur Folge gehabt. Wie viel davon kann man letztlich verkraften? Schnell stösst man zur Beantwortung dieser Frage auch in das Feld der Emulation vor – der virtuellen Nachbildung eines anderen oder älteren Computersystems als Alternative zur Migration. Zentral ist und bleibt aber die Frage, wie viel Information minimal erhalten bleiben muss, damit eine Datei auch nach vielen Jahren noch von Nutzenden als authentisch und integer erachtet wird – die Vertrauenswürdigkeit ist daher in Zeiten von Fake News auch bei uns ein wichtiges Thema.

Zum Schluss wieder der Schwenk zur zu Beginn geäusserten kurzen Lebenszeit beispielhafter Workflows. Was in der Langzeitarchivierung der aufbereiteten digitalen Daten im Archivsystem funktioniert, zeigt sich in den vorausgehenden Schritten der Ablösung von den Original-Datenträgern zwar als gute Richtlinie, aber leider nicht viel mehr, da der Alltag aus vielen Spezialfällen besteht. Letztlich ist es aber wichtig, dass man sich an gewissen Leitlinien orientiert:

  • Die originalen Daten sollen so wenig wie möglich verändert werden. Dafür muss bei Konversions- und Transferschritten regelmässig die inhaltliche Unverändertheit geprüft werden. Zum Glück gibt es dafür sehr gute und verbreitete automatische Verfahren.
  • Wenn möglich sollten die Datenträger möglichst früh im Prozess inventarisiert werden, damit die darauf enthaltenen Dateien inkl. Metadaten bzw. Dateiattributen dokumentiert werden und diese Information der Erschliessung zur Verfügung steht. Dabei hilft auch eine Fotografie des originalen Datenträgers, auf dem man nicht selten Notizen zum Inhalt findet (auch wenn sie manchmal eher irreführend oder unleserlich denn hilfreich sind).
  • Bei allen Arbeitsschritten sollte im Hinterkopf stets auf die Erhaltung der Authentizität und Integrität geachtet werden. Das kann bedeuten, dass, wie oben beschrieben, die inhaltliche Unverändertheit geprüft wird, aber auch, dass alle Arbeitsschritte ausführlich dokumentiert werden.
  • Abschliessend muss man sich früh im Prozess die Frage stellen, welche der Merkmale einer Datei unbedingt bewahrt werden müssen (und daher «signifikant» sind) und welche bei einer Migration allfällig auch verloren gehen dürfen:
    • Dateiattribute: Dürfen Titel oder Zeitstempel verändert werden?
    • Visuelle Elemente: Soll bspw. ein Briefkopf exakt wie im Original erhalten bleiben oder darf sich seine Position verschieben?
    • Funktionalität: Müssen in einer Tabelle auch hinterlegte Formeln funktionell erhalten bleiben oder ist vor allem das sichtbare Formelergebnis relevant?

Wenn Sie sich nun an ihren eigenen Schreibtisch erinnern, in dem sich noch die eine oder andere Floppy Disk aufhalten könnte, und Sie sich Gedanken um den Zustand Ihrer digitalen Erinnerungen im Allgemeinen machen: die Digital Preservation Coalition und die amerikanische Library of Congress haben Erläuterungen und Vorschläge für Ihre persönlichen Archive publiziert. Wie das in der Praxis dann aussehen kann, beschreibt Richard Wright in einem ausführlichen Blog-Beitrag.

beat.mattmann@unibas.ch

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google Foto

Du kommentierst mit Deinem Google-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.