Forschungsdaten speichern und archivieren

Es bestehen verschiedene Situationen, in denen Forschungsdaten gespeichert und gesichert werden müssen. Während des Entstehungsprozesses und der Bearbeitung und Auswertung der Daten erfolgt eine möglichst redundante Sicherung. Idealerweise geschieht dies nicht nur auf lokalen Speichermedien, sondern auch auf hochschulinternen Servern, damit die Daten in einem regulären Backup gesichert und im Verlustfall wiederhergestellt werden können.

Die Deutsche Forschungsgemeinschaft (DFG) hat in ihren Empfehlungen zur „Guten wissenschaftlichen Praxis“ (GWP) Kriterien dargelegt, wissenschaftliches Fehlverhalten minimieren sollen. In Empfehlung 7 heißt es: „Primärdaten als Grundlagen für Veröffentlichungen sollen auf haltbaren und gesicherten Trägern in der Institution, wo sie entstanden sind, zehn Jahre lang aufbewahrt werden.“
Darauf bezugnehmend wird unter Archivierung von Forschungsdaten oftmals diese Zeitspanne von zehn Jahren verstanden. Das bedeutet, die Daten sollen strukturiert so gesichert werden, dass sie z.B. für eine Überprüfung der aus ihnen resultierenden Forschungsergebnisse herangezogen werden können.
Damit ist gemeint, dass die Daten physisch für mindestens diesen Zeitraum sicher bewahrt und zugänglich sind. Eine Archivierung oder Aufbewahrung für diesen Zeitraum ist nicht gleichbedeutend mit einer Langzeitarchivierung, denn dafür sind weitergehende Maßnahmen notwendig.

Langzeitarchivierung bedeutet mehr als die physische Sicherung von Daten. Durch stetige technische Weiterentwicklung veralten Soft- und Hardware sehr schnell. Das kann zur Folge haben, dass für Datenträger keine passenden Schnittstellen mehr vorhanden sind oder das Daten nicht korrekt dargestellt oder interpretiert werden können. Außerdem können Formate oder Software obsolet werden, das heißt, sie werden nicht mehr gepflegt und genutzt. In solchen Fällen sollten Daten auf ein aktuelleres Format migriert werden.
Generell gilt, je offener (und damit nachvollziehbarer) ein Format, desto besser ist es zur Langzeitarchivierung geeignet.
Neben der physischen Verfügbarkeit ist ein zentrales Ziel von Langzeitarchivierung der Erhalt der Interpretierbarkeit. Dafür werden ausreichend Kontextinformationen benötigt, z. B. zu verwendeten Erhebungsmethoden, Soft-und Hardware, Codierungen etc. Diese werden als Metadaten mit den eigentlichen Forschungsdaten gespeichert.
Eine weitere wichtige Aufgabe der Langzeitarchivierung besteht in der Sicherstellung, dass die Daten nicht verändert werden (weder aus Versehen noch absichtlich).
Langzeitarchivierung von Forschungsdaten auf institutionellen Ebene ist oft schwierig, da innerhalb der Institution in der Regel unterschiedliche Fachgebiete vertreten sind mit entsprechend unterschiedlichen Arten von Daten. Es besteht jedoch die Möglichkeit, Daten in fachlichen Archiven (auch Repositorien genannt) zu publizieren. Diese gewährleisten, dass die Daten ordnungsgemäß gesichert und im Zweifelsfall in ein neues Format überführt werden. Darüber hinaus bieten sie ein entsprechendes Rechte- und Lizenzmanagement an, welches unterschiedliche Nutzungsszenarien ermöglicht.
Auf der Plattform Registry of Research Data Repositories, kurz re3data.org, finden Sie eine umfangreiche Sammlung von Datenrepositories. Gerne unterstützen wir Sie bei der Suche nach einem geeigneten Repository.