Informationsinfrastrukturangebote für digitale Forschungsdaten


Von Heinz Pampel und Maxi Kindling

Dieser Artikel ist unter der URN urn:nbn:de:kobv:11-100244024 auf dem edoc – Dokumenten- und Publikationsserver der HU verfügbar.

Heinz Pampel (Helmholtz-Gemeinschaft; https://orcid.org/0000-0003-3334-2771) & Maxi Kindling (Humboldt-Universität zu Berlin; https://orcid.org/0000-0002-0167-0466 )

Abstract

Mit dem Internet und der Digitalisierung haben sich für die Wissenschaft neue Möglichkeiten der Verbreitung und des Austausches von Wissen und Information eröffnet. Unter dem Stichwort Open Science wird neben Open Access auch die Zugänglichkeit und Nachnutzung von digitalen Forschungsdaten diskutiert. Peter Schirmbacher hat sich in Forschung und Lehre mit der Relevanz, der Gestaltung und der Nutzung von Informationsinfrastrukturangeboten für digitale Forschungsdaten befasst und damit wegweisende Beiträge zur Weiterentwicklung dieser Services für die digital arbeitende Wissenschaft geleistet. Vorliegender Beitrag gibt einen Überblick über den Entwicklungsstand der Informationsinfrastrukturangebote für digitale Forschungsdaten und ordnet sie in die wissenschaftspolitische Diskussionen um Open Science ein.

Inhalt:

Informationsinfrastrukturangebote für digitale Forschungsdaten

Einleitung – Diskussion in der Wissenschaft

Relevanz von Informationsinfrastrukturen

Grundlagen der Zugänglichmachung und Nachnutzung

Leit- und Richtlinien

Forschungsdatenmanagementpläne

Informationsinfrastrukturangebote

Forschungsdatenrepositorien

Data Papers und Data Journals

Recherchemöglichkeiten

Ausblick

Referenzen

Einleitung – Diskussion in der Wissenschaft

Mit dem Internet und der Digitalisierung haben sich für die Wissenschaft neue Möglichkeiten der Verbreitung und des Austausches von Wissen und Information eröffnet. Dieses Potenzial wurde 2003 in der „Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities“ umfassend beschrieben (Max-Planck-Gesellschaft, 2003). Die Erklärung, die 2006 auch von der langjährigen Wirkungsstätte von Peter Schirmbacher, der Humboldt-Universität zu Berlin, unterzeichnet wurde, betont über die Bedeutung des Open Access zu textuellen Publikationen (Suber, 2012) hinaus auch die Öffnung und die Nachnutzung von Forschungsdaten für die digital arbeitende Wissenschaft.

Die Diskussion über die Chancen und Herausforderungen des „data sharings” hat sich über die letzten Jahre deutlich weiterentwickelt und als Bestandteil von Open Science wissenschaftspolitisch manifestiert (Kroes 2012; European Commission, 2016a). Die Empfehlung der ehrwürdigen Fachgesellschaft Royal Society an alle Forschenden – „Where data justify it, scientists should make them available in an appropriate data repository.“ – in der breit rezipierten Denkschrift „Science as an open enterprise“ unterstreicht die Forderung der Wissenschaft nach der offenen Zugänglichkeit von Forschungsdaten. Dieser Wunsch wird durch vielfältige Erhebungen wie z. B. von Kuipers & Van der Hoeven (2009), Schäfer et al. (2011), European Commission (2012) und Tenopir et al. (2011,  2015) bestätigt. Diese Studien beschrieben jedoch auch die rechtlichen, technischen und kulturellen Barrieren, die einzelne Forschende davon abhalten Forschungsdaten zugänglich zu machen. Diese Barrieren sind häufig auf fehlende Serviceangebote von Informationsinfrastrukturen zurückzuführen (Borgman, 2007; Tenopir, 2011; van der Graaf  & Waaijers, 2011) und machen deutlich, dass sich die Praktiken rund um die Zugänglichmachung und Nachnutzung von Forschungsdaten noch in einem recht jungen Entwicklungsstand befinden.

Relevanz von Informationsinfrastrukturen

Mit Blick auf digital vorliegende Forschungsdaten bedarf es Informationsinfrastrukturen, die wie von Peter Schirmbacher (2015) definiert als „Gesamtheit der technischen, organisatorischen, finanziellen und personellen Ressourcen zur Gewährleistung der Informationsversorgung von Wissenschaft und Forschung“ beitragen, um so z. B. Forschende beim Management der wachsenden Menge an digitalen Daten zu unterstützen. Informationsinfrastruktureinrichtungen sind insbesondere Bibliotheken, Rechenzentren, Datenzentren, Archive und Museen. Als Teil der Forschungsinfrastruktur verstehen sie sich als Dienstleister für eine definierte Nutzergruppe. Ihre Services werden in diesem Beitrag als Informationsinfrastrukturangebote gefasst.

Im Zuge der Digitalisierung sind sie bestrebt die von ihnen gespeicherten Informationsobjekte über das Internet zugänglich zu machen um die Transparenz, Reproduzierbarkeit und Effizienz der Forschung zu verbessern.

In der Informationswissenschaft sind die Informationsinfrastrukturen und entsprechende Angebote Gegenstände von Forschung und Entwicklung. So wurden am Lehrstuhl Informationsmanagement von Peter Schirmbacher am Institut für Bibliotheks- und Informationswissenschaft der Humboldt-Universität in Kooperation mit der Arbeitsgruppe Elektronisches Publizieren der Universitätsbibliothek und des Computer- und Medienservice der Humboldt-Universität Anforderungen aus der Praxis erhoben, Angebote wie Repositorien und Mehrwertdienste aufgebaut, analysiert und weiterentwickelt, die technische und organisatorische Vernetzung dieser Infrastrukturen vorangetrieben sowie Qualitätsstandards entwickelt und verbreitet. Darüber hinaus wurden Geschäfts- und Finanzierungsmodelle eruiert und die Anwendung von geeigneten rechtlichen Lizenzmodellen betrachtet (Schirmbacher 2015).

Die Arbeiten, die Peter Schirmbacher in diesem Bereich geleistet hat, haben in den letzten Jahren einen wichtigen Beitrag für die Weiterentwicklung und Professionalisierung dieser Informationsinfrastrukturangebote geleistet, die das Forschungsdatenmanagement als „gesamte[n] Prozess, der die Allokation, die Generierung, die Bearbeitung und Anreicherung, die Archivierung und Veröffentlichung von digitalen Forschungsdaten selbst oder von einer entsprechenden klassischen Textproduktion unterstützt” (Kindling & Schirmbacher, 2013). Für die Auseinandersetzung mit der Thematik schlägt Peter Schirmbacher darüber hinaus eine Betrachtungsweise des Forschungsdatenmanagements vor, die zwischen wissenschaftspolitischer, organisatorischer und technischer Dimension unterscheidet.

In Deutschland ist spätestens seit der Initiierung der Schwerpunktinitiative „Digitale Information“ der Allianz der deutschen Wissenschaftsorganisationen im Jahre 2008 eine steigende wissenschaftspolitische Relevanz dieser Infrastrukturen zu beobachten. Wichtige Arbeiten dazu hat die Enquete-Kommission „Internet und digitale Gesellschaft“ (2012) des 17.  Deutschen Bundestags geleistet. Deren Projektgruppe „Bildung und Forschung“ hat sich umfassend mit den Auswirkungen der Digitalisierung in Forschung und Lehre befasst und sich im parteiübergreifenden Konsens dafür ausgesprochen, „das Open Access-Prinzip, soweit möglich, auf den Bereich der Forschungsdaten aus öffentlich geförderter Forschung auszuweiten und hierfür entsprechende Maßnahmen zu erarbeiten“.

Ausgehend von den Grundsätzen zum Umgang mit Forschungsdaten, die die Allianz der Wissenschaftsorganisationen 2010 veröffentlicht hat, haben Bund und Länder auf die Impulse aus der Wissenschaft reagiert und Empfehlungen zur zukünftigen Ausgestaltung dieser Infrastrukturen in Auftrag gegeben, die auf nationaler Ebene durch die Kommission Zukunft der Informationsinfrastruktur (KII) und den Wissenschaftsrat (WR) bearbeitet wurden und im Jahr 2013 zur Einsetzung des Rates für Informationsinfrastrukturen (RfII) durch die Gemeinsame Wissenschaftskonferenz (GWK) geführt haben. Anliegen der Politik ist es, die „vielfältigen Aktivitäten in diesem Bereich besser aufeinander abzustimmen und sie miteinander zu verzahnen” (Gemeinsame Wissenschaftskonferenz, 2013). Der RfII legte 2016 die Empfehlung „Leistung aus Vielfalt“ vor, die im Kern die Schaffung einer „Nationalen Forschungsdaten-Infrastruktur (NFDI)“ beinhaltet (Rat für Informationsinfrastruktur, 2016).

Grundlagen der Zugänglichmachung und Nachnutzung von Forschungsdaten

Digitale Forschungsdaten können unter verschiedenen Zugangsbedingungen und -verfahren bereitgestellt werden. In einem ersten Schritt ist es dabei hilfreich, sich auf die Zugangsbereiche von Treloar & Harboe-Ree (2008) zu beziehen, die zwischen einer privaten, einer Gruppen- und einer öffentlichen Domäne unterscheiden. Bei dieser Darstellung handelt es sich um eine konzeptuelle Trennung von Zugangsdomänen, die in der Praxis entsprechende Implikationen z. B. für die Aufbereitung der Forschungsdaten hat. Werden Forschungsdaten in der öffentlichen Domäne geteilt, so sind sie idealerweise durch einen persistenten Identifikator zitierfähig, mit aussagekräftigen Metadaten zu ihrer Entstehung, Verarbeitung und den Nutzungsmöglichkeiten angereichert.

Die Bereitstellung von Forschungsdaten nach den Prinzipien von Open Access, die in der „Berlin Declaration“ aus dem Jahr 2003 niedergeschrieben ist, bedeutet, dass Forschungsdaten ohne technische, rechtliche und finanzielle Einschränkungen zugänglich gemacht werden und nachnutzbar sind (Max-Planck-Gesellschaft, 2003).

Seit einigen Jahren gibt es in der Wissenschaft unter dem Begriff Open Research Data eine Diskussion über die Strategien und Verfahren der Öffnung von Forschungsdaten, die als Teil der Entwicklung hin zu Open Science verstanden wird (Pampel & Dallmeier-Tiessen, 2014 ).

Um Forschenden Anreize zur Zugänglichmachung ihrer Daten zu schaffen, haben sich im Zusammenspiel von Wissenschaft, Bibliotheken und Verlagen in den vergangen Jahren Publikationsstrategien etabliert, die den Forschenden, die Forschungsdaten Dritten bereitstellen, entsprechende Anerkennung im Reputationssystem sichern. Zentrale Voraussetzung dafür ist, wie oben erwähnt, ihre Zitierbarkeit durch die dauerhafte Adressierung der Datensätze (Klump et al., 2006; Neumann & Brase, 2014) z. B. durch die Vergabe des Digital Object Identifier (DOI). Rund um den DOI entsteht durch die Möglichkeiten der Verlinkung mit weiteren persistenten Identifikatoren für Personen (Pampel & Fenner, 2016), Organisationen (Cruse, Haak, & Pentz, 2016) sowie weiteren Produkten der wissenschaftlichen Arbeit wie z. B. Proben (Lehnert et al. 2011) die Grundlage für ein offenes Netzwerk, das Informationsobjekte sichtbar und nutzbar macht.

Können Forschungsdaten z. B. aus Gründen des Datenschutzes – wie etwa in der Medizin oder den Sozialwissenschaften – nicht offen zugänglich gemacht werden, ist es empfehlenswert, zumindest einen Teil ihrer Metadaten öffentlich sichtbar zu machen, so dass die Forschungstransparenz gewährleistet wird und die Chance besteht, dass Dritte sie zuordnen und ihren Kontext kennen können. Die Bedingungen der Zugänglichkeit und Nutzung von Forschungsdaten müssen dann mit den jeweiligen Rechteinhaberinnen und -inhabern geklärt werden. Ein weiteres Szenario ist, dass Forschungsdaten erst nach einer Embargofrist zugänglich gemacht werden. So können Forschende ihre Daten bereits auf einem Forschungsdatenrepositorium speichern und mit einem persistenten Identifikator versehen, der dann in einer Textpublikation (z. B. einem Artikel in einem Fachjournal) zitiert werden kann. Die Forschenden haben somit Zeit, die Forschungsdaten umfassend für die eigene Forschungsarbeit auszuwerten, bevor sie dann für die Fachcommunity zugänglich gemacht werden.

Mit den FAIR-Prinzipien – Findable, Accessible, Interoperable und Reusable – (Wilkinson et al., 2016) wurden im Jahr 2016 Standards geschaffen, die den unterschiedlichen Anforderungen der Disziplinen entsprechen und als Grundlage für den zeitgemäßen Umgang mit Forschungsdaten gelten können. Sie tragen damit auch der Forderung nach einer möglichst offenen Zugänglichmachung der Daten Rechnung. Die FAIR-Prinzipien bilden einen Rahmen für das Forschungsdatenmanagement an wissenschaftlichen Einrichtungen und wurden z. B. von der Europäischen Kommission in ihrer Rolle als Förderorganisation im Forschungsrahmenprogramm Horizon 2020 verankert (European Commission, 2016b).

Leit- und Richtlinien

Unter dem Begriff „Data Policies“ werden Leit- und Richtlinien zum Umgang mit wissenschaftlichen Daten gefasst. Je nach Akteur und Zielgruppe variieren diese Leit- und Richtlinien in ihrer Verbindlichkeit (Pampel & Bertelmann 2011). Zentral sind in Deutschland die – vor dem Hintergrund eines spektakulären Falles von wissenschaftlichem Fehlverhalten formulierten – „Vorschläge zur Sicherung guter wissenschaftlicher Praxis der Deutschen Forschungsgemeinschaft (DFG) aus dem Jahr 1998 (2013 aktualisiert), die an vielen wissenschaftlichen Institutionen in Deutschland bindenden Charakter haben. Sie empfehlen die Aufbewahrung von Forschungsdaten für mindestens zehn Jahre. Die von der DFG geforderte „Sicherung und Aufbewahrung“ stellt jedoch weder die Zugänglichkeit der Forschungsdaten noch deren Nachnutzbarkeit sicher (Deutsche Forschungsgemeinschaft 2013). Die „Sicherung und Aufbewahrung“ sind somit als Mindestanforderung für den Umgang mit Forschungsdaten in der Wissenschaftspraxis zu verstehen, die zu erweitern ist. Im Jahr 2015 hat die DFG zusätzlich „Leitlinien zum Umgang mit Forschungsdaten“ veröffentlicht, in denen Mittelempfängerinnen und -empfänger aufgefordert werden „Forschungsdaten so zeitnah wie möglich verfügbar“ zu machen und sicherzustellen, so dass „eine sinnvolle Nach- und Weiternutzung durch Dritte ermöglicht“ wird (Deutsche Forschungsgemeinschaft 2015).

In den letzten Jahren haben viele wissenschaftliche Einrichtungen solche Leit- und Richtlinien verabschiedet. Auch an der Humboldt-Universität wurde auf Basis der Arbeiten am Lehr- und Forschungsbereichs Informationsmanagement von Peter Schirmbacher eine solche „Forschungsdaten-Policy“ auf den Weg gebracht (Humboldt-Universität zu Berlin, 2014). Über diese Leit- und Richtlinien von Förderorganisationen und wissenschaftlichen Einrichtungen hinaus wirken die Vorgaben wissenschaftlicher Zeitschriften auf Forschende. So erwarten z. B. die Zeitschriften von PLOS (Bloom, Ganley & Winker, 2014) und Nature (Nature, 2016) ein sogenanntes „Data Availability Statement“, das bei einer Einreichung über die Zugänglichkeit der dem Artikel zugrundeliegenden Forschungsdaten informiert (Bloom, Ganley & Winker, 2014; Nature, 2016).

Forschungsdatenmanagementpläne

In Forschungsdatenmanagementplänen (im Englischen „Data Management Plan“ genannt) wird der Umgang mit Forschungsdaten in einem Forschungsprojekt von der Planung bis zum Abschluss eines Projekts dokumentiert.

Forschungsdatenmanagementpläne sind dynamische Dokumente, die im Projektverlauf immer wieder angepasst werden können. Sie geben einem Projekt und seinen Partnerinnen und Partnern einen Handlungsrahmen für den Umgang mit den im Projekt entstehenden und verwendeten Forschungsdaten.

Inhalte von Datenmanagementplänen sind z. B. Aussagen zu Typ und Format der Forschungsdaten, deren Grad der Standardisierung (z. B. verwendete Metadaten, Datenformate), Angaben zur Zugänglichkeit und den Möglichkeiten der Nachnutzung sowie zu den angewandten Verfahren der langfristigen Bewahrung der Forschungsdaten.

Forschungsförderorganisationen fordern zunehmend bereits im Rahmen der Projektantragstellung Aussagen zur Zugänglichkeit und Nachnutzbarkeit der Forschungsdaten. Die konkreten Anforderungen an diese Forschungsdatenmanagementpläne sind in den Leit- oder Richtlinien zur Antragstellung formuliert.

Die Anforderungen der Deutschen Forschungsgemeinschaft (DFG) an Antragstellerinnen und Antragsteller finden sich im „Leitfaden für die Antragstellung“.. Dort heißt es: „Wenn aus Projektmitteln systematisch Forschungsdaten oder Informationen gewonnen werden, die für die Nachnutzung durch andere Wissenschaftlerinnen und Wissenschaftler geeignet sind, legen Sie bitte dar, ob und auf welche Weise diese für andere zur Verfügung gestellt werden. Bitte berücksichtigen Sie dabei auch – sofern vorhanden – die in Ihrer Fachdisziplin existierenden Standards und die Angebote existierender Datenrepositorien oder Archive.” (Deutsche Forschungsgemeinschaft, 2014)

Während die DFG diese Aussagen zum Datenmanagement im Rahmen der Antragstellung erwartet, sind Datenmanagementpläne im Rahmen des europäischen Forschungsrahmenprogramm Horizon 2020 als „deliverable“ in den ersten sechs Monaten eines Projekts einzureichen. Weitere Aussagen eines Projektkonsortiums zum Datenmanagement werden im Projektverlauf und zum Ende eines Projekts erwartet (European Commission, 2016b).

Für die Erstellung dieser Pläne gibt es mittlerweile mehrere Werkzeuge und Vorlagen. Beispiele sind:

  • Checkliste zum Forschungsdaten-Management des WissGrid-Projeks, Deutschland (Ludwig & Enke, 2013),
  • DMPonline des Digital Curation Centre, Großbritannien,
  • DMPTool der University of California, U.S.A.

Forschungsdatenmanagementpläne dienen auch als Berechnungsgrundlage für die Kosten des Forschungsdatenmanagements. Teilweise stellen Förderorganisationen Mittel für diese Arbeiten zur Verfügung. Im Rahmen eines Forschungsdatenmanagementplans können die beantragten Mittel so nach Aktivität des Forschungsdatenmanagements aufgeschlüsselt werden.

Informationsinfrastrukturangebote

Im Folgenden sollen einige der zentralen Angebote der Informationsinfrastruktur beschrieben werden, die das Forschungsdatenmanagement unterstützen und die Forschungstransparenz sowie die Nachnutzung von Forschungsdaten ermöglichen. Sie unterstützen den Nachweis der Forschungsdaten durch beschreibende Metadaten, den Zugang zu den Forschungsdaten für die Öffentlichkeit oder eine ausgewählte Nutzergruppe (z. B. aus datenschutzrechtlichen Gründen) sowie die längerfristige Erhaltung der Forschungsdaten.

In einigen Wissenschaftsdomänen sind Informationsinfrastrukturangebote für Forschungsdaten bereits seit vielen Jahrzehnten etabliert (so z. B. durch die Weltdatenzentren in einigen Disziplinen der Naturwissenschaften schon seit den 1950er Jahren), in anderen wird gerade erst begonnen, entsprechende Angebote aufzubauen und zu etablieren.

Je nach Wissenschaftsdisziplin und davon abhängig nach Methode der Datenerhebung und ‑verarbeitung sowie nach Datentypen und -formaten bestehen unterschiedliche Anforderungen an die Funktionalitäten der Infrastrukturangebote. Die Landschaft der Infrastrukturangebote für Forschungsdaten ist daher äußerst heterogen (Pampel, et al. 2013). Seit einigen Jahren wird die Professionalisierung dieser Infrastrukturangebote für die Speicherung, Archivierung und Zugänglichmachung unter dem Begriff „Forschungsdatenrepositorien” diskutiert.

Aus der Perspektive der Wissenschaftspraxis variieren die Publikationsstrategien für Forschungsdaten. Teilweise werden die Daten als eigenständiges Informationsobjekt z. B. in einem Forschungsdatenrepositorium (im Folgenden: FDR) veröffentlicht, teils als „Supplement“ oder „Enhanced Publication“ in direkter Verbindung mit einem Aufsatz, oder auch als „Data Paper” in einer wissenschaftlichen Zeitschrift oder einem speziellen „Data Journal” (Woutersen-Windhouwer & Brandsma, 2009; Pampel & Dallmeier-Tiessen, 2014). Ein Konzept für das Zusammenspiel von FDR und Zeitschriftenartikeln wurde 2017 mit dem Scholix Framework vorgelegt (Burton et al., 2017). Darüber hinaus liegen Empfehlungen zur persistenten Adressierung und Vernetzung der Informationsobjekte für Forschungsdatenrepositorien (Fenner et al., 2017) und Zeitschriften (Cousijn et al. 2017) vor, die einen wichtigen Beitrag dazu leisten, dass Forschungsdaten als eigenständige Objekte im Bereich der Wissenschaftskommunikation anerkannt werden.

Forschungsdatenrepositorien

Der Begriff des „Repositoriums“ ist im Kontext der Informationsinfrastruktur bereits aus dem Umfeld der Textrepositorien bekannt, die Zugang zu elektronischen Veröffentlichungen ermöglichen (Lynch, 2003).

Im Projekt re3data – Registry of Research Data Repositories, an dem der Lehr- und Forschungsbereich von Peter Schirmbacher als Projektpartner beteiligt war, wurde ein globales Verzeichnis von Forschungsdatenrepositorien aufgebaut (Pampel et al., 2013). In diesem Verzeichnis werden inzwischen weltweit 1.805 FDR nachgewiesen. Sie sind mithilfe eines umfangreichen Metadatenschemas beschrieben (Rücknagel, 2015). In re3data können Forschende, Angehörige von Infrastruktureinrichtungen und Forschungsförderorganisationen sowie Interessierte nach geeigneten FDR für die Zugänglichmachung von Forschungsdaten suchen; zugleich können FDR gefunden werden, die Forschungsdaten zur Nachnutzung anbieten. Auf Basis der umfangreichen Metadatenbeschreibung der indexierten FDR lässt sich die Suche in re3data mithilfe von Filtern verfeinern.

Anhand von re3data zeigt sich die gesamte Bandbreite an Forschungsdatenrepositorien: Es werden beispielsweise disziplinäre, multidisziplinäre, behördliche, institutionelle und projektspezifische Repositorien nachgewiesen.

Für die Aufnahme eines FDR in das Verzeichnis gilt die folgende Definition: „A research data

repository is a subtype of a sustainable information infrastructure which provides long-term storage and access to research data. Research data means information objects generated by scholarly projects for example through experiments, measurements, surveys or interviews.“ (Rücknagel, 2015). Diese sehr breit angelegte Definition eines FDR entstand vor dem Hintergrund, dass den Nutzerinnen und Nutzern von re3data bei der Suche möglichst viele potentiell relevante FDR angeboten werden sollen.

Nach informationswissenschaftlichen Gesichtspunkten ist ein FDR spezifischer zu beschreiben: Es handelt sich dabei um ein webbasiertes Angebot der Informationsinfrastruktur, das die Zugänglichmachung und Nutzung von digitalen Forschungsdaten unterstützt. Dabei stellt das FDR mindestens sicher, dass auf Basis von Anforderungen einer definierten Nutzergruppe

  • die Forschungsdaten in einem für die Nachnutzung geeigneten Datenformat bereitgestellt werden,
  • die Forschungsdaten zitierbar sind und durch etablierte Metadatenschemata beschrieben werden,
  • die Forschungsdaten mit Informationen zu Nutzungsbedingungen angereichert werden.

Ein FDR wird durch eine vertrauenswürdige Institution wie etwa eine wissenschaftliche Einrichtung mit dem Ziel betrieben, das FDR langfristig verfügbar zu halten. Die Zielgruppe des FDR, die Anforderungen an die zu speichernden Forschungsdaten, die Bedingungen zur Nutzung des FDR und der Forschungsdaten sind in öffentlich verfügbaren Dokumenten dargestellt. Ein FDR orientiert sich bei der Aufbereitung von Forschungsdaten an in der jeweiligen Fachcommunity verfügbaren Standards sowie an übergreifenden Qualitätsstandards für Informationsinfrastrukturangebote wie etwa dem Data Seal of Approval, der DIN-Norm 31644 oder der ISO-Norm 16363:2012 „Audit and certification of trustworthy digital repositories“. Ein FDR bietet eine metadatenbasierte Suche über die gespeicherten Inhalte und erlaubt den Zugang zu diesen über eine Weboberfläche. Darüber hinaus stellt das FDR die nachgewiesenen Metadaten über standardisierte Schnittstellen bereit und erlaubt so Aggregation der Metadaten durch Dienste Dritter (z. B. durch Suchmaschinen und Harvesting-Dienste). Die Gestaltung von FDR ist darüber hinaus abhängig von Faktoren wie z. B.

  • den Zugangsmodellen zum Repositorium selbst und zu den Forschungsdaten,
  • den durch jeweilige Zielgruppe benötigten Funktionalitäten,
  • der verwendeten Software und
  • den zugrundeliegenden Kosten- und Geschäftsmodellen.

Bekannte fachliche FDR sind PANGAEA (Diepenbroek et al., 2002) im Bereich der Geowissenschaften und GenBank (Benson et al., 2015) in der Biomedizin. An vielen wissenschaftlichen Institutionen entstehen aktuell FDR, die Forschungsdaten der Angehörigen der jeweiligen Institutionen aufnehmen. Beispiele in Deutschland sind heiDATA an der Universität Heidelberg, Open Data LMU an der Ludwig-Maximilians-Universität München oder panMetaDocs (Ulbricht et al., 2016) am Deutschen GeoForschungsZentrum – GFZ. An einigen Einrichtungen wie z. B. der Technischen Universität Berlin wird ein gemeinsames Repositorien für Forschungsdaten, Textpublikationen und andere Informationsobjekte angeboten. Auch an der Humboldt-Universität sind unter der Leitung und Mitwirkung von Peter Schirmbacher in seinen Funktionen als Direktor des Computer- und Medienservice sowie seines Lehr- und Forschungsbereiches am IBI verschiedene Angebote entstanden (wie bspw. das FDR LAUDATIO für historische Textkorpora oder das Medien-Repositorium) bzw. initiiert (z. B. die Nutzung des Publikationsservers edoc für digitale Forschungsdaten im Kontext des von ihm mit beantragten Projekts eDissPlus).

Ist in der Fachcommunity kein geeignetes FDR vorhanden und auch kein institutionelles FDR existent, bietet sich die Zugänglichmachung der Daten auf einem generischen Repositorium wie beispielsweise auf Zenodo am CERN an.

Data Papers und Data Journals

In Data Papers werden Forschungsdaten umfassend dokumentiert. Sie eignen sich besonders, wenn die Metadatenbeschreibung eines Datensatzes in einem FDR nicht ausreichend ist, um beispielsweise die Möglichkeiten der Nachnutzung zu dokumentieren. Die Veröffentlichung eines Data Papers erfolgt in einer wissenschaftlichen Zeitschrift, einem speziellen Data Journal, aber auch anderen Publikationstypen (Pampel & Dallmeier-Tiessen, 2014). In den Geowissenschaften wurde 2008 das Data Journal Earth System Science Data (ESSD) gegründet (Pfeiffenberger & Carlson 2011.). Die hohen Zitationsraten der dort dokumentierten Forschungsdaten führten dazu, dass das ESSD in der 2016 Edition des Journal Citation Report (JCR) auf dem Platz drei der meist zitierten geowissenschaftlichen Journale gelistet wurde.

Recherchemöglichkeiten

Werden Forschungsdaten für die Nutzung gesucht, ist es naheliegend, bekannte und etablierte Angebote wie FDR oder Data Journals direkt anzusteuern oder im jeweiligen Wissenschaftsgebiet z. B. mithilfe von re3data nach FDR zu suchen, die potentiell relevante Forschungsdaten nachweisen. Neben lokalen und fachspezifischen Recherchemöglichkeiten gibt es darüber hinaus auch generische Suchdienste, über die Forschungsdaten recherchiert werden können. Mit Blick auf die zumeist fachspezifischen Metadaten bieten diese Dienste jedoch häufig keine detaillierten Suchmöglichkeiten. Nachfolgend werden drei Beispiele für Dienste genannt, die Metadaten von FDR und anderen Forschungsinfrastrukturen aggregieren und für die angebotsübergreifende Suche anbieten (ihre Datenräume überschneiden sich teilweise). Bei allen Angeboten ist zu beachten, dass die Granularität der über Identifikatoren wie einen DOI identifizierbaren Metadateninformationen sehr unterschiedlich sein kann. Das bedeutet, dass sowohl einzelne Forschungsdaten im Sinne von Dateien als auch ganze Forschungsdatensammlungen mit Metadaten beschrieben sind.

 

DataCite Metadata Search

Dieser Dienst erlaubt die Suche in den Metadaten von Informationsobjekten wie z. B. Forschungsdaten, die bei DataCite mit einem Digital Object Identifier registriert sind und für die bei DataCite entsprechende Metadaten hinterlegt sind. Im Februar 2017 sind im Datenraum von DataCite rund 7,6 Mio. Metadatensätze recherchierbar, darunter 3.178.328 unter dem Objekttyp „Dataset“. Diese Angaben sollten nur als Orientierungswerte betrachtet werden, da verschiedene Aspekte zu einer Verfälschung führen könnten (Metadatenqualität, Dubletten, Zuordnung von Nicht-Forschungsdaten als Forschungsdaten).

BASE – Bielefeld Academic Search Engine

Dieser Dienst erlaubt die Suche in den Metadaten von derzeit 5.135 Quellen wie Repositorien und anderen Datenanbietern der Informationsinfrastruktur, die ihre Metadaten über eine OAI‑PMH‑Schnittstelle zu Verfügung stellen. Im Februar 2017 sind 3.622.458 Metadateneinträge der Dokumentart „Forschungsdaten“ zugeordnet. Forschungsdaten können darüber hinaus auch durch den jeweiligen Anbieter wie ein FDR auch unter weiteren Dokumentarten kategorisiert sein. In die BASE-Suche sind auch die Metadaten von DataCite integriert.

EUDAT B2 Find

Dieser Dienst wurde im Rahmen des EU-Projektes EUDAT entwickelt und ermöglicht die Suche in Forschungsdatensammlungen aus diversen ausgewählten Quellen, darunter die EUDAT Daten-Zentren. EUDAT B2 Find weist im Februar 2017 472.082 Metadaten von Forschungsdaten nach. Indexiert sind u. a. Metadaten aus „Common Language Resources and Technology Infrastructure – CLARIN“ oder „Global Biodiversity Information Facility – GBIF“.

Ausblick

Unter Mitwirkung von Peter Schirmbacher hat die Hochschulrektorenkonferenz (2014) das „Management von Forschungsdaten als strategische Aufgabe der Hochschulleitungen“ benannt. Hochschulen und außeruniversitäre Forschungseinrichtungen haben in den letzten Jahren damit begonnen, Leit- und Richtlinien sowie Informationsinfrastrukturangebote für Forschende rund um die Zugänglichkeit und Nachnutzung von Forschungsdaten zu entwickeln.

Die Schaffung der vom RfII geforderten „Nationale Forschungsdaten-Infrastruktur (NFDI)“ stellt eine große Chance für das deutsche Wissenschaftssystem dar, um die Möglichkeiten der Digitalisierung für Forschung und Lehre zu nutzen (Rat für Informationsinfrastrukturen, 2016) und die sehr differenzierte und heterogene Landschaft der Angebote zusammenzuführen und durch eine gemeinsame Basis zu stützen. Bereits jetzt existierenden über 270 Forschungsdatenrepositorien, an deren Betrieb deutsche Einrichtungen beteiligt sind (Pampel, et al. 2016). Mit Blick auf die Internationalität der Wissenschaft gilt es jedoch den Blick über die Ländergrenzen hinweg zu heben.

Mit dem DFG-Projekt GeRDI und der Helmholtz Data Federation (HDF) haben sich erste Akteure ins Spiel gebracht und ihre Bereitschaft zur aktiven Gestaltung der NFDI signalisiert (Helmholtz-Gemeinschaft, 2016; Zentralbibliothek für Wirtschaftswissenschaften, 2016). Beide Akteure betonen die Bedeutung der Anschlussfähigkeit zur European Open Science Cloud (EOSC), deren Schaffung von der Europäischen Kommission vorangetrieben wird (High Level Expert Group on the European Open Science Cloud, 2016). Ein erstes Förderprogramm des Bundesministeriums für Bildung und Forschung (BMBF) auf Bundesebene und diverse Förderaktivitäten auf Länderebene zeigen zwar erste Ansätze zur Realisierung einer NFDI – eine gemeinsame Koordination ist jedoch weiter wenig zu erkennen. So wurde die Abstimmung von Bund und Ländern in jüngster Vergangenheit u. a. von der Hochschulrektorenkonferenz (2016) und der Deutschen Initiative für Netzwerkinformation (2017) angemahnt – zwei Gremien, in denen auch Peter Schirmbacher gewirkt hat.

Festzuhalten ist, dass das Zusammenspiel der Informationsinfrastruktureinrichtungen und ihrer Angebote noch am Anfang steht. Für die Zukunft gilt es die Standardisierung der Forschungsdatenrepositorien zu fördern und Richt- und Leitlinien, die sich an Forschende richten, zu harmonisieren. Der Abstimmung der beteiligten Akteure, ob Förderorganisationen, Infrastruktureinrichtungen oder weitere Serviceeinrichtungen, kommt hierbei eine große Bedeutung zu. Dabei gilt es auch die Souveränität der öffentlichen Informationsinfrastruktur zu stärken. Hierzu müssen, wie vom RfII angemahnt, neben Forschungsdateninfrastrukturen auch die Fördermechanismen nachhaltig gestalten werdet. Diese ist besonders wichtig, um die Abhängigkeiten von kommerziell agierenden Infrastrukturen wie Figshare oder Mendeley Data zu vermeiden. Hierzu sind, wie von der HRK und von DINI betont, auch Finanzmittel von Bund und Ländern nötig (Hochschulrektorenkonferenz, 2016; Deutsche Initiative für Netzwerkinformation, 2017). Während diese Diskussion auf politischer Ebene zu führen ist, zeigt der Blick in die Praxis bereits jetzt die Erfolge, die im Rahmen der wissenschaftlichen Selbstorganisation entstanden sind. So wurden z. B. unter Mitwirkung von Peter Schirmbacher wichtige Plattformen wie das Wiki Forschungsdaten.org oder der gemeinsamen Arbeitsgruppe Forschungsdaten von DINI und dem Kompetenznetzwerk Nestor geschaffen. Darüber hinaus hat die Bearbeitung des Themenfeldes von Peter Schirmbacher an der Humboldt-Universität zu Berlin mit der Schaffung der Initiative Forschungsdatenmanagement Impulse gegeben, die auch auf andere Hochschulen im In- und Ausland gewirkt haben (Simukovic, Kindling & Schirmbacher, 2012; Kindling, Schirmbacher & Simukovic 2013). Diese Arbeit gilt es als Dienstleistung für die Wissenschaft serviceorientiert fortzusetzen und weiter zu professionalisieren. Nicht zuletzt bleibt darüber hinaus zu hoffen, dass dieses wichtige Lehr- und Forschungsgebiet der Informationswissenschaft, das in hohem Maße an der Entwicklung und Etablierung adäquater Informationsinfrastrukturangebote in wissenschaftlichen Einrichtungen sowie an der Vernetzung der Akteure und Stärkung der Community mitgewirkt hat, an der Humboldt-Universität auch nach der Emeritierung von Peter Schirmbacher als Professor fortgeführt wird.

 

Referenzen

Allianz der deutschen Wissenschaftsorganisationen. (2010). Grundsätze zum Umgang mit Forschungsdaten. Retrieved from http://www.allianzinitiative.de/de/handlungsfelder/forschungsdaten/grundsaetze/

Benson, D. A., Clark, K., Karsch-mizrachi, I., Lipman, D. J., Ostell, J., & Sayers, E. W. (2015). Dennis A. Benson, Karen Clark, Ilene Karsch-Mizrachi, David J. Lipman, James Ostell and Eric W. Sayers *, 43(March), 30–35. http://doi.org/10.1093/nar/gku1216

Borgman, C. L. (2007). Scholarship in the Digital Age. Information, Infrastructure, and the Internet. Cambridge, Massachusetts: MIT Press.

Bloom, T., Ganley, E., & Winker, M. (2014). Data Access for the Open Access Literature: PLOS’s Data Policy. PLoS Biology, 12(2), e1001797. http://doi.org/10.1371/journal.pbio.1001797

Brown, J., Demeranville, T., & Meadows, A. (2016). Open Access in Context: Connecting Authors, Publications and Workflows Using ORCID Identifiers. Publications, 4(4), 30. http://doi.org/10.3390/publications4040030

Cousijn, H., Kenall, A., Ganley, E., Harrison, M., Kernohan, D., Murphy, F., … Clark, T. (2017). A Data Citation Roadmap for Scientific Publishers. bioRxiv. http://doi.org/10.1101/100784

Deutsche Forschungsgemeinschaft. (2013). Sicherung guter wissenschaftlicher Praxis. In Sicherung Guter Wissenschaftlicher Praxis (pp. 1–109). Weinheim, Germany: Wiley-VCH. http://doi.org/10.1002/9783527679188.oth1

Deutsche Forschungsgemeinschaft. (2014). Leitfaden für die Antragstellung. Projektanträge. DFG-Vordruck 54.01 – 06/14. Retrieved from http://www.dfg.de/formulare/54_01/

Deutsche Forschungsgemeinschaft. (2015). Leitlinien zum Umgang mit Forschungsdaten. Retrieved from http://www.dfg.de/download/pdf/foerderung/antragstellung/forschungsdaten/richtlinien_forschungsdaten.pdf

Deutsche Initiative für Netzwerkinformation. (2017). Koordiniertes Förderprogramm von Bund und Ländern zum Forschungsdatenmanagement nötig. Retrieved from http://dini.de/service/nachrichten/nachricht/x/_/dini_hat_eine_stellungnah/

Enquete-Kommission “Internet und digitale Gesellschaft.” (2012). Projektgruppe Bildung und Forschung. Handlungsempfehlungen. Ausschussdrucksache 17(24)052. Retrieved from http://www.bundestag.de/internetenquete/dokumentation/Sitzungen/20120625/A-Drs_17_24_052_-_PG_Bildung_und_Forschung_Handlungsempfehlungen.pdf

European Commission. (2012). Online survey on scientific information in the digital age. Luxembourg: Publications Office of the European Union. Retrieved from http://ec.europa.eu/research/science-society/document_library/pdf_06/survey-on-scientific-information-digital-age_en.pdf

European Commission. (2016a). Open Innovation, Open Science, Open to the World. Luxembourg: Publications Office of the European Union. http://doi.org/10.2777/061652

European Commission. (2016b). H2020 Programme. Guidelines on FAIR Data Management in Horizon 2020. Version 3.0. Retrieved from http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf

Fenner, M., Crosas, M., Grethe, J., Kennedy, D., Hermjakob, H., Rocca-Serra, P., … Clark, T. (2016). A Data Citation Roadmap for Scholarly Data Repositories. bioRxiv. http://doi.org/10.1101/097196

Gemeinsame Wissenschaftskonferenz. (2013). Ergebnisse der Sitzung der Gemeinsamen Wissenschaftskonferenz (GWK) am 22. November 2013. Retrieved from http://www.gwk-bonn.de/fileadmin/Pressemitteilungen/pm2013-16.pdf

Helmholtz-Gemeinschaft. (2016). Digitale Forschungsdaten offen zugänglich machen. Retrieved from https://www.helmholtz.de/aktuell/presseinformationen/artikel/artikeldetail/digitale_forschungsdaten_offen_zugaenglich_machen/

High Level Expert Group on the European Open Science Cloud. (2016). Realising the European Open Science Cloud. Retrieved from http://ec.europa.eu/research/openscience/pdf/realising_the_european_open_science_cloud_2016.pdf

Hochschulrektorenkonferenz. (2014). Management von Forschungsdaten als strategische Aufgabe der Hochschulleitungen. Retrieved from https://www.hrk.de/positionen/beschluss/detail/management-von-forschungsdaten-eine-zentrale-strategische-herausforderung-fuer-hochschulleitungen/

Hochschulrektorenkonferenz. (2016). Hochschulen sind wichtige Akteure innerhalb der Infrastrukturen für das Forschungsdatenmanagement. Spürbare Impulse von Bund und Ländern sind unverzichtbar. Retrieved from https://www.hrk.de/themen/forschung/forschungsdaten-management/

Humboldt-Universität zu Berlin. (2014). Grundsätze zum Umgang mit Forschungsdaten an der Humboldt-Universität zu Berlin. Retrieved from https://www.cms.hu-berlin.de/de/dl/dataman/policy

Kindling, M., & Schirmbacher, P. (2013). „Die digitale Forschungswelt“ als Gegenstand der Forschung Information – Wissenschaft & Praxis, 64(2–3). http://doi.org/10.1515/iwp-2013-0017

Kindling, M., Schirmbacher, P., & Simukovic, E. (2013). Forschungsdatenmanagement an Hochschulen: Das Beispiel der Humboldt-Universität zu Berlin. Libreas, 23, 43–63. Retrieved from http://nbn-resolving.de/urn:nbn:de:kobv:11-100212700

Kommission Zukunft der Informationsinfrastruktur. (2011). Gesamtkonzept für die Informationsinfrastruktur in Deutschland. Retrieved from http://www.allianzinitiative.de/fileadmin/user_upload/www.allianzinitiative.de/KII_Gesamtkonzept.pdf

Kuipers, T., & Van der Hoeven, J. (2009). Insight into digital preservation of research output in Europe. Survey Report. Retrieved from http://libereurope.eu/wp-content/uploads/2010/01/PARSE.Insight.-Deliverable-D3.4-Survey-Report.-of-research-output-Europe-Title-of-Deliverable-Survey-Report.pdf

Klump, J., Bertelmann, R., Brase, J., Diepenbroek, M., Grobe, H., Höck, H., … Wächter, J. (2006). Data publication in the open access initiative. Data Science Journal, 5, 79–83. http://doi.org/10.2481/dsj.5.79

Kroes, N. (2012). Opening Science Through e-Infrastructures. SPEECH/12/258. Retrieved from http://europa.eu/rapid/pressReleasesAction.do?reference=SPEECH/12/258

Lehnert, K., & Klump, J. (2012). The Geoscience Internet of Things. Geophysical Research Abstracts, 14, 13370. Retrieved from http://meetingorganizer.copernicus.org/EGU2012/EGU2012-13370.pdf

Lehnert, K. A., Klump, J., Arko, R. A., Bristol, S., Buczkowski, B., Chan, C., … Zaslavsky, I. (2011). IGSN e.V.: Registration and Identification Services for Physical Samples in the Digital Universe. In AGU Fall Meeting 2011 (p. IN13B-1324). Retrieved from http://abstractsearch.agu.org/meetings/2011/FM/IN13B-1324.html

Lynch, C. A. (2003). Institutional Repositories: Essential Infrastructure for Scholarship in the Digital Age. ARL: A Bimonthly Report, (226). Retrieved from http://www.arl.org/resources/pubs/br/br226/br226ir.shtml

Max-Planck-Gesellschaft. (2003). Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities. Retrieved from http://oa.mpg.de/lang/en-uk/berlin-prozess/berliner-erklarung/

Nature. (2016). Announcement: Where are the data? Nature, 537(7619), 138–138. http://doi.org/10.1038/537138a

Neumann, J., & Brase, J. (2014). DataCite and DOI names for research data. Journal of Computer-Aided Molecular Design, 28(10), 1035–1041. http://doi.org/10.1007/s10822-014-9776-5

Cruse, P., Haak, L., & Pentz, E. (2016). Organization Identifier Project: A Way Forward. Retrieved from https://doi.org/10.5438/2906

Pampel, H., & Bertelmann, R. (2011). „Data Policies“ im Spannungsfeld zwischen Empfehlung und Verpflichtung. In S. Büttner, H.-C. Hobohm, & L. Müller (Eds.), Handbuch Forschungsdatenmanagement (pp. 49–61). Bad Honnef: Bock + Herchen. Retrieved from http://nbn-resolving.de/urn:nbn:de:kobv:525-opus-2287

Pampel, H., Vierkant, P., Scholze, F., Bertelmann, R., Kindling, M., Klump, J., … Dierolf, U. (2013). Making Research Data Repositories Visible: The re3data.org Registry. PLOS ONE, 8(11), e78080. http://doi.org/10.1371/journal.pone.0078080

Pampel, H., & Dallmeier-Tiessen, S. (2014). Open Research Data: From Vision to Practice. In S. Bartling & S. Friesike (Eds.), Opening Science. The Evolving Guide on How the Internet is Changing Research, Collaboration and Scholarly Publishing (pp. 213–224). Heidelberg: Springer. http://doi.org/10.1007/978-3-319-00026-8_14

Pampel, H.; Kindling, M.; Van de Sandt, S.; Kloska, G.; Schnepf, E.; Reuter, E.; Semrau, A.; Rücknagel, J.; Neuberger, N.; Ulrich, R. Vierkant, P.; Fritze, F. Goebelbecker, H.-J.; Bertelmann, R.; Scholze, F.; Schirmbacher, P. (2016). Forschungsdaten-Repositorien mit Beteiligung deutscher Institutionen. Eine re3data.org-Analyse. Version 1.0. http://doi.org/10.5281/zenodo.50148

Pfeiffenberger, H., & Carlson, D. (2011). “Earth System Science Data” (ESSD) – A Peer Reviewed Journal for Publication of Data. D-Lib Magazine. Retrieved from http://dx.doi.org/10.1045/january2011-pfeiffenberger

Rat für Informationsinfrastrukturen. (2016). Leistung aus Vielfalt. Retrieved from http://www.rfii.de/?wpdmdl=1998

Rücknagel, J., Vierkant, P., Ulrich, R., Kloska, G., Schnepf, E., Fichtmüller, D., … Kirchhoff, A. (2015). Metadata Schema for the Description of Research Data Repositories. Version 3.0. Retrieved from http://doi.org/10.2312/re3.008

Suber, P. (2012). Open Access. Cambridge, Massachusetts: The MIT Press. Retrieved from http://mitpress.mit.edu/books/open-access

Schäfer, A., Pampel, H., Pfeiffenberger, H., Dallmeier-Tiessen, S., Tissari, S., Darby, R., … Wilson, M. (2011). Baseline Report on Drivers and Barriers in Data Sharing. Retrieved from https://zenodo.org/record/8306

Schirmbacher, P. (2015). Informationsmanagement als Bestandteil der bibliotheks- und informationswissenschaftlichen Ausbildung. Bibliothek Forschung Und Praxis, 39(2), 143–149. http://doi.org/10.1515/bfp-2015-0017

Simukovic, E., Kindling, M., & Schirmbacher, P. (2012). Unveiling Research Data Stocks : A Case of Humboldt-Universität zu Berlin. iConference 2014 Proceedings, 742–748. http://doi.org/10.9776/14351

Tenopir, C., Allard, S., Douglass, K., Aydinoglu, A. U., Wu, L., Read, E., … Frame, M. (2011). Data Sharing by Scientists: Practices and Perceptions. PLoS ONE, 6(6), e21101. http://doi.org/10.1371/journal.pone.0021101

Tenopir, C., Dalton, E. D., Allard, S., Frame, M., Pjesivac, I., Birch, B., … Dorsett, K. (2015). Changes in Data Sharing and Data Reuse Practices and Perceptions among Scientists Worldwide. PLOS ONE, 10(8), e0134826. http://doi.org/10.1371/journal.pone.0134826

The Royal Society. (2012). Science as an open enterprise. The Royal Society Science Policy Centre report 02/12. Retrieved from http://royalsociety.org/uploadedFiles/Royal_Society_Content/policy/projects/sape/2012-06-20-SAOE.pdf

Treloar, A., & Harboe-Ree, C. (2008). Data management and the curation continuum: how the Monash experience is informing repository relationships. Retrieved from http://www.valaconf.org.au/vala2008/papers2008/111_Treloar_Final.pdf

Ulbricht, D., Elger, K., Bertelmann, R., & Klump, J. (2016). panMetaDocs, eSciDoc, and DOIDB—An Infrastructure for the Curation and Publication of File-Based Datasets for GFZ Data Services. ISPRS International Journal of Geo-Information, 5(3), 25. http://doi.org/10.3390/ijgi5030025

van der Graaf, M., & Waaijers, L. (2011). A Surfboard for Riding the Wave. Towards a four country action programme on research data. Retrieved from http://www.knowledge-exchange.info/Admin/Public/DWSDownload.aspx?File=/Files/Filer/downloads/Primary+Research+Data/Surfboard+for+Riding+the+Wave/KE_Surfboard_Riding_the_Wave_Screen.pdf

Wilkinson, M. D., Dumontier, M., Aalbersberg, Ij. J., Appleton, G., Axton, M., Baak, A., … Musen, M. A. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, 3, 160018. http://doi.org/10.1038/sdata.2016.18

Woutersen-Windhouwer, S., & Brandsma, R. (2009). Enhanced Publications, State of the Art. In M. Vernooy-Gerritsen (Ed.), Enhanced Publications. Linking Publications and Research Data in Digital Repositories. Amsterdam: Amsterdam University Press. Retrieved from http://dare.uva.nl/aup/nl/record/316849

Wissenschaftsrat. (2012). Empfehlungen zur Weiterentwickung der wissenschaftlichen Informationsinfrastrukturen in Deutschland bis 2020 (Drs. 2359-12). Retrieved from http://www.wissenschaftsrat.de/download/archiv/2359-12.pdf

Zentralbibliothek für Wirtschaftswissenschaften. (2016). GeRDI wird Modell für vernetzte Forschungsdaten-Infrastruktur. Retrieved from http://www.zbw.eu/de/ueber-uns/aktuelles/meldung/news/gerdi-wird-modell-fuer-vernetzte-forschungsdaten-infrastruktur/