Daten finden und nachnutzen

Aus FORTH-BW
Zur Navigation springen Zur Suche springen

Das Finden und die Nachnutzung von Forschungsdaten kann unter anderem folgende Schritte umfassen: die Recherche und Prüfung bereits erhobener/veröffentlichter Forschungsdaten, die Nachnutzung von Forschungsdaten (unter Berücksichtigung der Nachnutzungsbedingungen) sowie das korrekte Zitieren von Forschungsdaten.

Forschungsdaten finden

Es gibt unterschiedliche Strategien für das Suchen und Finden von (offenen) Forschungsdaten[1], da diese über unterschiedliche Kanäle, beispielsweise über Forschungsdatenrepositorien, als Datensupplement von wissenschaftlichen Publikationen, auf privaten Webseiten, bereitgestellt werden.

1.Sie können (offene) Forschungsdaten über Forschungsdatenrepositorien finden.

Über folgende webbasierte Portale und Verzeichnisse können Sie fachspezifische sowie fächerübergreifende Repositorien finden:

Haben Sie ein passendes Forschungsdatenrepositorium gefunden, können Sie dieses anhand Filter (zum Beispiel Open Access), Schlagwörtern und Stichworten durchsuchen.

2. Sie können (offene Forschungsdaten) über Datenbanken und Datenportale finden.

Über das Datenbankinfosystem DBIS können Sie die von Ihrer Institution lizenzierten Datenbanken finden.

3. Sie können (offene) Forschungsdaten in Datenjournalen finden.

Eine Liste von Data Journals finden Sie hier.

4.Sie können (offene) Forschungsdaten mithilfe von generischen Suchdiensten und Portalen finden. Diese durchsuchen unter anderem Zeitschriften, Digitale Sammlungen, Repositorien über Metadaten (OAI-PMH) nach unter anderem Forschungsdaten.

  • European Union Open Data Portal (Hier können Sie direkt in der Anfangssuchmaske nach Datasets suchen. Data.europa.eu ist das offizielle Datenportal der Europäischen Union.)
  • OpenAIRE Explore (Hier können Sie über die Filter das Resource Product Research Data auswählen.)
  • B2FIND (EUDAT) (Hier können Sie über die Filter den Resource Type Dataset sowie Supplementary Dataset auswählen. Zudem können Sie über den Filter Repositories oder Publisher gezielt in unterschiedlichen Repositorien oder Verlagen nach Forschungsdaten suchen.)
  • DataCite Metadata Search (Hier können Sie über den Filter Work Type Datasets auswählen. Die DataCite Metadata Search durchsucht Metadaten von unter anderem Forschungsdaten, die bei DataCite mit einer DOI registriert sind.)
  • gesisDataSearch (Die Suchmaschine sucht für Sie in Forschungsdatenrepositorien und Metadatendiensten nach Forschungsdaten der Sozial- und Wirtschaftsforschung.)
  • Zanran (Mit dieser Suchmaschine können Sie nach Grafiken und Tabellen suchen, die in Dokumente eingebettet sind.)
  • Creative Commons CC Search (Die Suchmaschine sucht für Sie in Forschungsdatenrepositorien und Metadatendiensten sowie auf weiteren Plattformen nach Forschungsdaten (unter anderem Audiodateien, Bilder, 3-D-Modelle) mit CC-0-, CC-BY- oder CC-BY-SA-Lizenz.)

5.Sind Sie auf der Suche nach Open Government Data, so können Sie diese unter anderem in folgenden Portalen finden:

  • European Union Open Data Portal (Data.europa.eu ist das offizielle Datenportal der Europäischen Union.)
  • Destatis (Destatis ist die Datenbank des Statistischen Bundesamtes.)
  • Eurostat (Eurostat ist die statistische Datenbank der Europäischen Kommission.)
  • Govdata (Govdata ist das Open Governemnt Datenportal für Deutschland.)

Forschungsdaten nachnutzen

Forschungsdaten sind auch über die eigentliche Projektlaufzeit für neue Forschungsvorhaben nutzbar, unter anderem für Metaanalysen, Replikationsstudien, Optimierung von Studiendesigns, Re-Analysen mit neuen Forschungsfragen und -methoden, Modellkalibrierungen.

Die Nachnutzbarkeit eigener oder fremd generierter Forschungsdaten ist von der Qualität der Forschungsdaten, d.h. deren Vollständigkeit, Richtigkeit und Reproduzierbarkeit[2], sowie von den Nachnutzungsbedingungen, die über das Urheberrecht und die Lizenzvergabe geregelt werden, abhängig. Im Idealfall sind Datensätze mit einer offenen Lizenz und klar definierten Nachnutzungsbedingungen markiert.

WICHTIG!

Es ist darauf hinzuweisen, dass die Qualität der Forschungsdaten abhängig von dem Kontext ist, in dem die Forschungsdaten wiederverwendet werden sollen; einen allen Disziplinen gerecht werdenden Qualitätsmaßstab für Forschungsdaten gibt es nicht. Forschungsdaten, die den FAIR-Prinzipien folgen, sind für Mensch und Maschine (nach-)nutzbar (fit for use) und somit auch qualitativ hochwertiger als Forschungsdaten, die nicht dauerhaft auffindbar oder zugänglich oder nicht interoperabel sind. FAIRe Forschungsdaten geben jedoch keine Auskunft darüber, ob sie für die wissenschaftliche Beantwortung einer Fragestellung nützlich bzw. von hinreichend guter Qualität sind (fit for purpose)[3] . Nachnutzbare Forschungsdaten sind FAIR, darüber hinaus jedoch auch gut dokumentiert und von guter inhaltlicher Qualität[4].

FAIRe Daten

Welche konkreten Forschungsdatenmanagement-Maßnahmen können Ihnen dabei helfen, Ihre Forschungsdaten nachnutzbar, das heißt auch auffindbar, zugänglich und interoperabel, FAIR, zu machen und zu halten? Hier einige Beispiel-Maßnahmen[5] :

  • Auffindbar (findable): Beschreibung und Dokumentation Ihrer Forschungsdaten mit maschinenlesbaren (fachspezifischen) Metadaten; Vergabe eines DOI, einer global eindeutigen und dauerhaften Kennung, für Ihre Forschungsdaten; (Open-Access-)Veröffentlichung Ihrer Forschungsdaten und Metadaten auf einem (fachspezifischen) durchsuchbaren Forschungsdatenrepositorium; Archivierung Ihrer Forschungsdaten (in einem nicht-proprietären Datenformat),
  • Zugänglich (accessible): (Open-Access-)Veröffentlichung Ihrer Forschungsdaten und Metadaten auf einem durchsuchbaren Forschungsdatenrepositorium (und evtl. begleitend dazu Veröffentlichung eines Data Paper, das Ihre Forschungsdaten beschreibt); Archivierung Ihrer Forschungsdaten (in einem nicht-proprietären Datenformat); Vergabe eines DOI, einer global eindeutigen und dauerhaften Kennung, für Ihre Forschungsdaten, so dass diese – möglichst Open Access – abgerufen werden können; Langfristige Zugänglichkeit der beschreibenden Metadaten (auch wenn die Forschungsdaten selbst nicht mehr zugänglich sind),
  • Interoperabel (interoperable): (Automatisierte) Verlinkung und Integrierbarkeit Ihrer Forschungsdaten und der beschreibenden Metadaten mit anderen (Meta-)Datensätzen; standardisierte und nachvollziehbare (und evtl. fachspezifische) Benennung Ihrer Forschungsdaten, zum Beispiel Variablenbezeichnung, Vokabulare, Wertebereiche; Archivierung Ihrer Forschungsdaten (in einem offenen, nicht-proprietären Datenformat) oder Möglichkeit, das Datenformat verlustfrei umzuwandeln; Beschreibung und Dokumentation Ihrer Forschungsdaten mit maschinenlesbaren (fachspezifischen) Metadaten und kontrolliertem Vokabular,
  • Nachnutzbar (reuseable): Beschreibung und Dokumentation Ihrer Forschungsdaten mit maschinenlesbaren (fachspezifischen) Metadaten (im Besonderen zum Entstehungskontext der Forschungsdaten); Beschreibung der Beziehung Ihrer Forschungsdaten zueinander; (Open-Access-)Veröffentlichung Ihrer Forschungsdaten und Metadaten auf einem (fachspezifischen) Forschungsdatenrepositorium; Archivierung Ihrer Forschungsdaten in einem nicht-proprietären Datenformat; Definition von eindeutigen Nutzungsrechten (zum Beispiel Vergabe von maschinenlesbaren Creative-Commons-Lizenzen) für Ihre Forschungsdaten.

Ein Datenmanagementplan kann Ihnen dabei helfen, diese FDM-Maßnahmen von Beginn an mitzudenken und umzusetzen. Templates und Tools für die Erstellung eines Datenmanagementplans finden sie unter Forschungsvorhaben planen.

Tools

Mit folgenden Tools können Sie testen, wie FAIR Ihre Forschungsdaten sind:

FAIR Data Self Assessment Tool (Australian Reserach Data Commons (ATDC))

How FAIR are your data? (Jones, Sarah & Grootveld, Marjan)

FAIR-Aware (Data Archiving and Networked Services (DANS))

F-UJI (FAIRsFAIR-Projekt)

Forschungsdaten zitieren

Eine vollständige und korrekte (Forschungs-)Datenzitation gehört zur guten wissenschaftlichen Praxis[6] und wertschätzt die Generierung von Forschungsdaten als eine primäre Wissenschaftsleistung.

Bisher gibt es noch keine verbindlichen Standards zur Datenzitation. Nach der Joint Declaration of Data Citation Principles umfasst eine vollständige Datenzitation folgende Angaben[7]:

Author(s), Year, Dataset Title, Global Persistent Identifier, Data Repository or Archive, Version

Hier ein Beispiel für eine vollständige Datenzitation gemäß der Joint Declaration of Data Citation Principles:

Barbers, Irene; Elsner, Carsten; LIndstrot, Barbara; Mersmann, Jana; Schmiedicke, Heidi; Schütze, Katja; Voigt, Michaela, 2023, "Open Access Monitor: Mirror Journals 2.0", https://doi.org/10.26165/JUELICH-DATA/Q51JEG, Jülich DATA, V1.

WICHTIG!

Informieren Sie sich bei Datenjournalen und Forschungsdatenrepositorien über die jeweils geltenden Zitierregeln. In der Regel können Sie die von dem Datenjournal/von dem Forschungsdatenrepositorium für ein Data Paper/einen Datensatz vorgeschlagene Zitation direkt exportieren (unter anderem als Text, RIS, BibTeX).

Tools

Mit dem DOI Citation Formatter von DataCite und Crossref können Sie Zitiervarianten umformatieren. Geben Sie hierfür einfach den DOI (zum Beispiel eines Datensatzes) ein und wählen das gewünschte Zitationsformat aus.


[1] Ariza, Angela et al. (2023, 14 February). Datennutzung in der Praxis. https://doi.org/10.5281/zenodo.7568266.

[2] Datenqualität umfasst im FDM im Besonderen die Bereiche der Datenformate sowie der Datenvollständigkeit und -richtigkeit, siehe: https://forschungsdaten.info/themen/finden-und-nachnutzen/forschungsdaten-finden/.

[3] Ariza, Angela et al. (2023). Train-the-Trainer-Konzept zum Thema Forschungsdatenmanagement: Erweiterungsmodul Nachnutzung. Version 1.0. https://doi.org/10.5281/zenodo.10160865.

[4] Ariza, Angela (2023, 05. February). Data fitness. https://doi.org/10.6084/m9.figshare.21944477.v1.https://figshare.com/articles/figure/Data_fitness/21944477.

[5] Diese Beispiel-Maßnahmen wurden abgleitet aus: FAIR Data Self Assessment Tool (Australian Research Data Commons (ATDC)), How FAIR are your data? (Jones, S., & Grootveld, M.), FAIR-Aware (Data Archiving and Networked Services (DANS)). Es ist darauf hinzuweisen, dass manche Anforderungen an Forschungsdaten mehreren FAIR-Prinzipien unterliegen. So dienen persistente Identifikatoren beispielweise sowohl der Auffindbarkeit als auch der Zugänglichkeit von Forschungsdaten.

[6] Deutsche Forschungsgemeinschaft (o.D.). Kodex. Leitlinien zur Sicherung guter wissenschaftlicher Praxis (hier im Besonderen die Leitlinie 17: Archivierung). https://wissenschaftliche-integritaet.de/kodex/.

[7] Dataverse Project (o.D.): Data Citation. https://dataverse.org/best-practices/data-citation.