Benutzerspezifische Werkzeuge

Information zum Seitenaufbau und Sprungmarken fuer Screenreader-Benutzer: Ganz oben links auf jeder Seite befindet sich das Logo der JLU, verlinkt mit der Startseite. Neben dem Logo kann sich rechts daneben das Bannerbild anschließen. Rechts daneben kann sich ein weiteres Bild/Schriftzug befinden. Es folgt die Suche. Unterhalb dieser oberen Leiste schliesst sich die Hauptnavigation an. Unterhalb der Hauptnavigation befindet sich der Inhaltsbereich. Die Feinnavigation findet sich - sofern vorhanden - in der linken Spalte. In der rechten Spalte finden Sie ueblicherweise Kontaktdaten. Als Abschluss der Seite findet sich die Brotkrumennavigation und im Fussbereich Links zu Barrierefreiheit, Impressum, Hilfe und das Login fuer Redakteure. Barrierefreiheit JLU - Logo, Link zur Startseite der JLU-Gießen Direkt zur Navigation vertikale linke Navigationsleiste vor Sie sind hier Direkt zum Inhalt vor rechter Kolumne mit zusaetzlichen Informationen vor Suche vor Fußbereich mit Impressum

Artikelaktionen

FAQ


Einführung und Hintergründe

 

Forschungsdaten speichern und archivieren

 

Forschungsdaten publizieren und teilen

 

Forschungsdaten finden und nutzen

 

 

Einführung und Hintergründe

Was sind Forschungsdaten?

 

Als Forschungsdaten werden (digitale) Daten bezeichnet, die während eines Forschungsprozesses entstehen oder ein Ergebnis dessen sind. Da bei ihrer Gewinnung unterschiedlichste Methoden wie Messungen, Quellenforschungen oder Befragungen angewendet werden, sind Forschungsdaten stets fach- und projektspezifisch. Weiterführende Informationen zur Definition von Forschungsdaten finden Sie hier.


Zurück nach oben

 

 

Was ist Forschungsdatenmanagement?

 

Forschungsdatenmanagement zielt auf den verantwortungsvollen, planvollen und nachhaltigen Umgang mit diesen Daten und nimmt dabei den gesamten Datenlebenszyklus (Data-Lifecycle, Abb. 1) in den Blick.

 

FAQ_FDM_Abb_01_Lebenszyklus

Abb. 1: Forschungsdatenlebenszyklus

Forschungsdatenmanagement beginnt demnach idealerweise bereits bei der Planung der Datenerhebung und befasst sich nicht nur mit der technischen Speicherung und Archivierung, sondern lenkt die Aufmerksamkeit auch darauf, die Daten auffindbar, zugreifbar, inhaltlich nachvollziehbar und somit langfristig nutzbar zu machen. Weiterführende Informationen zum Forschungsdatenmanagement finden Sie hier.

 

Zurück nach oben

 

 

Warum ist Forschungsdatenmanagement wichtig für mich?

 

Folgende Gründe sprechen für ein systematisches Forschungsdatenmanagement und unterstreichen zugleich die Bedeutung für eine gute wissenschaftliche Praxis:

 

Die folgende Abbildung zeigt außerdem die Ziele, die in verschiedenen Kontexten mit dem Forschungsdatenmanagement verfolgt werden können:

FAQ_FDM_Abb_02_Ziele

Abb. 2: Ziele, die mit FDM verfolgt werden können

 

Zurück nach oben

 

 

Was muss ich bei der Planung beachten?

 

    1. Legen Sie fest, wer bei Ihnen für die Einrichtung und Kontrolle des Forschungsdatenmanagements verantwortlich ist.
    2. Überprüfen Sie, ob es für Ihre Fachdisziplin spezifische institutionelle oder allgemeine Vorgaben oder Vorschläge zum Forschungsdatenmanagement gibt.
    3. Stellen Sie bei jedem Forschungsvorhaben möglichst früh fest, welchen Verpflichtungen zur Aufbewahrung und Veröffentlichung von Forschungsdaten Sie unterliegen. (Welche Anforderungen stellen Förderer, Verlage und Universität?)
    4. Stellen Sie fest, welche Forschungsdaten bei dem Forschungsvorhaben erhoben werden.
    5. Überlegen Sie, welche der Forschungsdaten veröffentlicht und anderen zur Nachnutzung zur Verfügung gestellt werden sollen.
    6. Überlegen Sie, wie Sie Forschungsdaten aufbewahren und archivieren wollen. (Forschungsdaten speichern und archivieren)
    7. Prüfen Sie, welche Aufbewahrungs- und Archivierungsmöglichkeiten Ihnen zur Verfügung stehen. Könnten Sie ein allgemeines oder fachspezifisches Datenrepositorium nutzen? (Wie finde ich ein passendes Repositorium?)
    8. Klären Sie die rechtlichen Fragen zur Aufbewahrung und Weitergabe von Forschungsdaten. Dies kann u.a. Datenschutz- und Urheberrecht betreffen.
    9. Erstellen Sie einen Datenmanagementplan. Dieser dokumentiert Ihre Entscheidungen und dient Ihnen als Nachweis der Durchführung. (Wie erstelle ich einen Datenmanagementplan?)
    10. Aktualisieren Sie den Datenmanagementplan im Verlauf des Forschungsvorhabens.


Zurück nach oben 

 

 

Wie erstelle ich einen Datenmanagementplan?

 


    Muster & Templates:

    Wizards:


    Hilfreich sind außerdem folgende Beispiele für Datenmanagementpläne:

    Einen guten Einstieg in das Thema „Datenmanagementpläne” bietet auch das kurze Video-Tutorial der HU-Berlin.


    Zurück nach oben

     

     

    Welche Anforderungen stellen Forschungsförderer, Verlage und Universität?

     

    • Deutsche Forschungsgemeinschaft (DFG)

    Die DFG trifft in ihren am 1. August 2019 in Kraft getretenen ‚Leitlinien zur Sicherung guter wissenschaftlicher Praxis grundlegende Festlegungen zum Umgang mit Forschungsdaten und verlangt u. a., dass „Forschungsdaten […] in der Regel für einen Zeitraum von zehn Jahren zugänglich und nachvollziehbar […] aufbewahrt” werden.

    Ferner heißt es in der Leitlinie:

    „Aus Gründen der Nachvollziehbarkeit, Anschlussfähigkeit der Forschung und Nachnutzbarkeit hinterlegen Wissenschaftlerinnen und Wissenschaftler, wann immer möglich, die der Publikation zugrunde liegenden Forschungsdaten […] zugänglich in anerkannten Archiven und Repositorien.”

    Die 2015 verabschiedeten Leitlinien für den Umgang mit Forschungsdaten enthalten weitere Empfehlungen für die Bereitstellung von Daten, aber auch die datenbezogene Projektplanung. Hierzu wird u. a. ausgeführt:

    „Bereits in die Planung eines Projekts sollten Überlegungen einfließen, ob und welche der aus einem Vorhaben resultierenden Forschungsdaten für andere Forschungskontexte relevant sein können und in welcher Weise diese Forschungsdaten anderen Wissenschaftlerinnen und Wissenschaftlern zur Nachnutzung zur Verfügung gestellt werden können. In einem Antrag sollten die Antragstellenden daher ausführen, welche Forschungsdaten im Verlauf eines wissenschaftlichen Forschungsvorhabens entstehen, erzeugt oder ausgewertet werden. Dabei sollten fachspezifisch angemessene Konzepte und Überlegungen für die Qualitätssicherung, für den Umgang mit und die langfristige Sicherung der Forschungsdaten zugrunde gelegt werden.”


    • Europäische Kommission (EC)

    Die Kommission realisiert im Rahmen des Programms Horizon 2020 ein Pilotprojekt, das als Open Research Data Pilot bezeichnet wird und darauf abzielt, den Zugang zu und die Weiterverwendung von Forschungsdaten aus Horizon 2020-Projekten zu verbessern. Der Open Research Data Pilot folgt dabei dem Grundsatz „so offen wie möglich, so geschlossen wie nötig”.

    Während in den Arbeitsprogrammen 2014-2016 nur ausgewählte Bereiche von Horizon 2020 in das Projekt einbezogen wurden, erstreckt sich der Pilot in der überarbeiteten Version des Arbeitsprogramms 2017 nun auf alle Themenbereiche.

    Es gelten folgende Regelungen:

    Erstellung eines Datenmanagementplans entsprechend der Vorlage. Einreichung innerhalb der ersten sechs Monate, Aktualisierung bei relevanten Änderungen bzw. mindestens zum Zeitpunkt der Zwischen- und Abschlussevaluation des Projekts.

    Datenablage: Forschungsdaten müssen so bald wie möglich (gilt für Daten, die einer Projektpublikation zugrunde liegen) bzw. entsprechend dem Datenmanagementplan (gilt für andere Daten) in einem geeigneten, möglichst institutionellen, projekt- oder fachspezifischen Repositorium hinterlegt werden.

    Veröffentlichung: Sofern möglich, sollen die Daten ohne Nutzungsbeschränkung unter einer offenen Lizenz (bevorzugt CC-BY oder CC-0) einschließlich der benötigten Kontextinformationen und -tools veröffentlicht werden.

    Eine teilweise bzw. vollständige Befreiung von den Auflagen aufgrund berechtigter Gründe ist jedoch möglich. (Spricht etwas gegen eine Veröffentlichung?)

    Weiterführende Informationen finden Sie hier:

    Guidelines on FAIR Data Management in Horizon 2020

    Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020

    Horizon 2020 Online Manual: Open Access and Data Management

    Horizon 2020: Annotated Model Grant Agreement (AGA)

    OpenAIRE Research Data Management Briefing Paper

     

    • Verlage

    Public Library of Science (PLoS): Data Availability / Materials and Software Sharing

    Nature Publishing Group: Availability of Data, Materials, Code and Protocols

    Science: Data and Materials Availability / Preparing Supplementary Materials

    BioMed Central: Availability of Data and Material

    Elsevier: Research Data Policy / Text and Data Mining Policy


    • Justus-Liebig Universität Gießen

    Zurück nach oben 

     

     

    Forschungsdaten speichern und archivieren

    Wie strukturiere ich meine Daten sinnvoll?

     

    Informationen zur "Datei- und Ordnerorganisation" bietet dieser kurze Vortrag von Christian Krippes.

    In den verschiedenen Modifikationsstadien (z.B. Originaldaten, bereinigte Daten, analysefähige Daten) sollten schreibgeschütze Versionen erstellt werden. Weitere Bearbeitungen sollten nur in Kopien dieser Master-Dateien erfolgen.

    Aufgrund der jeweiligen Besonderheiten der Forschungsbereiche, aber auch der Daten selbst können Namenskonventionen ganz unterschiedlich ausgestaltet sein. Sie sollten jedoch stets die Art der Datendateien (Originaldaten, bereinigte Dateien, Analysedateien) und auch die jeweilige Dateiform (Arbeitsdatei, Ergebnisdatei etc.) berücksichtigen.

    Das Speicherdatum sollte in der Dateibenennung enthalten sein, dem YYYYMMDD-Format folgen und am Beginn oder am Ende des Dateinamens stehen, um die Sortierung zu erleichtern. Verzichten Sie auf Sonderzeichen und Umlaute sowie auf Leerzeichen und verwenden Sie stattdessen Unterstriche. Die Bezeichnungen sollten stets einheitlich, eindeutig und aussagekräftig sein.

    Beispiele für Dateibenennungen sind etwa (s. auch HU Berlin: Dateien strukturieren):

    • [Sediment]_[Probe]_[Instrument]_[YYYYMMDD].dat
    • [Experiment]_[Reagens]_[Instrument]_[YYYYMMDD].csv
    • [Experiment]_[Versuchsaufbau]_[Versuchsperson]_[YYYYMMDD].sav
    • [Beobachtung]_[Ort]_[YYYYMMDD].mp4
    • [Interviewpartner]_[Interviewer]_[YYYYMMDD].mp3

    Veränderungen der Daten können durch die Angabe der Version im Dateinamen kenntlich gemacht werden. Ein bekanntes Konzept der Versionierung, das auf dem DDI-Standard (Data Documentation Initiative) basiert, lautet: Major.Minor.Revision.

    Ausgehend von der Version „1.0.0” werden dabei geändert:

    1. die erste Stelle, wenn Fälle, Variablen, Wellen oder Sample hinzugefügt oder gelöscht wurden
    2. die zweite Stelle, wenn Daten korrigiert werden, sodass die Analyse beeinflusst wird
    3. die dritte Stelle, wenn einfache Überarbeitungen ohne Bedeutungsrelevanz vorgenommen werden

    Versionierung kann auch durch entsprechende Software unterstützt werden (z. B. Git).


    Zurück nach oben

     

     

    Welche Dateiformate sollten verwendet werden?

     

    DatentypEmpfohlenBedingt geeignetNicht geeignet
    Audio, Ton *.flac / *.wav *.mp3
    Computer-aided Design (CAD) *.dwg / *.dxf / *.x3d / *.x3db / *.x3dv
    Datenbanken *.sql / *.xml *.accdb *.mdb
    Rastergrafiken & Bilder *.dng / *.jp2 (verlustfreie Komprimierung) / *.jpg2 (verlustfreie Komprimierung) / *.png / *.tif (unkomprimiert) *.bmp / *.gif / *.jp2 (verlustbehaftete Komprimierung) / *.jpeg / *.jpg / *.jpg2 (verlustbehaftete Komprimierung) / *.tif (komprimiert) *.psd
    Rohdaten und Workspace *.cdf (NetCDF) / *.h5 / *.hdf5 / *.he5 / *.mat (ab Version 7.3) / *.nc (NetCDF) *.mat (binär) / *.rdata
    Spreadsheets und Tabellen *.csv / *.tsv / *.tab *.odc / *.odf / *.odg / *.odm / *.odt / *.xlsx *.xls / *.xlsb
    Statistische Daten *.por *.sav (IBM®SPSS)
    Text *.txt / *.pdf (PDF/A) / *.rtf / *.tex / *.xml *.docx / *.odf / *.pdf .doc
    Vektorgrafik

    *.svg / *.svgz

    *.ait / *.cdr / *.eps / *.indd / *.psd
    Video1 *.mkv *.avi / *.mp4 / *.mpeg / *.mpg *.mov / *.wmv
    1. Neben dem Dateiformat (bzw. Containerformat) spielen auch der verwendete Codec und die Kompressionsart eine wichtige Rolle.


    Zurück nach oben

     

     

    Wo speichere ich meine Daten im Arbeitsprozess?

     

     

     

     

     

    Im Falle größeren Speicherplatzbedarfs insbesondere im Rahmen umfangreicherer Forschungsprojekte kontaktieren Sie bitte rechtzeitig das HRZ.


    Zurück nach oben 

     

     

    Was sollte ich beim Backup meiner Daten beachten?

     

    Gutes Forschungsdatenmanagement zeichnet sich auch dadurch aus, dass Sie als Forschende auf einen möglichen Datenverlust bestmöglichst vorbereitet sind. Deshalb sollten Sie bereits zu Beginn Ihres Forschungsprojektes einen Backup-Plan erstellen, der im Bestfall auch regelmäßige Backup-Routinen enthalten sollte. Folgende Fragen sollten in einem Backup-Plan beantwortet werden:

    • Welches Backup-Tool verwenden Sie?
    • Von welchen Daten soll ein Backup erstellt werden?
    • Wo sollen die Backups der Daten gespeichert werden?
    • Wie oft sollen Backups der Daten vorgenommen werden?

    Außerdem sollten Sie die sogenannte 3-2-1-Backup-Regel beachten (s. Abb. 3). Diese besagt, dass Sie von Ihren Daten immer mindestens 3 Kopien auf 2 unterschiedlichen Datenträgern (also beispielsweise einem USB-Stick und einer externen Festplatte) sowie 1 an einem dezentralen Speicherort (also beispielsweise der JLUbox oder winfile) vorhalten sollten. Wichtig ist, dass alle 3 Kopien immer auf dem aktuellen Stand der Originaldatei vorliegen, weshalb sich automatisierte Backup-Routinen am besten eignen. Eine Anleitung, wie Sie mit der Windows-Aufgabenplanung automatisierte Backup-Routinen erstellen können, finden Sie hier.

    FAQ_FDM_Abb_00l_Backup_Regel

    Abb. 3: 3-2-1 Backup-Regel

    Sollten Sie mit personenbezogenen Daten oder anderen rechtlich sensitiven Daten arbeiten, bedenken Sie, dass zumindest das Backup an einem dezentralen Speicher- bzw. Aufbewahrungsort eine Sicherung auf einem Band mit sich bringt, auf die Sie ohne Weiteres keinen Einfluss mehr haben. Sollten Sie Ihre Daten beispielsweise in der JLUbox sichern, dann werden Backups in den Einrichtungen des HRZ angelegt. Einem möglichen Wunsch auf Löschung der Daten können Sie dann nur noch schwierig nachkommen. Bitte verschlüsseln Sie solche rechtlich sensitiven Daten also vor der Speicherung an einem dezentralen Speicherort. Dafür können Sie entweder einen Zip-Ordner erstellen, den Sie mit einem Passwort versehen, oder Sie nutzen die Tools VeraCrypt oder Rohos MiniDrive. (Welche datenschutzrechtlichen Beschränkungen muss ich beachten?)

     

    Zurück nach oben



    Wo archiviere ich meine Daten langfristig?

     

    Gemäß den Grundsätzen guter wissenschaftlicher Praxis sollen Forschungsdaten über einen Zeitraum von mindestens 10 Jahren aufbewahrt werden. Hierfür stehen fachspezifische und fachübergreifende Repositorien zur Verfügung. (Wie finde ich ein passendes Repositorium?)

    Dabei ist der Upload in ein Repositorium nicht gleichbedeutend mit einer Veröffentlichung der Daten. Beispielsweise kann ein Zeitraum festgelegt werden, in dem ein Datenpaket noch nicht zugänglich, die Metadaten indes bereits sichtbar sind. Solche Embargofristen können durch einen Kurator verlängert werden. Weiterführende Informationen zum Thema "Embargo" finden sie hier. Im Falle einer Veröffentlichung können Zugriffs- und Bearbeitungsrechte außerdem in Verträgen oder durch Lizenzen geregelt werden. (Kann ich die Nutzung meiner Daten kontrollieren? / Welche Lizenz soll ich wählen?)

    Beachten Sie bitte auch die jeweiligen Vorgaben von Forschungsförderern und Verlagen sowie datenschutzrechtliche Bestimmungen. (Wer darf über die Weitergabe und Veröffentlichung von Daten entscheiden? / Welche datenschutzrechtlichen Beschränkungen muss ich beachten?)


    Zurück nach oben



    Forschungsdaten publizieren und teilen

    Warum sollte ich meine Daten veröffentlichen?

     

    Die Publikation von Forschungsdaten bietet viele Vorteile, nicht nur für den einzelnen Wissenschaftler, sondern auch für die scientific community und den gesamten Wissenschaftsbetrieb.

    Zum einen sind publizierte Datensätze als eigenständige wissenschaftliche Leistung zitierfähig und erhöhen die Sichtbarkeit der eigenen Forschung. Denn wie Untersuchungen zeigen, werden Veröffentlichungen häufiger zitiert, wenn auch die jeweils zugrunde liegenden Daten publiziert wurden. (s. Piwowar & Vision 2013)

    Zum anderen ermöglicht Data Sharing die Nachnutzung bereits vorhandener Daten. Auf diese Weise können neuartige Fragestellungen untersucht, zugleich aber auch Doppelarbeit vermieden und Kosten reduziert werden.

     

    Zurück nach oben

     

     

    Spricht etwas gegen eine Veröffentlichung?

     

    Zum anderen kann es sich um vertrauliche personenbezogene Daten handeln, die nur nach Anonymisierung oder mit Einverständnis der Betroffenen veröffentlicht werden dürfen. (Welche datenschutzrechtlichen Beschränkungen muss ich beachten?)

    Sollten Sie bei einem Verlag veröffentlichen wollen, achten Sie außerdem darauf, den Verlag mit Bedacht zu wählen und nicht auf sogenannte Raubverlage hereinzufallen. Dieser kurze Vortrag von Werner Dees bietet einen kurzen Überblick, woran Sie Raubverlage erkennen können.


    Zurück nach oben



    Welche datenschutzrechtlichen Beschränkungen muss ich beachten?

     

    Sollen personenbezogene Daten verarbeitet werden, muss in der Regel die Einwilligung der betroffenen Person eingeholt werden. Hierbei muss u.a. der Zweck klar definiert werden und die betroffene Person die Folgen abschätzen können.

    Darüber hinaus können Forschungsdaten wie etwa Unternehmensdaten vertrauliche Informationen enthalten (Know-How-Schutz) oder Vertraulichkeits- und Geheimhaltungsvereinbarungen getroffen worden sein, die eine Veröffentlichung ausschließen.


    Zurück nach oben



    Wer darf über die Weitergabe und Veröffentlichung von Daten entscheiden?

     


    Zurück nach oben



    Besitze ich das Urheberrecht an meinen Daten?

     

    Forschungsobjekte und vereinzelt auch Forschungsdaten können als Werk im Sinne des Urhebergesetzes geschützt sein. Das können sein: Sprachwerke, Computerprogramme, Musikwerke, Pantomimische Werke einschließlich Werke der Tanzkunst, Werke der bildenden Künste einschließlich der Werke der Baukunst und der angewandten Kunst, Lichtbildwerke, Filmwerke und Darstellungen wissenschaftlicher und technischer Art.

    In der Regel fehlt Forschungsdaten aber die notwendige Schöpfungshöhe und sie sind keine Werke. In Betracht kommt aber, dass bestimmte Arten von Forschungsdaten unter ein Leistungsschutzrecht fallen, zum Beispiel Lichtbilder, Laufbilder oder Tonträger.

    Oft sind die Forschungsdaten eines Forschungsvorhabens aber als Teil eines Datenbankwerks urheberrechtlich geschützt oder fallen unter das Leistungsschutzrecht für Datenbanken.

    Forschungsdaten, die nicht unter ein Schutzrecht fallen, können in der Regel von jedermann ohne eine Genehmigung oder Zahlungsverpflichtung zu jedem beliebigen Zweck verwendet werden.


    Zurück nach oben



    Kann ich die Nutzung meiner Daten kontrollieren?

     

    Sofern Sie ein Urheberecht oder Leistungsschutzrecht über Forschungsdaten besitzen, können Sie verschiedene Aspekte der Nutzung über entsprechende Verträge regulieren, wie etwa Art und Weise der Nutzung, Nutzergruppen und –zeitraum, Zweck etc. Da vertragliche Einzelfallregelungen praktisch sehr aufwendig wären, existieren verschiedene Lösungen der standardisierten Regelungen von Nutzungsrechten. So bietet beispielsweise das Leibniz-Zentrum für Psychologische Information und Dokumentation (ZPID) Standardverträge für die Nutzung der psychologischen Daten und GESIS regelt über Nutzungsverträge die Zugangsbeschränkungen für besonders sensible sozialwissenschaftliche Daten. Wenn Ihre Daten keiner spezifischen Zugriffs- oder Nutzungsbeschränkung unterliegen sollen, bietet sich die Verwendung standardisierter Lizenzen wie Creative Commons oder Open Data Commons an. (Welche Lizenz soll ich wählen?)


    Zurück nach oben



    Welche Lizenz soll ich wählen?

     

    Die Veröffentlichung von Daten unter einer bestimmten Lizenz erlaubt eine detaillierte Festlegung der zulässigen Form ihrer Nutzung. Sie schaffen Rechtssicherheit sowohl auf Seiten der bereitstellenden als auch der nutzenden Person. Auch bei dem Verzicht auf jegliche Beschränkungen ist es daher wichtig, diesen zu formulieren.

    Wenngleich Daten selbst in der Regel nicht dem Urheberrecht unterliegen, spricht dennoch einiges dafür, sie als potentiell schützenswert zu behandeln, nicht zuletzt um den eigenen Vorstellungen der Weiternutzung Ausdruck zu verleihen. Hierfür bieten sich verschiedene Lizenzmodelle an. Das verbreitetste unter ihnen ist Creative Commons (CC). CC-Lizenzen sind unabhängig vom lizenzierten Inhalt und decken Urheberrechte, Leistungsschutzrechte und in der aktuellen Version – sofern existent – auch Datenbankherstellerrecht ab.

    Speziell für die Veröffentlichung von Daten ist das Lizenz-Paket ‚Open Data Commons' der Open Knowledge Foundation konzipiert worden. Neben der bedingungslosen Lizenz (Open Data Commons Public Domain Dedication and License (PDDL)) bietet es drei weitere Modelle:

    Unabhängig von Ihrer rechtlichen Verbindlichkeit erfüllt die Lizenz CC-BY die Idee von Open Access und Open Science sicherlich am ehesten, wogegen die ‚Weitergabe unter gleichen Bedingungen' zu Kompatibilitätsproblemen mit anderen Lizenzen, das Verbot von Bearbeitung zu Einschränkungen bei Nutzung durch z.B. Data-Mining oder auch zu Problemen bei der Langzeitarchivierung führen kann. Das Verbot kommerzieller Nutzung erschwert die Verwendung in kommerziellen Datenbanken und reduziert damit potentiell die Sichtbarkeit Ihrer Forschung.

    Welche Lizenz Sie auch wählen – Sie sollten eine bewusste und informierte Entscheidung treffen. Eine ausführlichere Auseinandersetzung mit der Thematik finden Sie bei Wiebe & Guibault 2013. Dieser Vortrag von Frank Waldschmidt-Dietz bietet ebenfalls noch einmal einen kurzen Überblick über Creative Commons Lizenzen und Lizenzierung im Allgemeinen. Welche Vorteile freie, Open Access-fördernde Lizenzen für die Bildung bringen, zeigt ebenfalls Frank Waldschmidt-Dietz in einem Video zu Open Educational Resources, kurz OER.

    Unabhängig von den Nutzungsbedingungen gelten selbstverständlich die Regeln guter Wissenschaftlicher Praxis, die eine Angabe der Quelle verwendeter Daten fordern.


    Zurück nach oben



    Wie kann ich Daten veröffentlichen?

     

     


    Zurück nach oben



    Wie finde ich ein passendes Repositorium?

     

    Wenn Sie auf der Suche nach einem passenden Repositorium sind, kann die Beantwortung folgender Fragen hilfreich sein:

     Um ein geeignetes Repositorium zu finden, können Sie die Registry of Research Data Repositories (re3data.org) nutzen. Hierbei handelt es sich um ein webbasiertes Verzeichnis, in dem Forschungsdaten-Repositorien erschlossen werden. Die Suche nach einem passenden Repositorium kann als einfache Suche durchgeführt werden. Zahlreiche Filter erlauben zudem eine Eingrenzung z. B. nach dem Fachgebiet oder Datentyp. Zur Suche gelangen Sie hier.

     

    Zurück nach oben

     

     

    Was muss ich bei der Einspeisung in ein Repositorium beachten?

     

    • Format

    Zunächst ist es wichtig, dass die Daten in einem geeigneten Format vorliegen. Einige Repositorien machen hier strengere Vorgaben, andere sprechen lediglich Empfehlungen aus oder sind offen für alle Formate. Umso wichtiger ist es, diesbezügliche Überlegungen bereits im Vorfeld der Forschung anzustellen. (Wie erstelle ich einen Datenmanagementplan?) Allgemeine Hinweise und spezifische Links zu Formaten finden Sie unter: Welche Dateiformate sollten verwendet werden?


    • Metadaten

    Damit Daten gefunden und sinnvoll genutzt werden können, müssen sie durch Metadaten genauer dokumentiert sein. Beachten Sie hierzu bitte die detaillierten Hinweise unter: Was sind Metadaten, Metadaten-Schemata, kontrollierte Vokabulare und Dokumentationen?


    • Veröffentlichung

    Ein Upload in ein Repositorium bedeutet nicht automatisch eine sofortige Veröffentlichung. Unter Umständen können Gründe für eine Embargo-Frist oder eine Teilveröffentlichung sprechen. Gerade in wirtschaftsnahen Forschungsdisziplinen sind Embargos für Forschungsergebnisse üblich. Bedenken Sie deshalb, ob gewichtige Gründe gegen eine sofortige Veröffentlichung sprechen. (Spricht etwas gegen eine Veröffentlichung?)


    • Bedingungen

    Überlegen Sie außerdem, unter welchen Bedingungen Sie Ihre Daten veröffentlichen wollen. Hierzu existieren verschiedene Lizenzmodelle (Welche Lizenz soll ich wählen?).

     

    Zurück nach oben

     

     

    Was sind Metadaten, Metadaten-Schemata, kontrollierte Vokabulare und Dokumentationen?

     

    Metadaten sind Daten über andere Daten oder Ressourcen, in diesem Falle Forschungsdaten. Sie beschreiben die Forschungsdaten, um ihre Auffindbarkeit zu optimieren, das Verständnis der Daten für Nachnutzende zu sichern und ermöglichen bei der Nutzung gleicher, standardisierter Metadaten-Schemata auch die Verknüpfung von ähnlichen Forschungsdaten. Zu den basalsten Metadaten-Informationen gehören beispielsweise Titel, Autor/Primärforscher, Institution, Persistent Identifier, Ort & Zeitraum, Thema, Rechte, Dateinamen, Formate etc.

    Metadaten-Schemata (häufig auch Metadaten-Standards) sind Zusammenstellungen von Kategorien zur Beschreibung von Daten. Dabei wird zwischen fachübergreifenden bzw- unabhängigen und fachspezifischen bzw. -abhängigen Standards unterschieden. Metadaten-Schemata sollen sicherstellen, dass alle Forschenden das gleiche Beschreibungsvokabular verwenden, um Interoperabilität und damit eine Vergleichbarkeit der Datensätze zu gewährleisten.

    In der folgenden Tabelle sind beispielhaft einige Metadatenstandards verschiedener Disziplinen aufgeführt. Ist Ihre Wissenschaftsdisziplin nicht aufgeführt, kann meist die Auflistung des Digital Curation Centres (DCC) Aufschluss darüber geben, welche Standards für Ihren Wissenschaftsbereich in Frage kommen.

    Wissenschafts- oder FachdisziplinName des/der Standards
    fachübergreifende Standards DataCite Schema, Dublin Core, MARC21, RADAR
    Geisteswissenschaften EAD, TEI P5, TEI Lex-0
    Geowissenschaften AgMES, CSDGM, ISO 19115
    Klimawissenschaften CF Conventions
    Kunst- & Kulturwissenschaften CDWA, MIDAS-Heritage
    Naturwissenschaften CIF, CSMD, Darwin Core, EML, ICAT Schema
    Röntgenstrahlen-, Neutronen- und Myonenforschung NeXus
    Sozial- und Wirtschaftswissenschaften DDI

    Vor Beginn der Dokumentation Ihrer Daten sollten Sie nach vorhandenen Metadatenschemata suchen. Dieses Vorgehen gewährleistet eine bessere Interoperabilität der zu erstellenden Forschungsdaten mit bereits erstellten Daten der gleichen Fachdisziplin und spart Ihnen die Arbeit, ein eigenes Metadaten-Schema zu entwickeln. Falls ein vorhandener Metadaten-Standard nicht die Beschreibungskategorien bietet, die für Ihre Forschung notwendig ist, lohnt es sich dennoch, einen renommierten, bereits vorhandenen fachspezifischen Standards als Basis zu nutzen und auf diesem aufzubauen, indem Sie beispielsweise zusätzliche Kategorien einarbeiten und dies den Verantwortlichen für den Standard mitteilen, damit diese das Schema erweitern können. Denn Metadaten-Standards sind lebende Gebilde, die je nach Ansprüchen der Forschenden angepasst bzw. mit neuen Kategorien angereichert werden können. Achten Sie dabei darauf, keine Änderungen an bereits vorhandenen Elementen oder Attributen vorzunehmen, um die Interoperabilität nicht zu gefährden.

    Es ist möglich und meist auch notwendig, mehrere Metadaten-Schemata zu verwenden. Sie sollten wenigstens immer ein fachunabhängiges Metadaten-Schema (vorzugsweise Dublin Core) zur Beschreibung ihrer Daten verwenden, da dieses die im ersten Absatz dieses Abschnitts genannten allgemeinen Beschreibungskategorien über die erstellten Forschungsdaten abdeckt. Abb. 4 zeigt zur Veranschaulichung einen Ausschnitt für Metadaten im Dublin Core Standard. Fachspezifische Metadatenstandards hingegen erlauben die Strukturierung ihrer Daten mit Beschreibungskategorien, die auf einer stärker inhaltlichen Ebene liegen und sich von Disziplin zu Disziplin unterscheiden können.

    FAQ_FDM_Abb_03_Metadaten_Aussehen

    Abb. 4: Beispiel-Metadaten im Dublin Core Standard

    Metadatenschemata legen also fest, welche Informationen geliefert werden sollen. Für eine bestmögliche Suche und Nutzung der Daten ist es aber außerdem wichtig, dass diese Informationen mit einem möglichst einheitlichen Vokabular wiedergegeben werden. Hierfür stehen eine Reihe disziplinspezifischer und -übergreifender kontrollierter Vokabulare in Form von Thesauri, Klassifikationen und Normdaten zur Verfügung.

    Art des kontrollierten VokabularsName des kontrollierten Vokabulars

    Eindeutige Identifikation von Personen,

    Gegenständen oder Orten

    Gemeinsame Normdatei (GND)

    GeoNames /

    International Standard Name Identifier (ISNI, ISO 27729) /

    Open Researcher and Contributor ID (ORCID)

    allgemeine, fachübergreifende

    Klassifikationssysteme

    Dewey-Dezimalklassifikation (DDC) /

    Library of Congress Classification (LCC)

    fachspezifische Klassifikationssysteme

    Klassifikation Sozialwissenschaften

    Mathematics Subject Classification (MSC)

    fachspezifische Vokabulare

    Agricultural Information Management Standard (AGROVOC)

    Getty Vocabularies

    Standard-Thesaurus-Wirtschaft (STW)

    Thesaurus Sozialwissenschaften (TheSoz)

    Thesaurus Technik und Management (TEMA)

    Einen Überblick über verschiedene Systeme bieten z.B. das Basel Register of Thesauri, Ontologies & Classifications (BARTOC) und Taxonomy Warehouse.

    Eine Dokumentation geht in der Regel über die Beschreibung der Daten via Metadaten hinaus. Sie stellt eine tiefere (fachwissenschaftliche) Erschließung dar, in deren Rahmen z.B. Entstehungskontext, Variablen, Instrumente, Methoden etc. ausführlich beschrieben werden und so die Provenienz der Daten ersichtlich wird. In vielen Fällen ist eine solche Beschreibung unerlässlich, um die Daten verstehen, prüfen und ggf. nutzen zu können.

    Einführungen ins Thema Metadaten bieten z.B. der JISC Guide oder der interaktive Mantra-Kurs der Universität Edinburgh.

     

    Zurück nach oben 

     

     

    Was sind Persistent Identifier?

     

    Die einschlägigen Publikationsplattformen für Forschungsdaten wie Zenodo und Figshare reservieren beim Publizieren Ihrer Daten automatisch eine DOI vor, die dieser Datensatz dann erhält. Sollten Sie in einem anderen, fachspezifischen Repositorium publizieren, sollten Sie darauf achten, dass auch dieses DOIs oder eine andere Form von PIDs anbietet. (Wie kann ich Daten veröffentlichen? / Wie finde ich ein passendes Repositorium?)

     

    Zurück nach oben 

     

     

    Forschungsdaten finden und nutzen

    Wo finde ich Forschungsdaten?

     

    Nicht zuletzt durch die Vorgaben und Empfehlungen von Förderern, Verlagen und Institutionen zur Zugänglichmachung von Daten stehen zunehmend Forschungsdaten für die Nachnutzung zur Verfügung. Um geeignete Forschungsdaten für den eigenen Forschungsbereich zu finden,  bieten oft einschlägige Angebote aus dem eigenen Fachgebiet die erste Anlaufstelle. Dies können institutionelle oder fachliche Repositorien oder auch Datenjournale sein. Repositorien finden Sie – nach Fachgebiet aufgeschlüsselt – bei re3data.

    Darüber hinaus besteht auch die Möglichkeit, Daten über generische Suchdienste zu recherchieren. Ein großer Nachteil dieser Suchdienste besteht darin, dass sie die detaillierten Metadatenschemata ihrer Quellen oft nicht adäquat abbilden können. Zudem unterscheiden sich die die jeweiligen Metadaten stark dahingehend, was sie identifizieren, also einzelne Daten, Datensets oder -Sammlungen.

    Für die Nachnutzung selbst sind die jeweiligen Rechte (Lizenzen, ggf. Nutzungsverträge) bindend. Sie können u.a. festlegen, wer die Daten zu welchem Zweck und für welche Zeit nutzen darf.

    Wollen oder können Sie nicht auf bereits vorhandene Forschungsdaten zurückgreifen, können Sie natürlich geeignete Forschungsmethoden ihrer Fachdisziplin zur Datengewinnung anwenden. Die Coffee Lecture von Dr. Samuel de Haas und Jan Thomas Schäfer auf dem YouTube-Kanal der UB bietet beispielsweise Informationen zur Datengewinnung über Web Scraping und Text Mining und dem Umgang mit Big Data in der Praxis.

     

    Zurück nach oben 

     

     

    Wie zitiere ich Forschungsdaten?

     

    Um die Nutzung und Nachnutzung von eigenen und fremden Forschungsdaten im Sinne der guten wissenschaftlichen Praxis adäquat zu dokumentieren, ist eine korrekte Datenzitation unerlässlich.

    Autor(en), Jahr, Titel der Forschungsdaten, Datenrepositorium oder Archiv, Version, weltweit Persistenter Identifikator

    Weitere optionale Angaben, die im Rahmen einer Zitation sinnvoll sein können, sind Edition, URI, Resource Type, Publisher, Unique Numeric Fingerprint (UNF) und Location (vgl. Alex Ball & Monica Duke 2015).

     

    Zurück nach oben

     

     


    Wesentliche Quelle für dieses FAQ war das FAQ zum Forschungsdatenmanagement der Universität Kassel, welches Sie hier finden können.