Glossar
Dieses Glossar soll als umfassende und lebende Ressource dienen, um Begriffe und Konzepte im Zusammenhang mit dem Forschungsdatenmanagement klar und verständlich zu definieren. Außerdem enthält es Erläuterungen zu wichtigen FDM-Initiativen und -Projekten. Es richtet sich an Wissenschaftlerinnen und Wissenschaftler, Data Stewards sowie alle Interessierten, die ein tieferes Verständnis der verschiedenen Aspekte des Forschungsdatenmanagements erlangen möchten. Durch die Bereitstellung präziser Definitionen und Erklärungen soll dieses Glossar dazu beitragen, Missverständnisse zu vermeiden und eine gemeinsame Grundlage für die Kommunikation und Zusammenarbeit im Forschungsumfeld zu schaffen.
Zudem unterstützt das Glossar beim Verständnis der folgenden weiteren Grundsätze und Leitlinien der JLU:
- JLU [2020]: Leitlinien für JLUpub. (Link)
- JLU [2023]: Satzung der Justus-Liebig-Universität Gießen zur Sicherung guter wissenschaftlicher Praxis. (pdf)
- JLU [2025]: Forschungsdaten-Leitlinien der Justus-Liebig-Universität Gießen. (in Arbeit)
- JLU [2025]: Handlungsempfehlungen der Justus-Liebig-Universität Gießen zum Umgang mit Forschungsdaten. (in Arbeit)
Glossar
Begriffe & Konzepte
- Data Literacy ist die Fähigkeit, mit Daten kompetent und kritisch umgehen zu können. Zu dieser Fähigkeit gehören verschiedene eigene Kompetenzen, wie die des Datensammelns, -bewertens, -verwaltens, aber auch -verstehens. Eine relativ ausführliche und mit Erklärungen versehene Liste verschiedenster Data Literacy-Kompetenzen bietet Statistics Canada.
- Ein Data Steward ist eine Person, die im Unterschied zum allgemeinen, fachunabhängigen Forschungsdatenreferat fachspezifisch in einem Fachbereich, Projekt oder an einem Institut für das Datenmanagement zuständig ist und als Multiplikator für gutes Forschungsdatenmanagement in den Fachbereichen bzw. Fachdisziplinen dient, um dort nachhaltig eine eigene Datenkultur aufzubauen bzw. diese positiv zu verändern. Für das zentrale Forschungsdatenreferat dienen sie als Ansprechpersonen und Brücke in die Fachbereiche.
- Datenarchivierung ist eine Spezialform der Datenaufbewahrung, die das dauerhafte, geordnete und unveränderbare Speichern von (meist nicht mehr aktiv genutzten) Daten beschreibt. Archivierte Daten werden oft in revisionssicheren, speziell gesicherten Umgebungen vorgehalten. Der Begriff führt im Bereich des Forschungsdatenmanagements zu Verwirrung, wenn keine Abgrenzung zur Langzeitarchivierung vorgenommen wird oder Datenarchivierung und Langzeitarchivierung synonym verwendet werden, obwohl an die Langzeitarchivierung höhere Ansprüche gesetzt werden.
- Datenaufbewahrung beschreibt die Praxis, Daten für einen bestimmten häufig rechtlich oder organisatorisch vorgeschriebenen Zeitraum bis zum Ablauf von Aufbewahrungsfristen vorzuhalten. Oft ist sind diese Fristen durch Gesetze (z.B. DSGVO, Handelsrecht) oder auch (wissenschaftliche Richtlinien oder Vorgaben geregelt. Häufig wird der Begriff aber auch verwendet, um die gesamte Verwaltung sämtlicher gespeicherter Daten über den Datenlebenszyklus hinweg zu beschreiben.
- Ein Datenmanagementplan (kurz DMP) ist ein „lebendes“ Dokument, das den Umgang mit Forschungsdaten vor, während und nach einem Forschungsprojekt beschreibt und bei Bedarf aktualisiert wird. Einige Forschungsförderer haben Vorgaben hinsichtlich der Gestaltung eines DMPs und der darin zu beantwortenden Fragen, die meisten geben jedoch größere Freiheiten. Ein DMP sollte mindestens Details zur (1) Datenbeschreibung, (2) Dokumentation und Datenqualität, (3) Speicherung und Sicherung der Daten, zu (4) rechtlichen Verpflichtungen und Rahmenbedingungen, zum (5) Datenaustausch und dauerhaften Zugänglichkeit und zu (6) Verantwortlichkeiten und Ressourcen enthalten.
- Datenorganisation umfasst alle grundlegenden Prozesse und Methoden, die zum Wiederauffinden von Daten genutzt werden. Im Bereich des Forschungsdatenmanagements sind hierfür vor allem die Datei- und Ordnerbenennung, Ordnerstrukturierung und die Datenversionierung von zentraler Bedeutung.
- Datenschutz bezeichnet den Schutz personenbezogener Daten vor unbefugter Erhebung, Verarbeitung und Nutzung. Ziel ist es, die Privatsphäre von Personen zu wahren und gesetzliche Vorgaben wie die Datenschutz-Grundverordnung (DSGVO) einzuhalten.
- Unter den Begriff Datensicherheit fallen alle Verfahren, die sich mit dem Schutz von Daten vor unbefugtem Zugriff, Verlust, ungewollten Veränderungen, Beschädigung, aber auch mit der sicheren Löschung von Daten befassen. Datensicherheit und Datenschutz können sich unter Umständen negativ bedingen, beispielsweise mit Blick auf Backups. Diese erhöhen die Datensicherheit, stellen aber unter Umständen eine zusätzliche Gefahr für den Datenschutz dar.
- Datenspeicherung umfasst das Ablegen und Vorhalten von Daten auf beliebigen Speichermedien (z.B. Festplatten, Server, Cloud) vor allem während des Arbeitsprozesses.
- Die FAIR-Prinzipien stellen Grundsätze dar, die die Wiederverwendungspotenziale von Forschungsdaten insgesamt erhöhen sollen, indem bestimmte Anforderungen an die Findability (= Auffindbarkeit), die Accessibility (= Zugänglichkeit), Interoperability (= Interoperabilität) und die Reusability (= Nachnutzbarkeit) von Datensätzen gestellt werden.
- Forschungsdaten sind alle Daten, die im Prozess der Forschungsarbeit unter anderem durch Beobachtung, Sammlung, Messung, Experiment, Simulation und Weiterverarbeitung entstehen oder deren Ergebnis sind. Dazu zählen auch die zu ihrem Verständnis erforderlichen Metadaten, notwendige Dokumentation und Software. Je nach Wissenschaftsdisziplin und Fachkultur können Forschungsdaten in unterschiedlichen Typen, Aggregationsstufen und Formaten vorliegen. Sie sind die Grundlage und das Ergebnis wissenschaftlicher Arbeit.
- Der Forschungsdatenlebenszyklus beschreibt die verschiedenen Phasen, die Forschungsdaten von ihrer Erstellung bis zu ihrer Nachnutzung oder der ggf. notwendigen Löschung durchlaufen. Das Modell bietet den Ausgangspunkt für alle Aktivitäten, die für das Forschungsdatenmanagement notwendig sind und sollte deshalb für Forschungsprojekte die Grundlage für die Entwicklung eines effizienten projektspezifischen Forschungsdatenmanagements darstellen. Der Lebenszyklus kann je nach Quelle leicht variieren. Üblicherweise enthält er mindestens die folgenden sechs Phasen: Projektplanung, Datenerhebung, Datenspeicherung, Datenverarbeitung, Datenpublikation und Datennachnutzung. Folgende Phasen bieten noch einmal eine feinere Untergliederung: Planung bzf. Vorbereitung der Datenerhebung, -erstellung, -eingabe oder -erfassung, Datenaufbereitung, Datenanalyse, Datenarchivierung und Datennachnutzung. Je nach projektspezifischen Herausforderungen wäre es aber auch denkbar noch eigene Phasen hinzuzufügen bzw. diese von anderen Phasen abzukoppeln. Man könnte den projektinternen Datenaustausch beispielsweise als eigene Phase betrachten, sonst bei den bereits genannten Phasen wohl unter den Bereich der Datenspeicherung fallen würde).
- Das Forschungsdatenmanagement (kurz FDM) umfasst den gesamten Umgang mit Forschungsdaten, von der Planung, der Erhebung und Aufbewahrung über Qualitätssicherung und Verarbeitung bis zur Zugänglichmachung bzw. Publikation. Es richtet sich dabei an den aktuellen fachlichen Standards aus und berücksichtigt fachspezifische Besonderheiten.
- Die gute wissenschaftliche Praxis (kurz gwP) umfasst Grundsätze und Verhaltensweisen, die darauf abzielen, die Qualität und Integrität von Forschung zu gewährleisten. Diese betreffen zu einem großen Teil auch das FDM und sollen dazu beitragen, Vertrauen in wissenschaftliche Ergebnisse zu schaffen und den wissenschaftlichen Fortschritt zu fördern. Die Deutsche Forschungsgemeinschaft (DFG) hat diese so genannten Leitlinien zur Sicherung guter wissenschaftlicher Praxis (häufig auch einfach als DFG-Kodex bezeichnet) zuletzt 2022 veröffentlicht (pdf). Da die Umsetzung der Leitlinien verpflichtend ist, um über die DFG weiter förderfähig zu bleiben, hat die JLU 2023 eine eigene Satzung zur Sicherung guter wissenschaftlicher Praxis veröffentlicht (pdf), der alle Wissenschaftlerinnen und Wissenschaftler der JLU verpflichtet sind.
- Kontrollierte Vokabulare sind standardisierte Listen von Begriffen, die zur einheitlichen Beschreibung und Indexierung von Daten verwendet werden. Diese werden häufig in Kombination mit Metadatenstandards genutzt und können in unterschiedlichen Formen wie beispielsweise Thesauri, Klassifikationen oder Normdaten vorliegen. Sie gewährleisten, dass Begriffe konsistent und eindeutig genutzt werden und erleichtern so die Suche, Verknüpfung und Nachnutzung von Daten. Die Anwendungsbereiche reichen von der eindeutigen Bezeichnung (und ggf. Identifikation) von Personen, Gegenständen oder Orten hin zu fachspezifischen Vokabularen, die einen international Austausch durch sprachlich unabhängige Bezeichnungen von Begriffen in den jeweiligen Fachdisziplinen ermöglichen. Einen guten Überblick über die Vielzahl an kontrollierten Vokabularen bietet FAIRsharing.
- Langzeitarchivierung (kurz LZA) ist eine besondere Form der Datenarchivierung. Ihr Ziel ist es, die dauerhafte Verfügbarkeit, Lesbarkeit, Authentizität und Integrität von digitalen Informationen über sehr lange Zeiträume (Jahrzehnte oder sogar lebenslang) auch trotz technischer Entwicklungen und Medienwechsel sicherzustellen. Die LZA erfordert spezielle Strategien, wie regelmäßige Datenmigration, Nutzung offener Formate, umfangreiche Metadaten (vor allem Erhaltungsmetadaten) und Integritätskontrollen.
- Metadaten sind strukturierte Informationen, die dazu dienen, Forschungsdaten für ein besseres Verständnis im Hinblick auf verschiedenste Aspekte zu beschreiben. Dazu gehören neben grundlegenden Informationen zur Identifikation der Forschungsdaten (Autorschaft, Titel, Erstellungsdatum usw.) auch Informationen über die Provenienz, den Kontext, die Zugriffs- und Nutzungsrechte, technische Details oder Referenzen/Verknüpfungen zu zugehörigen Publikationen.
- Metadatenstandards sind Zusammenstellungen von Kategorien zur Beschreibung von Daten. Es wird im Allgemeinen zwischen fachübergreifenden und fachspezifischen Standards unterschieden. Durch Metadatenstandards soll sichergestellt werden, dass alle für einen bestimmten Anwendungszweck die gleichen Beschreibungskategorien verwenden, um Interoperabilität und damit eine Vergleichbarkeit der Datensätze herzustellen. Die bekanntesten fachübergreifenden Standards sind Dublin Core und das DataCite Schema. Eine gute Übersicht über verschiedene disziplinspezifische Metadatenstandards bietet das Digital Curation Centre (DDC).
- Persistent Identifier (PID) sind weltweit eindeutige und dauerhaft gültige Kennungen, mit denen auf Ressourcen wie Forschungsdaten, Artikel, Videos aber auch Veranstaltungen, Personen, Orte, Forschungsgroßgeräte usw. zuverlässig verlinkt werden kann. Sie gewährleisten, dass eine Ressource auch dann auffindbar bleibt, wenn sich ihr Speicherort (z.B. die URL) ändert und stellen daher eine sichere und eindeutige Möglichkeit zur Zitation dar. Der bekannteste PID im wissenschaftlichen Kontext ist vermutlich der Digital Object Identifier (DOI). Es gibt aber auch weitere wie die ORCID iD zur eindeutigen Referenzierung auf akademisch arbeitende Personen oder die ROR ID zur eindeutigen Referenzierung auf Forschungseinrichtungen.
Initiativen & Projekte
- Das Ziel der European Open Science Cloud (kurz EOSC) ist es, europäischen Forschern, Innovatoren, Unternehmen und Bürgern ein föderiertes und offenes multidisziplinäres Umfeld zu bieten, in dem sie Daten, Werkzeuge und Dienste für Forschungs-, Innovations- und Bildungszwecke veröffentlichen, finden und weiterverwenden können. Die EOSC ist vom Rat der Europäischen Union als Pilotprojekt zur Vertiefung des neuen Europäischen Forschungsraums (EFR) anerkannt. Sie wird auch als der Datenraum für Wissenschaft, Forschung und Innovation bezeichnet, der vollständig mit den anderen sektoralen Datenräumen, die in der europäischen Datenstrategie definiert sind, verknüpft werden soll. Die im Titel verlinkte Website ist die EU Node, die den ersten großen Meilenstein der EOSC darstellt. Es bündelt als Metaportal der Europäischen Union die europäischen Services zur Verfügbarmachung von Forschungsdaten und macht diese auffindbar.
- Die Webseite forschungsdaten.info ist das deutschsprachige Informationsportal zu Forschungsdatenmanagement (FDM). Mit praxisnahen Artikeln führt die Seite ins Forschungsdatenmanagement ein. Die Beiträge umfassen dabei die Schritte von der Antragsplanung eines Forschungsprojekts, die Arbeit mit Forschungsdaten im Forschungsalltag, die Umsetzung des Antrags bis hin zur Publikation und der Nachnutzung von Daten. Auch Rechte und Pflichten im Umgang mit Forschungsdaten werden behandelt. Zusätzlich liefern Best-Practice-Beispiele und Informationsmaterialien aus den einzelnen Wissenschaftsbereichen Anregungen, um Daten besser (nach-)nutzbar zu machen. Zudem stellen sich auf forschungsdaten.info FDM-Initiativen und -Projekte aus dem deutschsprachigen Raum vor. Redaktionell wird die Plattform von einem überregionalen Team von FDM-Spezialistinnen und -Spezialisten betreut.
- Gaia-X ist ein Projekt zum Aufbau einer leistungs- und wettbewerbsfähigen, sicheren und vertrauenswürdigen Dateninfrastruktur für Europa, das von Vertretern aus Wirtschaft, Wissenschaft und Verwaltung aus Deutschland und Frankreich, gemeinsam mit weiteren, vorwiegend europäischen Partnern getragen wird. Gemeinsame Anforderungen an eine solche Dateninfrastruktur sollen entwickelt werden. Vor diesem Hintergrund sind Offenheit, Transparenz und europäische Anschlussfähigkeit nach Aussage des deutschen Bundesministeriums für Wirtschaft und Klimaschutz zentral für Gaia-X. Vertreter aus mehreren europäischen Ländern beteiligen sich aktiv am Projektgeschehen. Das digitale Ökosystem soll dafür sorgen, dass Unternehmen und Geschäftsmodelle aus Europa heraus wettbewerbsfähig sein können. Durch Gaia-X sollen verschiedene Elemente über offene Schnittstellen und bestehende Standards miteinander vernetzt werden, um Daten zu verknüpfen und eine Innovationsplattform zu schaffen.
- Die GO FAIR Initiative ist eine bottom-up agierende und sich selbst verwaltende Initiative, die es sich zum Ziel gesetzt hat, bei der Implementierung der FAIR-Prinzipien unterstützen. Die Initiative hat weltweit aktuell sechs Ableger, darunter auch einen deutschen: GO FAIR Germany.
- Die Initiative Hessische Forschungsdateninfrastrukturen (kurz HeFDI) ist eine gemeinsame Landesinitiative von elf staatlich finanzierten hessischen Hochschulen unter Federführung der Philipps-Universität Marburg. Ziel des Projekts ist der Aufbau einer nachhaltigen organisatorischen und technischen Infrastruktur für das Management, die Sicherung, den Zugriff und die Verfügbarkeit von Forschungsdaten in Hessen. Die Landesinitiative versteht sich als Teil der Nationalen Forschungsdateninfrastruktur (NFDI) und arbeitet darauf hin, landesweite Services für das Datenmanagement zu etablieren und Forschungseinrichtungen bestmöglich im Umgang mit digitalen Forschungsdaten zu unterstützen.
- In der Nationalen Forschungsdateninfrastruktur (kurz NFDI) werden wertvolle Datenbestände von Wissenschaft und Forschung für das gesamte deutsche Wissenschaftssystem systematisch erschlossen, vernetzt und nachhaltig sowie qualitativ nutzbar gemacht. Bislang sind sie zumeist dezentral, projektbezogen oder auf begrenzte Zeit verfügbar. Mit der NFDI soll ein dauerhafter digitaler Wissensspeicher als unverzichtbare Voraussetzung für neue Forschungsfragen, Erkenntnisse und Innovationen geschaffen werden. Relevante Daten sollen nach den FAIR-Prinzipien (Findable, Accessible, Interoperable und Reusable – also auffindbar, zugänglich, interoperabel und wiederverwendbar) zur Verfügung gestellt werden.
NFDI-Konsortien, Zusammenschlüsse verschiedener Einrichtungen innerhalb eines Forschungsfeldes, arbeiten zusammen interdisziplinär an der Zielumsetzung. Um die Aktivitäten zum Aufbau einer Nationalen Forschungsdateninfrastruktur zu koordinieren, wurde der gemeinnützige Verein „Nationale Forschungsdateninfrastruktur e.V.“ mit Sitz in Karlsruhe gegründet. Gemeinsam gestalten Verein und NFDI-Konsortien die Zukunft des Forschungsdatenmanagements in Deutschland. Darüber hinaus soll die NFDI auch an internationale Initiativen wie die European Open Science Cloud (EOSC) angebunden werden und an deren Entwicklung mitwirken.
Die JLU Gießen ist bei folgenden NFDI-Konsortien (mit)antragsstellende Institution und/oder mit einer (Co-)Sprecherin bzw. einem (Co-)Sprecher eingebunden:
1. NFDI4Biodiversity: Prof. Dr. Alexander Goesmann
2. NFDI4Microbiota: Prof. Dr. Alexander Goesmann
3. NFDI4Memory: Prof. Dr. Peter Haslinger (über Herder-Institut für historische Ostmitteleuropaforschung – Institut der Leibniz-Gemeinschaft, Marburg)
Bei folgenden NFDI-Konsortien ist die JLU Gießen außerdem als Participant beteiligt:
1. NFDI4Ing: Prof. Dr. Jürgen Janek
2. FAIRmat: Prof. Dr. Jürgen Janek
3. NFDI4Culture: Prof. Dr. Peter Haslinger (über Herder-Institut für historische Ostmitteleuropaforschung – Institut der Leibniz-Gemeinschaft, Marburg) - Der Rat für Informationsinfrastrukturen (RfII) ist ein von der Gemeinsamen Wissenschaftskonferenz (GWK) berufenes Expertengremium, das regelmäßig Berichte, Empfehlungen und Positionspapiere veröffentlicht und als Sachverständigengremium auch Politik und Wissenschaft in strategischen Zukunftsfragen der digitalen Wissenschaft berät. Empfehlenswert ist insbesondere der wöchentliche Mail-Service mit aktuellen Infos rund um das Thema „Forschungsdatenmanagement“.
- Die Research Data Alliance (kurz RDA) wurde 2013 als gemeinschaftsorientierte Initiative von der Europäischen Kommission, der National Science Foundation und dem National Institute of Standards and Technology der US-Regierung sowie dem Innovationsministerium der australischen Regierung mit dem Ziel ins Leben gerufen, eine soziale und technische Infrastruktur aufzubauen, die den offenen Austausch und die Wiederverwendung von Daten ermöglicht. Die RDA verfolgt einen basisorientierten, integrativen Ansatz, der alle Phasen des Datenlebenszyklus abdeckt, Datenproduzenten, -nutzer und -verwalter einbezieht und sich mit dem Austausch, der Verarbeitung und der Speicherung von Daten befasst. Es ist ihr gelungen, eine neutrale soziale Plattform zu schaffen, auf der sich internationale Forschungsdatenexperten treffen, um sich auszutauschen und sich über Themen wie soziale Hürden bei der gemeinsamen Nutzung von Daten, Herausforderungen im Bereich Bildung und Ausbildung, Datenmanagementpläne und Zertifizierung von Datenrepositorien, disziplinäre und interdisziplinäre Interoperabilität sowie technologische Aspekte zu verständigen. Mit RDA Deutschland gibt es auch einen deutschen Ableger der RDA.