You are currently viewing Forschung. Daten. FAIR.

Forschung. Daten. FAIR.

Rückblick auf zwei Jahre NFDI4Health – Services und Anwendungen – wichtige Beiträge von ZB MED

von Juliane Fluck

Im Jahr 2020 fiel der Startschuss für das Konsortium NFDI4Health – die Nationale Forschungsdateninfrastruktur für personenbezogene Gesundheitsdaten – und das DFG-geförderte Projekt NFDI4Health Taskforce COVID-19. Beide arbeiten eng zusammen. Zwei Jahre später sind wichtige Ziele erreicht und konkrete Maßnahmen umgesetzt:

German Central Health Study Hub COVID-19

Der German Central Health Study Hub COVID 19 bietet Forschenden eine Plattform für die Publikation und die zentrale Suche nach klinischen, epidemiologischen und Public-Health-Studien – standardmäßig in Englisch, um diese international auffindbar zu machen. Zusätzlich zu den Metadaten, die die Studien beschreiben, können auch Dokumente wie Studienprotokolle oder Vorlagen für Frage- oder Erhebungsbögen publiziert werden. Diese Ressourcen unterliegen nicht dem Datenschutz – Studienautor:innen können sie daher im Study Hub publizieren. Patientenbezogene Gesundheitsdaten werden dagegen in dem zentralen Suchportal nicht veröffentlicht. Sofern die Nachnutzung von Daten möglich ist, leitet das Portal zu den entsprechenden Kontaktstellen weiter. Als nächster Schritt ist zum einen die Integration eines Portals zur zentralen Beantragung des Datenzugangs, zum anderen eine Plattform zur Nachnutzung der Daten unter Wahrung des Datenschutzes geplant.

Der German Central Health Study Hub COVID-19 wird iterativ zusammen mit Projektpartnern aus Heidelberg, Greifswald, Leipzig und Göttingen entwickelt. Dadurch stehen bereits in einem frühen Stadium funktionale Produktprototypen zur Evaluierung zur Verfügung, die wir durch das Feedback der Nutzenden kontinuierlich verbessern können.

Publikationsleitlinien

Um Daten auffindbar, referenzierbar und nachnutzbar zu machen, muss es einheitliche Vorgaben für die Beschreibung der Daten geben. Eine wichtige Voraussetzung für die Auffindbarkeit von Studiendaten ist daher die Entwicklung von Publikationsleitlinien. Kernelemente der Leitlinien sind einerseits das Metadatenschema, das für jede Studie und jedes Studiendokument ausgefüllt werden muss, andererseits Regelungen zur DOI- und Lizenzvergabe. Die Leitlinien beschreiben die digitalen Objekte, die veröffentlicht werden können sowie die notwendigen Schritte zur Publikation. Den Studienautor:innen – Forschende in den Lebenswissenschaften – wird damit ein Standard für die Publikation von Studiendokumenten an die Hand gegeben, der einen echten Mehrwert darstellt. Das Metadatenschema, das mit vielen NFDI4Health-Partnern entwickelt wird und ein integraler Teil der Publikationsleitlinie ist, wird momentan von verschieden externen Partnern getestet. Z.B. wurden von NFDI4Health Projekte mit den deutschen Gesundheitszentren initiiert, die aktuell die Publikationsleitlinien und das Metaschema testen. Ziel ist es, ein konsentiertes Schema wie auch entsprechende Nutzer- und Programmierschnittstellen für Studiendaten national und international zu etablieren. Dazu tauscht sich Juliane Fluck als Leiterin von NFDI4Health, aber auch viele NFDI4Health Partner:innen aktiv mit Vertretern anderer Gesundheitsinfrastrukturen aus.

Data Steward für den Use Case Ernährungsepidemiologie

Exemplarische Use Cases dienen der Implementierung von Prototypen in konkreten Anwendungsfällen. In NFDI4Health kommt einer der Use Cases aus der Ernährungsepidemiologie. ZB MED hat mit den verantwortlichen Kolleg:innen einen Fahrplan zum Datenmanagement bei der Durchführung von ernährungsepidemiologischen Studien erstellt. Auf dieser Basis wurde ein erstes Trainingskonzept erarbeitet, das die Forschenden befähigt, die Angebote von NFDI4Health effektiv zu nutzen. Enger Kooperationspartner ist hier das Institut für Ernährungsepidemiologie an der Universität Bonn unter der Leitung von Prof. Nöthlings.

Gemeinsam haben die Kooperationspartner außerdem eine Lehrveranstaltung zum Forschungsdatenmanagement in Humanstudien durchgeführt. Die beteiligten Studierenden konnten in Projekten analysieren, inwieweit ernährungsepidemiologische Studien auffindbar sind, ob genügend Information über diese Studien zu finden ist, um diese zu beschreiben und ob das von NFDI4Health publizierte Metadatenschema dazu genutzt werden kann. Weiterhin testeten die Studierenden, ob existierende Vokabularien als Standard für die harmonisierte Benennung von Lebensmittelklassen in Ernährungsstudien geeignet sind. Mithilfe solcher Lehrveranstaltungen wird den Studierenden die Relevanz des Forschungsdatenmanagements und die Bedeutung FAIRer Daten im konkreten Kontext ihres Studienfaches vermittelt.

Unterstützung in der (Meta-)Daten-Annotation

NFDI4Health unterstützt die Forschenden in der Erzeugung und Nutzung harmonisierter (Meta-) Daten mit einem ersten internen Release für eine domänenübergreifende und erweiterbare semantische Annotation Workbench. Für die Entwicklung wurden zunächst gemeinsam mit den NFDI4Health-Partner:innen grundlegende Anforderungen ermittelt. Diese wurden als Open-Source-Webanwendung im engen Austausch mit NFDI4Health-Partner:innen und kurzen Prototyp-Release Zyklen umgesetzt (Stichwort User Driven Development). Außerdem ist der Terminologiedienst SemLookP, die semantische Lookup Plattform von ZB MED in die Annotation Workbench integriert. In der aktuellen öffentlich zugänglichen Version enthält SemLookP die Terminologien, die für medizinische und  epidemiologische Fragestellungen relevant sind wie z.B. SNOMED CT-Terminologie (https://www.snomed.org/snomed-ct/why-snomed-ct), ICD für die semantische Annotation von medizinischen Begriffen oder FoodEx und FOODON für die semantische Annotation von Konzepten aus Ernährungsstudien.

preVIEW: COVID-19

Zu Beginn der Pandemie entwickelte das ZB MED-Team der Task Force COVID-19 zusammen mit Nutzenden sehr schnell die semantische Suchmaschine preVIEW: COVID-19. Durch moderne Text Mining Verfahren und diverse Filtermöglichkeiten, erleichtert sie das Auffinden von relevanten Preprints zu SARS-CoV2 und COVID-19. Mit verschiedenen Kooperationspartnern entwickeln wir den Service kontinuierlich weiter.

So sind durch die Entwicklung von preVIEW einige gemeinsame Projekte bzw. Projektideen entstanden. Konkret geht es zum Beispiel in Zusammenarbeit mit dem RKI und dem Fachinformationsdienst (FID) Pharmazie um die Entwicklung eines Klassifikators zur Erkennung von Long Covid-bezogenen Publikationen. Durch die Bereitstellung von annotierten Trainingskorpora durch das RKI konnten wir diesen Klassifikator entwickeln. Er ist inzwischen sowohl in preVIEW als auch im  Narrativen Service des FID Pharmazies im Einsatz. Den Forschenden am RKI ermöglicht er eine sehr effiziente Suche nach neuen Informationen, die Long Covid adressieren. Unser Team steht ebenfalls mit Informationsspezialist:innen der WHO in Kontakt, die Covid-19-bezogene Literatur bereitstellen. Dazu wurden die preprint Ressourcen erweitert und werden in Zukunft von der WHO direkt als Quelle benutzt. In Zusammenarbeit mit der WHO werden außerdem aktuell weitere Trainingsdaten über den in preVIEW integrierten Feedbackmodus annotiert, um den Long Covid Klassifikator weiter zu optimieren. Für die Zukunft ist die weitere Integration von preVIEW in die Suchmaschine Livivo geplant.

Publikationsliste NFDI4Health (Auswahl)

  • Langnickel, L.; Baum, R.; Darms, J.; Madan, S.; Fluck, J. COVID-19 PreVIEW: Semantic Search to Explore COVID-19 Research Preprints. Public Health and Informatics 2021, 78–82. https://doi.org/10.3233/SHTI210124.
  • Langnickel, L.; Darms, J.; Baum, R.; Fluck, J. PreVIEW: From a Fast Prototype towards a Sustainable Semantic Search System for Central Access to COVID-19 Preprints. JEAHIL 2021, Journal of EAHIL (Vol 17 No 3 (2021)), 8–14. https://doi.org/10.32384/jeahil17484.
  • Langnickel, L.; Darms, J.; Heldt, K.; Ducks, D.; Fluck, J. Continuous Development of the Semantic Search Engine PreVIEW: From COVID-19 to Long COVID. Database 2022, 2022, baac048. https://doi.org/10.1093/database/baac048
  • Johannes Darms, Jörg Henke, Xioaming Hu, Carsten Oliver Schmidt, Martin Golebiewski, Juliane Fluck, NFDI4Health Task Force COVID-19: Improving the FAIRness of Health Studies in Germany: The German Central Health Study Hub COVID-19. Studies in health technology and informatics, 2021 (Vol 287), 78-82. https://doi.org/10.3233/SHTI210818
  • weitere Publikationen zu den (Forschungs-) Ergebnisse finden Sie auch hier.

Veranstaltungen von NFDI4Health

Sind Sie interessiert an Workshops und weiteren Veranstaltungen? Einen Überblick der NFDI4Health-Veranstaltunge finden Sie hier.

ZB MED NACHGEFRAGT: NFDI4Health – Infrastrukturen für Gesundheitsdaten | Von der Forschung zu neuen Therapien

Mehr Infos zur NFDI4Health gibt Prof. Dr. Juliane Fluck im ZB MED NACHGEFRAGT-Video:


DOI (Digitalausgabe): https://doi.org/10.48664/nwr8-md89

Schreibe einen Kommentar