FAIR Data und Verteilte Analyse

FAIR steht für Findable, Accessible, Interoperable und Reusable.

Forschungs- und Entwicklungsbereiche

Wir fördern die praktische Umsetzung der FAIR-Prinzipien (Findable, Accessible, Interoperable, Reusable) durch umfassende Dateninfrastrukturen und Wissensmanagement-Systeme. Unsere Arbeit umfasst FAIR Digital Objects (FDOs), die Entwicklung von Forschungsdateninfrastrukturen, Wissensgraphen, semantische Technologien, persistente Identifikatoren (PIDs) und Frameworks für Datensouveränität.

Wir entwickeln fortschrittliche Methoden zur Transformation unstrukturierter Daten in strukturierte, maschinenlesbare Formate unter Verwendung modernster KI-Techniken. Dies umfasst die Extraktion medizinischer Informationen aus klinischen Dokumenten, die Verarbeitung wissenschaftlicher Dokumente, multimodale Datenintegration und domänenspezifische Textverarbeitung für Gesundheitswesen, Rechtswesen und wissenschaftliche Bereiche.

Wir erstellen hochentwickelte verteilte Analyseplattformen und KI-gestützte Entscheidungsunterstützungssysteme für reale Herausforderungen. Unsere Machine Learning- und Analyselösungen umfassen Gesundheitsdiagnostik, Kulturerbe-Bewahrung, industrielle Anwendungen und Verhaltensanalyse, mit Fokus auf datenschutzwahrende und föderierte Ansätze.

Technische Expertise & Anwendungen

Unsere Forschung und Entwicklung nutzt modernste Technologien wie Large Language Models (Große Sprachmodelle), verteilte Analytik, föderiertes Lernen, Wissensgraph-Konstruktion und Reinforcement Learning. Wir arbeiten daran, FAIR-Datenprinzipien zu ermöglichen und etablierte Standards voranzutreiben, einschließlich Gesundheitsdatenstandards (HL7, FHIR), Semantic Web Standards und datenschutzwahrende Berechnungsframeworks.

Wir entwickeln praktische Lösungen, die die Lücke zwischen modernster KI-Forschung und realen Anwendungen überbrücken. Wir konzentrieren uns auf die Verbesserung der Datenzugänglichkeit, die Verbesserung der Gesundheitsergebnisse, die Bewahrung des Kulturerbes, die Förderung der wissenschaftlichen Forschung und die Ermöglichung datengetriebener Innovation durch sichere, konforme Datenaustauschplattformen.

Wir arbeiten eng mit Gesundheitseinrichtungen, Kulturerbe-Organisationen, Forschungseinrichtungen, Industriepartnern und Regierungsbehörden zusammen. Unser interdisziplinärer Ansatz gewährleistet, dass unsere technischen Lösungen reale Bedürfnisse adressieren und gleichzeitig höchste Standards in Ethik, Datenschutz und Sicherheit einhalten.

Unser Service-Angebot

FAIR Digital Objects Manager (FDO Manager)

Der FDO Manager im Rahmen von NFDI4DS stellt eine der ersten praktischen Implementierungen des FDO dar, die den FDO-Spezifikationen entspricht und gleichzeitig eine robuste, minimal funktionsfähige Lösung bietet. Der Manager stellt sicher, dass jedem Artefakt die erforderlichen Metadaten sowie ein persistenter Identifikator zugeordnet werden. Um die FDO-Spezifikationen vollständig zu erfüllen, sorgt der Manager dafür, dass die Metadaten vorübergehend in einem speziellen, von Fraunhofer FIT verwalteten Register gespeichert werden, das getrennt von den digitalen Objekten ist. Darüber hinaus übernimmt der FDO Manager die Erfassung und Speicherung der FDO-Einträge in einem separaten Register, was eine zentrale Anforderung der FDO-Spezifikationen darstellt. Mehr

PADME

Personal Health Train (PHT) ist ein neuartiger Ansatz, der darauf abzielt, eine verteilte Datenanalyse-Infrastruktur zu schaffen, die die (Wieder-)Verwendung von verteilten Gesundheitsdaten ermöglicht. Gleichzeitig behalten die Datenbesitzer die Kontrolle über ihre Daten. Das Hauptprinzip des PHT besteht darin, dass die Daten an ihrem ursprünglichen Ort verbleiben und die Analyseaufgaben die Datenquellen besuchen und die Aufgaben ausführen. Der PHT bietet einen verteilten, flexiblen Ansatz für die Nutzung von Daten in einem Netzwerk von Teilnehmern, der die FAIR-Grundsätze berücksichtigt. PADME ist eine PHT-Implementierung, die von Fraunhofer in Zusammenarbeit mit der RWTH Köln, der Uniklinik Köln und der Universität Leipzig entwickelt wurde. Die Verteilte Analyse (VA) wurde eingeführt, um die Herausforderungen des Zugriffs auf und der Durchführung von Datenanalysen mit datenschutzrelevanten Daten zu bewältigen. Das Hauptprinzip von VA besteht darin, dass die Analyseaufgabe zu den Daten gebracht wird, anstatt die Daten an einen zentralen Ort zu bringen, um die Datenanalysealgorithmen auszuführen.

Unsere Studie ist Teil der deutschen Initiativen MII und GoFAIR.

Publikationen

Jahr
Year
Titel/Autor:in
Title/Author
Publikationstyp
Publication Type
2025 R4-SLAM: Toward Real-time, Robust, and Resource-Restricted Visual SLAM in Dynamic Environments
Zhang, Zhijie; Yang, Cong; Qin, Xue; Sui, Wei; Boukhers, Zeyd; Kong, Hui; Liu, Jie; Li, Zhijun
Zeitschriftenaufsatz
Journal Article
2025 Q-Chain: A Causal-Aware Framework for Structural and Educational Question Generation
Xu, Junqi; Wang, Lvcheng; Boukhers, Zeyd; Indurkhya, Bipin; Yang, Cong
Konferenzbeitrag
Conference Paper
2025 ELMTEX: Fine-Tuning LLMs for Structured Clinical Information Extraction. A Case Study on Clinical Reports
Guluzade, Aynur; Heiba, Naguib; Boukhers, Zeyd; Hamiti, Florim; Polash, Jahid Hasan; Mohamad, Yehya; Velasco Nunez, Carlos
Konferenzbeitrag
Conference Paper
2025 Moiré Pattern Detection: Stability and Efficiency with Evaluated Loss Function
Li, Zhuocheng; Shen, Xizhu; Luan, Simin; Guo, Shuwei; Boukhers, Zeyd; Sui, Wei; Wang, Yuyi; Yang, Cong
Konferenzbeitrag
Conference Paper
2025 From Theory to Practice: Demonstrators of FAIR Data Spaces Across Different Sectors
Glombiewski, Nikolaus; Boukhers, Zeyd; Beilschmidt, Christian; Drönner, Johannes; Mattig, Michael; Piet, Artur; Pietrzynski, Robert; Jaberansary, Mehrshad; Maia, Macedo; Beyvers, Sebastian; Ucer Yediel, Yeliz; Akhtar, Muhammad Hamza; Oberkampf, Heiner; Hartman, Jonathan; Seeger, Bernhard; Lange-Bever, Christoph
Konferenzbeitrag
Conference Paper
2025 BladeView: Toward Automatic Wind Turbine Inspection With Unmanned Aerial Vehicle
Yang, Cong; Zhou, Hua; Liu, Xun; Ke, Yan; Gao, Bo; Grzegorzek, Marcin; Boukhers, Zeyd; Chen, Tao; See, John
Zeitschriftenaufsatz
Journal Article
2024 Transition in Focus of Prediction Tasks for Skeleton Graph Component Detection with Transformer
Wang, Zhiyuan; Yang, Cong; Zhang, Yulu; Boukhers, Zeyd; Sui, Wei; Ji, Yi; Liu, Chunping
Konferenzbeitrag
Conference Paper
2024 A non-enhanced CT-based deep learning diagnostic system for COVID-19 infection at high risk among lung cancer patients
Du, Tianming; Sun, Yihao; Wang, Xinghao; Jiang, Tao; Xu, Ning; Boukhers, Zeyd; Grzegorzek, Marcin; Sun, Hongzan; Li, Chen
Zeitschriftenaufsatz
Journal Article
2024 Falcon 7b for Software Mention Detection in Scholarly Documents
Khan, Ameerali; Ramadan, Qusai; Yang, Cong; Boukhers, Zeyd
Konferenzbeitrag
Conference Paper
2024 Understanding Open Source Large Language Models: An Exploratory Study
Sowe, Sulayman K.; Mou, Yongli; Cheng, Du; Kong, Lingxiao; Neumann, Alexander Tobias; Decker, Stefan
Konferenzbeitrag
Conference Paper
2024 Skeleton Ground Truth Extraction: Methodology, Annotation Tool and Benchmarks
Yang, Cong; Indurkhya, Bipin; See, John; Gao, Bo; Ke, Yan; Boukhers, Zeyd; Yang, Zhenyu; Grzegorzek, Marcin
Zeitschriftenaufsatz
Journal Article
2024 Deep author name disambiguation using DBLP data
Boukhers, Zeyd; Asundi, Nagaraj Bahubali
Zeitschriftenaufsatz
Journal Article
2024 YawnNet: A Visual-Centric Approach for Yawning Detection
Sun, Ruoxi; Yang, Xinyu; Qian, Cong; Zhu, Chenyu; Sui, Wei; Boukhers, Zeyd; Yang, Cong
Konferenzbeitrag
Conference Paper
2023 Enhancing Reproducibility in Research Through FAIR Digital Objects
Boukhers, Zeyd; Castro, Leyla Jael
Konferenzbeitrag
Conference Paper
2023 NFDI4DS Infrastructure and Services
Schimmler, Sonja; Wentzel, Bianca; Bleier, Arnim; Dietze, Stefan; Karmakar, Saurav; Mutschke, Peter; Kraft, Angelie; Taffa, Tilahun A.; Usbeck, Ricardo; Boukhers, Zeyd; Auer, Sören; Castro, Leyla Jael; Ackermann, Marcel R.; Neumuth, Thomas; Schneider, Daniel; Abedjan, Ziawasch; Latif, Atif; Limani, Fidan; Ahmad, Raia Abu; Rehm, Georg; Khorasani, Sima Attar; Lieber, Matthias
Konferenzbeitrag
Conference Paper
2023 Research Knowledge Graphs in NFDI4DS
Karmakar, Saurav; Zloch, Matthäus; Limani, Fidan; Zapilko, Benjamin; Upadhyaya, Sharmila; D’Souza, Jennifer; Castro, Leyla Jael; Rehm, Georg; Ackermann, Marcel R.; Sack, Harald; Boukhers, Zeyd; Schimmler, Sonja
Konferenzbeitrag
Conference Paper
2023 Pedestrian Collision Prediction Using a Monocular Camera
Chen, Shiyuan; Qin, Xue; Boukhers, Zeyd; See, John; Sui, Wei; Yang, Cong
Konferenzbeitrag
Conference Paper
2023 Data Trading and Monetization: Challenges and Open Research Directions
Ramadan, Qusai; Boukhers, Zeyd; Alshaikh, Muath; Lange-Bever, Christoph; Jürjens, Jan
Konferenzbeitrag
Conference Paper
2023 Enhancing Data Space Semantic Interoperability through Machine Learning: a Visionary Perspective
Boukhers, Zeyd; Lange-Bever, Christoph; Beyan, Oya Deniz
Konferenzbeitrag
Conference Paper
2023 Beyond Trading Data: The Hidden Influence of Public Awareness and Interest on Cryptocurrency Volatility
Boukhers, Zeyd; Bouabdallah, Azeddine; Yang, Cong; Jürjens, Jan
Konferenzbeitrag
Conference Paper
2023 Knowledge guided multi-filter residual convolutional neural network for ICD coding from clinical text
Boukhers, Zeyd; Goswami, Prantik; Jürjens, Jan
Zeitschriftenaufsatz
Journal Article
2023 PADME-SoSci: A Platform for Analytics and Distributed Machine Learning for the Social Sciences
Boukhers, Zeyd; Bleier, Arnim; Ucer Yediel, Yeliz; Hienstorfer-Heitmann, Mio; Jaberansary, Mehrshad; Welten, Sascha; Koumpis, Adamantios; Beyan, Oya Deniz
Konferenzbeitrag
Conference Paper
2023 Explainable AI for Bioinformatics: Methods, Tools and Applications
Karim, Md. Rezaul; Islam, Tanhim; Shajalal, Md; Beyan, Oya; Lange, Christoph; Cochez, Michael; Rebholz-Schuhmann, Dietrich; Decker, Stefan
Zeitschriftenaufsatz
Journal Article
2022 Whois? Deep Author Name Disambiguation Using Bibliographic Data
Boukhers, Zeyd; Asundi, Nagaraj Bahubali
Konferenzbeitrag
Conference Paper
2021 Dams: A distributed analytics metadata schema
Welten, S.; Neumann, L.; Yediel, Y.U.; Bonino da Silva Santos, L.O.; Decker, S.; Beyan, O.
Zeitschriftenaufsatz
Journal Article
2021 DeepKneeExplainer: Explainable knee osteoarthritis diagnosis from radiographs and magnetic resonance imaging
Karim, Rezaul; Jiao, Jiao; Döhmen, Till; Cochez, Michael; Beyan, Oya; Rebholz-Schuhmann, Dietrich; Decker, Stefan
Zeitschriftenaufsatz
Journal Article
2021 Distributed Skin Lesion Analysis Across Decentralised Data Sources
Mou, Y.; Welten, S.; Jaberansary, M.; Ucer Yediel, Y.; Kirsten, T.; Decker, S.; Beyan, O.
Konferenzbeitrag
Conference Paper
2021 A Minimal Information Model for Potential Drug-Drug Interactions
Hochheiser, H.; Jing, X.; Garcia, E.A.; Ayvaz, S.; Sahay, R.; Dumontier, M.; Banda, J.M.; Beyan, O.; Brochhausen, M.; Draper, E.; Habiel, S.; Hassanzadeh, O.; Herrero-Zazo, M.; Hocum, B.; Horn, J.; LeBaron, B.; Malone, D.C.; Nytro, O.; Reese, T.; Romagnoli, K.; Schneider, J.; Zhang, L.; Boyce, R.D.
Zeitschriftenaufsatz
Journal Article
2021 Deep learning-based clustering approaches for bioinformatics
Karim, M.R.; Beyan, O.; Zappa, A.; Costa, I.G.; Rebholz-Schuhmann, D.; Cochez, M.; Decker, S.
Zeitschriftenaufsatz
Journal Article
2020 Implementation of eHealth and AI integrated diagnostics with multidisciplinary digitized data: Are we ready from an international perspective?
Bukowski, M.; Farkas, R.; Beyan, O.; Moll, L.; Hahn, H.; Kiessling, F.; Schmitz-Rode, T.
Zeitschriftenaufsatz
Journal Article
2020 Enabling ad-hoc reuse of private data repositories through schema extraction
Gleim, L.C.; Karim, M.R.; Zimmermann, L.; Kohlbacher, O.; Stenzhorn, H.; Decker, S.; Beyan, O.
Zeitschriftenaufsatz
Journal Article
2020 DeepCOVIDExplainer: Explainable COVID-19 Diagnosis from Chest X-ray Images
Karim, M.R.; Döhmen, T.; Cochez, M.; Beyan, O.; Rebholz-Schuhmann, D.; Decker, S.
Konferenzbeitrag
Conference Paper
2020 A snapshot neural ensemble method for cancer-type prediction based on copy number variations
Karim, M.R.; Rahman, A.; Jares, J.B.; Decker, S.; Beyan, O.
Zeitschriftenaufsatz
Journal Article
2019 Drug-drug interaction prediction based on knowledge graph embeddings and convolutional-LSTM network
Rezaul Karim, M.; Cochez, M.; Jares, J.B.; Uddin, M.; Beyan, O.; Decker, S.
Konferenzbeitrag
Conference Paper
2019 Implementation of clinical decision support services to detect potential drug-drug interaction using clinical quality language
Nguyen, B.-P.; Reese, T.; Decker, S.; Malone, D.; Boyce, R.D.; Beyan, O.
Konferenzbeitrag
Conference Paper
2019 Design of metadata services for clinical data interoperability in Germany
Löbe, M.; Beyan, O.; Stäubert, S.; Meineke, F.; Ammon, D.; Winter, A.; Decker, S.; Löffler, M.; Kirsten, T.
Konferenzbeitrag
Conference Paper
2019 Prognostically Relevant Subtypes and Survival Prediction for Breast Cancer Based on Multimodal Genomics Data
Karim, M.R.; Wicaksono, G.; Costa, I.G.; Decker, S.; Beyan, O.
Zeitschriftenaufsatz
Journal Article
2019 OncoNetExplainer: Explainable predictions of cancer types based on gene expression data
Karim, M.R.; Cochez, M.; Beyan, O.; Decker, S.; Lange, Christoph
Konferenzbeitrag
Conference Paper
2018 Representing medication guidelines for use in production rule systems in the context of POLYCARE project
Könning, Jonas W.; Velasco, Carlos A.; Mohamad, Yehya; Decker, Stefan; Beyan, Oya
Konferenzbeitrag
Conference Paper
2018 Preface of SeWeBMeDA 2018: Semantic web solutions for large-scale biomedical data analytics
Hasnain, A.; Beyan, O.; Decker, S.; Rebholz-Schuhmann, D.
Konferenzbeitrag
Conference Paper
2018 Schema extraction for privacy preserving processing of sensitive data
Gleim, L.C.; Rezaul Karim, M.; Zimmermann, L.; Kohlbacher, O.; Stenzhorn, H.; Decker, S.; Beyan, O.
Konferenzbeitrag
Conference Paper
2018 Research Data in the Fraunhofer Digital Project. Creating a FAIR Research Data Infrastructure and Culture
Beyan, O.; Wuchner, Andrea; Eisengräber-Pabst, Dirk; Quix, C.; Zaschke, Christian; Schumacher, Oliver
Konferenzbeitrag
Conference Paper
2018 A distributed analytics platform to execute FHIR-based phenotyping algorithms
Karim, M.R.; Nguyen, B.-P.; Zimmermann, L.; Kirsten, T.; Löbe, M.; Meineke, F.; Stenzhorn, H.; Kohlbacher, O.; Decker, S.; Beyan, O.
Konferenzbeitrag
Conference Paper
2017 Towards a FAIR sharing of scientific experiments: Improving discoverability and reusability of dielectric measurements of biological tissues
Rezaul Karim, M.; Heinrichs, Matthias; Gleim, Lars C.; Cochez, Michael; Porter, Emily; Gioia, Alessandra la; Salahuddin, Saqib; O'Halloran, Martin; Decker, Stefan; Beyan, Oya
Konferenzbeitrag
Conference Paper
2017 Minimum information for dielectric measurements of biological tissues (MINDER)
Porter, E.; Gioia, A. La; Salahuddin, S.; Decker, S.; Shahzad, A.; Adnan Elahi, M.; O'Halloran, M.; Beyan, O.
Zeitschriftenaufsatz
Journal Article
2016 An RDF based semantic approach to model temporal relations in health records
Beyan, O.; Decker, S.
Konferenzbeitrag
Conference Paper
Diese Liste ist ein Auszug aus der Publikationsplattform Fraunhofer-Publica

This list has been generated from the publication platform Fraunhofer-Publica