2025-08-142025-08-14https://hdl.handle.net/11420/56972Process Mining auf Sensordaten bringt neue Herausforderungen, wie z.B. die geografische Verteilung von Sensorknoten und deren Ressourcenbeschränkungen. Dieses Projekt, EdgeMine, wird neue Ansätze für (1) verteiltes, ortsbezogenes Process Mining und (2) Process Mining auf ressourcenbeschränkten IoT-Geräten entwickeln. In einer verteilten Mining-Umgebung dieses Projektes wird jeder Sensorknoten lokal ein partielles Mining-Ergebnis, sogenannte Prozessfragmente, berechnen. Jedes Fragment stellt einen partiellen Datenflussgraphen des Prozesses dar, den der Sensor dann an benachbarte Sensoren oder Edge-Geräte weiterleitet, wo er schrittweise mit Prozessfragmenten anderer Sensoren zusammengeführt wird. Mit jedem Schritt in dieser Analysekette werden weitere Fragmente auf verteilte Weise hinzugefügt und der partielle Prozessgraph wächst Schritt für Schritt zu einem vollständigen Prozessmodell. Insgesamt wird das Ergebnis ein verteilter Datenflussgraph sein, dessen Berechnung auf verteilte und heterogene IoT-Geräten abbildet wird. In diesem Projekt werden folgende Forschungsfragen betrachtet: (1) Wie können verteilte Process-Mining Algorithmen so entwickel werden, dass sich ihr Datenfluss effizient an die zugrunde liegende Topologie eines physisch verteilten Netzwerks aus z. B. Sensorknoten anpasst, ohne dass Daten an einem zentralen Ort gesammelt werden müssen? (2) Wie können ressourceneffiziente Prozessverarbeitungsalgorithmen entwickelt werden, die den begrenzten, oft heterogenen Rechenressourcen in einem Netz von IoT-Sensoren, Edge- und Cloud-Geräten gerecht werden? (3) Wie können die Verteilung und Abbildung der in diesem Projekt entwickelten Algorithmen auf dynamische IoT-Netzwerke automatisiert und diese dynamisch an veränderte Anforderungen, Ressourcen und Netzwerktopologien anpasst werden? (4) Wie können wir Benchmarks für eie systematisches, faires und reproduzierbares Evaluation von verteilten, ressourceneffizienten und adaptiven Process Mining Algorithmen entwickeln? Die Synergien von SOURCED und insbesondere die Zusammenarbeit mit Experten für Process Mining, Data Mining, Datenschutz und Software-Engineering werden neuartige Ansätze ermöglichen. So wird insbesondere das verteilte Process Mining, das in EdgeMine entwickelt werden wird, als Grundlage für skalierbares und datenschutzgerechtes Process Mining in SOURCED dienen. Weiterhin wird die in SOURCED entwickelte Erklärbarkeit des Process Mining in diesem Projekt helfen, die wichtigen Daten von den unwichtigen zu trennen und dadurch die Ressourceneffizienz zu verbessern. In ähnlicher Weise werden die Arbeiten zur Datenunsicherheit EdgeMine helfen, mit verrauschten Daten umzugehen. Das Tiny House, das im Rahmen von SOURCED eingerichtet wird, dient als Plattform für das Benchmarking verteilter Process-Mining-Algorithmen, die wir in EdgeMine entwickeln.Process mining on sensor data poses new challenges, such as the distributed and geographically spread nature of sensors nodes and their resource-constraints. This project, EdgeMine, will address these challenges and devise new approaches to (1) distributed, locality-aware process mining and (2) process mining on resource-constrained IoT devices. In the distributed mining setting of EdgeMine, each sensor node will locally compute a partial mining result, i.e., process fragments. Each fragment represents a partial data-flow graph of the process, which the sensor then forwards to neighboring sensors or edge devices, where it will be merged with process fragments of other sensors in a stepwise manner. With each step in this analysis chain, more fragments will be added in a distributed manner and the partial process graph will grow step by step to become a complete process model. Overall, the result will be a distributed data-flow graph, and we will map its computation onto physically distributed and heterogeneous IoT devices. Our results will push processing and analytics of data as close to the data sources as possible by distributing it over geographically scattered sensors, edge and cloud. In this project, we will focus on the following research questions: (1) How can we devise locality-aware, distributed process-mining algorithms so that their data-flow aligns efficiently with the underlying topology of a physically distributed network of, for example, sensor nodes and without the need to collect data at a central location? (2) How can we devise resource-efficient process-mining algorithms that match the limited, often heterogeneous computing-resources in a network of IoT sensors, edge and cloud devices? (3) How can we automate the distribution and mapping of the algorithms devised in this project onto dynamic IoT networks and to dynamically adapt these to changing requirements, resources, and network topologies? (4) How can we devise benchmarks for systematic, fair and reproducible benchmarking of distributed, resource-efficient and adaptive process-mining algorithms, i.e., our research results? The synergies of SOURCED, and especially the collaborations with experts in process mining, data mining, privacy, and software engineering will enable novel approaches. For example, distributed process mining, devised in EdgeMine, will serve as an enabler for scalable and privacy-aware process mining in SOURCED. Moreover, the explainability of process mining devised in SOURCED will guide us in this project to separate the important data from the unimportant data and thereby improve the resource-efficiency. Similarly, the works on uncertainty of data, will help EdgeMine to deal with noisy data. The Tiny House, which will be set up as part of SOURCED, will serve as a platform for benchmarking distributed process mining algorithms we devise in EdgeMine.FOR 5495 -Verteiltes Process Mining auf ressourcenbeschränkten Edge-Geräten & SensorknotenFOR 5495 -Distributed Process Mining on Resource-Constrained Edge Devices & Sensor Nodes