Strutz, Marco

Arbeitstitel

Parallelisierungsstrategien für digitale medizinische Analysen

Betreuung

Prof. Dr. Achim Streit, Karlsruher Institut für Technologie; Prof. Dr. Hermann Heßling, HTW Berlin

Abstract

Zur Unterstützung von Pathologen bei Diagnosen auf Basis digitaler Patientendaten werden hochspezialisierte Analyseprogramme eingesetzt. Diese laufen, teilweise historisch bedingt, nur auf Einzelplatzcomputern.

Die steigende Anzahl von Patienten und immer höhere Auflösungen der Analysewerkzeuge haben einen starken Anstieg in den zugehörigen digitalen Daten, wie zum Beispiel bei virtuellen Schnitten von Gewebeproben, zur Folge. Bewährte Analyseprogramme solcher Daten stoßen durch die Beschränkung auf Einzelplatzsysteme oft an ihre Verarbeitungsgrenzen, da eine Skalierung für die heute benötigten Datenmengen ursprünglich kaum vorgesehen war.
Eine allgemeine Aussage darüber zu treffen, ob solche Analyseprogramme nachträglich auf etablierte Big Data Tools, wie Apache Spark, migrierbar sind, und ob die dafür benötigten Datenmengen dafür überhaupt partitioniert werden können, ist nicht trivial und ist deshalb Bestandteil der Untersuchungen. Ein weiterer Schwerpunkt ist die Entwicklung von echtzeitfähigen Lösungen, die insbesondere bei der Datenaufnahme verwendbar sind, um den ständig steigenden Datenstrom zu beherrschen. Durch eine frühzeitige und schnelle Voranalyse soll entschieden werden, ob es sinnvoll ist, Daten überhaupt mittel- oder langfristig zu speichern.

Die Erkenntnisse aus den Untersuchungen können als Vorarbeit angesehen und von interessierten Communities genutzt werden, wenn ebenfalls der Bedarf besteht, die Skalierungsgrenzen anderer Programme nachträglich zu verschieben.