Gehirn verdrahtet und verkabelt
©Serr­No­vik
Sandpit
Uni­ver­si­täts­me­di­zin Frank­furtLe­bens­wis­sen­schaf­ten

Lebenswichtige Daten

Wie künst­li­che er­zeug­te Daten dazu bei­tra­gen, seltene Er­kran­kun­gen besser zu er­for­schen und zu be­han­deln

Seltene Er­kran­kun­gen be­tref­fen Mil­lio­nen von Men­schen in Deutsch­land. Oft stehen nicht aus­rei­chend Daten zur Ver­fü­gung, um sie früh­zei­tig zu er­ken­nen, zu er­for­schen und zu be­han­deln. Expert:innen aus In­for­ma­tik und Medizin haben bei einem Sandpit der Wübben Stif­tung Wis­sen­schaft die Basis für den Aufbau einer offenen Da­ten­bank gelegt.

Die erb­li­che Herz­mus­kel­er­kran­kung ARVC ist eine der rund 7000 sel­te­nen Er­kran­kun­gen, die nur einen unter vielen Tausend Men­schen be­tref­fen. Bei der „arrhyth­mo­ge­nen rechts­ven­tri­ku­lä­ren Kar­dio­myo­pa­thie“ wächst in der rechten Herz­kam­mer Fett- und Bin­de­ge­we­be, wo ei­gent­lich Mus­kel­zel­len hin­ge­hö­ren. Die Folge: Herz­rhyth­mus­stö­run­gen. Das Risiko: plötz­li­cher Herztod.

„Patient:innen mit sel­te­nen Er­kran­kun­gen wie ARVC be­kom­men oft über viele Jahre keine kor­rek­te Dia­gno­se, meist dauert es fünf bis sieben Jahre, bis die Krank­heit erkannt wird“, sagt Jannik Schaaf von der Goethe Uni­ver­si­tät Frank­furt/Uni­ver­si­täts­me­di­zin. Der Me­di­zin­in­for­ma­ti­ker hat es sich zur Aufgabe gemacht, die Da­ten­la­ge zu ver­bes­sern, damit die schwer zu er­ken­nen­den Krank­hei­ten schnel­ler dia­gnos­ti­ziert und er­forscht werden können. Denn für nur etwa fünf bis zehn Prozent dieser Er­kran­kun­gen gibt es bisher eine The­ra­pie. „Meis­tens be­kom­men die Be­trof­fe­nen nur eine sym­pto­ma­ti­sche The­ra­pie, die die Le­bens­qua­li­tät ver­bes­sern soll.“

Die Fall­zah­len rücken in die Nähe von Volks­er­kran­kun­gen und sind eine große Be­las­tung für das Ge­sund­heits­sys­tem. Wir müssen die For­schung un­be­dingt vor­an­trei­ben und eine wich­ti­ge Basis dafür sind Daten.

Jannik Schaaf

Die meisten sel­te­nen Er­kran­kun­gen sind ge­ne­tisch bedingt und treten im Kin­des­al­ter auf, etwa 20 Prozent später im Leben, zum Bei­spiel durch Vi­ren­in­fek­tio­nen. Sum­miert man die Patient:in­nen­zah­len auf, sind sie zu­sam­men­ge­nom­men kei­nes­wegs selten: Allein in Deutsch­land gibt es rund vier Mil­lio­nen Be­trof­fe­ne. „Damit rücken die Fall­zah­len in die Nähe von Volks­er­kran­kun­gen und sind eine große Be­las­tung für das Ge­sund­heits­sys­tem“, sagt Schaaf. „Wir müssen die For­schung un­be­dingt vor­an­trei­ben und eine wich­ti­ge Basis dafür sind Daten.“

Im Juni 2025 kamen 13 Expert:innen aus Medizin, In­for­ma­tik, Wirt­schaft und Pa­ti­en­ten­ver­tre­ter:innen bei einem Sandpit der Wübben Stif­tung Wis­sen­schaft zu­sam­men, um die di­gi­ta­le Platt­form SHARE zu ent­wi­ckeln, die For­schen­den welt­weit Daten zu sel­te­nen Er­kran­kun­gen zur Ver­fü­gung stellen soll. SHARE, dessen Name für „Syn­the­tic Health dAta RE­po­sito­ry“ steht, setzt auf syn­the­ti­sche Daten statt auf reale Patient:in­nen­da­ten.

Syn­the­ti­sche Daten können recht­li­che Fall­stri­cke umgehen

Syn­the­ti­sche Daten werden mit Hilfe von KI auf Basis realer Daten ge­ne­riert. Me­di­zi­ni­sches Per­so­nal prüft und op­ti­miert das Er­geb­nis. So ent­ste­hen künst­li­che Da­ten­sät­ze, die echten Patient:in­nen­da­ten sta­tis­tisch sehr ähnlich sind – etwa in Bezug auf Sym­pto­me, La­bor­wer­te oder fa­mi­liä­re Vor­ge­schich­te –, aber keine di­rek­ten Rück­schlüs­se auf die be­trof­fe­nen Per­so­nen er­lau­ben. For­schen­de können diese Daten nutzen, um zum Bei­spiel KI-Modelle für die Dia­gno­se sel­te­ner Er­kran­kun­gen oder die The­ra­pie­ent­wick­lung zu ent­wi­ckeln. „Man kann mit syn­the­ti­schen Daten künst­li­che Patient:innen mit un­ter­schied­li­chen Ei­gen­schaf­ten er­zeu­gen und prüfen, wie sie auf ein Me­di­ka­ment re­agie­ren“, sagt Schaaf.

Syn­the­ti­sche Daten sind ‚Enabler‘ von For­schung und Ent­wick­lung und können das Ver­ständ­nis sowie die Dia­gnos­tik und The­ra­pie von sel­te­nen Er­kran­kun­gen grund­le­gend be­schleu­ni­gen.

Benedikt Langenberger

Bisher sind Daten zu sel­te­nen Er­kran­kun­gen für For­schen­de oft nur um­ständ­lich be­schaff­bar. Zwar gibt es mitt­ler­wei­le an allen Uni­ver­si­täts­kli­ni­ken  Da­ten­in­te­gra­ti­ons­zen­tren, doch die Be­reit­stel­lung dauert auf­grund da­ten­schutz­recht­li­cher Re­ge­lun­gen lange und oft fehlt eine Stan­dar­di­sie­rung. Die künst­li­chen Daten, auf denen SHARE basiert, werden hin­ge­gen offen zu­gäng­lich, an­ony­mi­siert und so ver­ein­heit­licht sein, dass sie einfach genutzt werden können.

Gerade für seltene Er­kran­kun­gen mit ge­rin­ger Fall­zahl sind syn­the­ti­sche Daten wichtig, um Ko­hor­ten mit sta­tis­ti­scher Re­le­vanz zu er­zeu­gen. Patient:in­nen­da­ten aus ver­schie­de­nen Kran­ken­häu­ser und un­ter­schied­li­chen EU-Ländern können in ihnen zu­sam­men­flie­ßen, ohne dass diese für jeden An­wen­dungs­fall lang­wie­rig be­an­tragt und auf­be­rei­tet werden müssen. „Syn­the­ti­sche Daten sind ‚Enabler‘ von For­schung und Ent­wick­lung und können das Ver­ständ­nis sowie die Dia­gnos­tik und The­ra­pie von sel­te­nen Er­kran­kun­gen grund­le­gend be­schleu­ni­gen“, sagt Be­ne­dikt Lan­gen­ber­ger vom Digital Health Cluster des Hasso-Platt­ner-In­sti­tuts in Potsdam, der an der Ent­wick­lung von SHARE be­tei­ligt ist. 

Drei Tage von Ideen zu kon­kre­ten Lö­sun­gen

Das in­ter­dis­zi­pli­när aus­ge­leg­te Sandpit-Format der Wübben Stif­tung bot die Mög­lich­keit, SHARE von vielen Seiten zu durch­den­ken und zu kon­zi­pie­ren. „Wo hat man schon mal die Ge­le­gen­heit, sich drei Tage lang in un­ge­stör­ter Um­ge­bung und mit ganz un­ter­schied­li­chen Fach­leu­ten aus ver­schie­de­nen Ländern einem Thema zu widmen?“, fragt Jannik Schaaf.

Tag eins star­te­te mit zwei Im­puls­vor­trä­gen zum Thema. Der Ge­sund­heits­öko­nom und Me­di­zin­in­for­ma­ti­ker Andreas Gold­schmidt brachte die An­we­sen­den auf den ak­tu­el­len Wis­sens­stand. Ruth Biller vom ARVC-Selbst­hil­fe-Verein, deren Tochter mit 14 Jahren plötz­lich an der Herz­mus­kel­er­kran­kung ge­stor­ben ist, er­gänz­te die Per­spek­ti­ve der Be­trof­fe­nen. „Ich setze mich dafür ein, dass anderen Fa­mi­li­en unser Schick­sal erspart bleibt“, sagt Biller. „Gute Daten sind un­glaub­lich wichtig, weil ohne sie und ohne Pa­ti­en­ten­re­gis­ter im Bereich sel­te­ner Er­kran­kun­gen keine evi­denz­ba­sier­te Medizin möglich ist.“

In einem in­ten­si­ven Brain­stor­ming sam­mel­ten die Teil­neh­men­den an­schlie­ßend die größten Her­aus­for­de­run­gen, die auf dem Weg zu einer funk­tio­nie­ren­den SHARE-Platt­form be­wäl­tigt werden müssen. In einem „World-Café“ prio­ri­sier­ten sie diese in kleinen Tisch­grup­pen. Am Ende blieben vier zen­tra­le Her­aus­for­de­run­gen: Die ein­deu­ti­ge Fest­le­gung der Ziele von SHARE, die Si­cher­stel­lung der Qua­li­tät der Daten, ihre Nut­zer­fo­kus­sie­rung sowie ihre Ver­ein­heit­li­chung.

Am zweiten Work­shop-Tag halfen in­ter­ak­ti­ve Design-Thin­king-Me­tho­den den Teil­neh­men­den, Lö­sungs­ide­en zu for­mu­lie­ren, aus­zu­ar­bei­ten und zu prio­ri­sie­ren. Das Er­geb­nis war eine kon­kre­te „Roadmap“ für die nächs­ten Schrit­te: Neben einem mitt­ler­wei­le ver­öf­fent­lich­ten Fach­bei­trag ist ein Haupt­ziel die Ent­wick­lung eines Pro­to­typs von SHARE. Er soll in einem breiten Netz­werk von Expert:innen aus For­schung, Klinik und Ethik sowie in Ab­stim­mung mit Pa­ti­en­ten­ver­tre­ter:innen ent­ste­hen und zu­nächst nur Daten zu wenigen sel­te­ner Er­kran­kun­gen um­fas­sen, dar­un­ter ARVC.

Im Alltag würde man sich an solch ein kom­ple­xes Thema gar nicht ran wagen, weil es einfach zu auf­wen­dig ist, aber mit dem Sandpit konnten wir eine gute Basis legen.

Jannik Schaaf

Die Aufgabe, vor der Jannik Schaaf und seine Mit­wir­ken­den jetzt stehen, ist ge­wal­tig. „Im Alltag würde man sich an solch ein kom­ple­xes Thema gar nicht ran wagen, weil es einfach zu auf­wen­dig ist, aber mit dem Sandpit konnten wir eine gute Basis legen“, sagt Schaaf, der als Me­di­zin­in­for­ma­ti­ker bereits in einem vom Bun­des­mi­nis­te­ri­um für Ge­sund­heit ge­för­der­ten For­schungs­pro­jekt an der Ent­wick­lung eines KI-Modells mit­ge­wirkt hat, das Haus­ärz­te dabei un­ter­stützt, Dia­gno­sen bei un­spe­zi­fi­schen Sym­pto­men zu stellen. Ein Pro­to­typ exis­tiert bereits.

Eine Kern­grup­pe aus dem Sandpit be­an­tragt jetzt eine EU-För­de­rung, um den Pro­to­typ zu ent­wi­ckeln. Wenn alle tech­ni­schen und recht­li­chen Fragen geklärt sind, könnte zum Bei­spiel die Grün­dung eines Un­ter­neh­mens oder einer al­ter­na­ti­ven Or­ga­ni­sa­ti­ons­form folgen, um die Platt­form zu pflegen und lang­fris­tig wert­vol­le Ba­sis­da­ten zu ge­win­nen. „Wir müssen For­schen­de mo­ti­vie­ren, ihre Daten be­reit­zu­stel­len, damit wie daraus syn­the­ti­sche Da­ten­sät­ze ge­ne­rie­ren können“, sagt Schaaf. Seine Hoff­nung ist, dass eine große Com­mu­ni­ty her­an­wächst, die den Sinn erkennt und Daten aus eigenen Stücken hoch­lädt. „Wenn wir es schaf­fen, dass syn­the­ti­sche Daten zu einer Selbst­ver­ständ­lich­keit werden, dann wird das einen spür­ba­rer Nutzen für die Patient:innen bringen.“

Jannik Schaaf
©IMI Uni­me­di­zin Frank­furt

Jannik Schaaf ist Pro­fes­sor für Digital Health im An­wen­dungs­feld Chro­nisch und Seltene Er­kran­kun­gen sowie stell­ver­tre­ten­der Di­rek­tor des In­sti­tuts für Me­di­zin­in­for­ma­tik an der Goethe Uni­ver­si­tät Frank­furt/Uni­ver­si­täts­me­di­zin. Er leitet den For­schungs­be­reich Digital Health & Künst­li­che In­tel­li­genz.