In dieser Folge präsentiert Matthias Becker seine Dissertation, in der er an einem innovativen Algorithmus arbeitet, der aus deutschem Freitext automatisch SNOMED-CT-Codes extrahiert. Auf Grundlage dieser Codes soll der Algorithmus in der Lage sein, mithilfe klinischer Leitlinien automatisch Behandlungsvorschläge zu generieren. Ein wichtiger Schritt in der Automatisierung und Präzisierung medizinischer Entscheidungsprozesse.
Podcast: Play in new Window
Transkription
Herren, Matthias, Dr.-Ing. Becker dort, schöne Grüße ins Land der Schwarz-Gelben. Hallo Matthias.
Hallo Christian, schöne Grüße zurück. Nach Konstanz?
Ganz genau, Konstanz. Das ist ja diese Stadt ansehen. Genau, Renato hat keine Zeit, wir kennen es schon ein bisschen länger. Und du promovierst gerade an der Fachhochschule in Dortmund, das ist das, wo ich auch studiert habe, medizinische Informatik. Und hast dort eine relativ spannende Dissertation. Ich schau mal, ob ich noch zusammenkrieg. Daten, semantische Analyse, Methoden zur Extraction von SNOMED CT-Codes für personalisierte Behandlungsvorschläge am Point of Care. Hab ich natürlich auswendig gesagt. Nicht abgelesen. Da sind jetzt aber nicht alle Basswolls drin, die es derzeit in der Branche gibt. Oder so ein, zwei hast du noch ausgelassen. Also Cloud und Big Data fehlt noch. Ja, also ein paar Basswolls müssen immer dabei sein. Und ich finde der Titel, die geht auch runter wie Öl. Und ich muss dann jetzt mal korrigieren, ein bisschen, ein korrigieren. Und zwar ist es ja nicht so eine Fachhochschule in Dortmund. Weil ich promoviere. Weil wir weist, kann man ja nach Fachhochschule nicht promovieren. Also promoviere ich offiziell an der Universität Duisburg-Essen. Es ist so, dass der große Fokus liegt dabei. Eigentlich im Großen und Ganzen auf SNOMED CT. Also dass ich mit SNOMED CT arbeite, in während dieser Arbeit. Und auf Leitlinien im basierte Behandlungsvorschläge. So, wenn das Ding vielleicht mal zum Anfang ganz kurz auseinanderbeflücken. Was ist denn?
Was sind denn Daten semantisch? Was heißt das denn? Also ist es so, dass zum Beispiel Leitlinien, die werden ja ein bisschen abständen. Meist einmal im Jahr veröffentlicht. Und das ist dann meist ein PDF-Format. Und daraus kann man jetzt relativ schwierig ein klinischen Pfad modellieren. Weil es ja nun mal alles Prosa ist im Prinzip. Und die Dederhinter ist, dass man mit ja datensimantischen Analysen-Methoden. Also mit Text, Meining, Natural Language Processing. Diese Daten, die wichtig sind, dieser Leidlinie. Also wie man brauchen, diesen klinischen Pfad zu bauen. Das ist dann halt automatisiert oder möglichst automatisiert daraus holt. Und diese dann natürlich auch mit Patienten Daten verknüpft. Und ja, die Idee war halt, dass man da jetzt eine sehr, sehr feingranulare Terminologie nimmt. Wie es nur mit CT. Wobei die CD oder Ähnliches natürlich wahrscheinlich ein bisschen einfacher werden. Aber dann wäre es ja kein Herausforderer.
Ich versuche es mal zusammen zu fassen. Das heißt es kommen, es gibt natürlich die unterschiedlichen Fachgesellschaften. Und die bringen halbwegs regelmäßig Leitlinien raus. Eines ist zwei ist drei und so weiter. Und dein Thema der Dessertation ist, dass du diesen Freitext nimmst. Durch eine Software-Schleus, die du geschrieben hast. Und nachher automatisch dann erkannt wird, um was es sich dabei handelt. Nämlich also irgendwelche Begriffe, die da drinstehen, werden automatisch in dieses SNOMED CT-Nomenklatur übertragen. Ist das so, als schon mal richtig? Das ist 100% nicht richtig, ja. Und vielleicht erklärst du mal ganz kurz, was Snow-Med ist. Das ist in Deutschland, die meist verbreitete Klassifikationen, um Prozeduren oder um Diagnosen zu klassifizieren. Ist halt ICD und OPS. Das kennt man ja so. Und dann gibt es natürlich noch ein paar weiter SNOMED CT. Ist ein bisschen anders. Es ist deutlich fein Granulare. Zum Beispiel, wenn man sagt, das gibt eine Verletzung am Finger. Kann man da auch auch ableiten, dass der Finger an der Hand ist. Hand an Oberarm und so weiter. Das sind so Zusammenhänge. Die würde man jetzt mal schön nicht aus einem ICD-Katalog bekommen. Wir brauchen natürlich diese fein Granulare-Struktur. Dann wird man auch vernünftige Behandlungsvorschläge daraus ableiten kann, wobei das größte Problem ist bei SNOMED CT. Das ist es nicht auf deutscher Sprache gibt. Und das war auch der erste, ja, der erste Meinstand der erreicht werden musste. Denn Deutschland ist kein SNOMED CT-Land. Es bedeutet, dass SNOMED CT in Deutschland nicht kostenlos verführungssteht. Und ist halt, wie gesagt, nicht auf deutscher Sprache existiert. Also muss ich da erst mal nach Dänemark eine E-Mail schreiben. Und da sitzt halt das Hauptquartier. Das wird sich um SNOMED CT-Kommand. Und muss sie dann da höflich fragen, ob ich den SNOMED CT von meiner Forschung verwenden darf. Also, wenn ihr das eben konstanz einsetzen möchtet, dann wirst du da auch freundlich nachfragen. Wobei es auch schon einige kostenlos überaus ergibt, indem ein SNOMED CT einfach mal ausprobieren kann. Okay, so ganz, aber hier ist noch nicht verstanden, was SNOMED CT macht. Also ICD-OPS, das kennen die Hörer vermutlich schon. Aber was macht jetzt SNOMED CT? So ist verstanden, ob es es schon mal nicht für die Abrechnung. Und das ist vermutlich auch ein Grund, warum es in Deutschland jetzt noch nicht flächendeckend genutzt wird. Aber vielleicht kannst du noch mal kurz erklären. Normalerweise gibt es ja so kennengrößt. Und wie ob das jetzt monoaxial ist, multiaxial, hierarchisch, nicht hierarchisch, etc. Vielleicht verlierst du da einfach zwei, drei Wörter mal drüber. Es ist halt so aufgebaut, dass es mir reachsen hat. Und das bedeutet halt, dass verschiedene Konzepte angeboten werden ins SNOMED CT. Was sind Konzepte? Also gibt zum Beispiel Krankheiten und Körperlukalisation. So kann man das zum Beispiel kombinieren. Also man hat jetzt ein Melanom und man kann auch nicht genau sagen. Also es ist noch nicht definiert, wo dieses Melanom ist. Denn dann kann man dieses wiederum mit einem anderen Konzept verbinden, wie zum Beispiel im Körperteil. Und das wird dann zusammenkudiert in einem karotischen System. Denn es werden einfach IDs am Ende vergeben und die Bestimmung dann halt, dass jetzt ein Melanom am kleinen Finger ist zum Beispiel. Also es kann alles mögliche miteinander kombiniert werden. Und so ist natürlich die Idee dahinter, dass man so möglichst genau Dinge spezifizieren kann.
Dann fasse ich noch mal zusammen. Also jetzt haben wir so ein bisschen verstanden, was daten semantische Analyse-Methoden sind. Das heißt, Parsen von Freitext und SNOMED CT-Codes daraus lesen zu. Das ist dann zur Extraction von SNOMED CT-Codes. Vielleicht eine Frage noch. CT hat in dem Kontext hier nix mit Computertomographie zu tun, sondern was heißt es SNOMED CT aufgelöst. CT steht für Clinical Terms. Also es gibt verschiedene Snow-Medversionen. Die uns meistens beschäftigen ist halt diese Clinical Terms, weil es da nur mal um die wichtigen Informationen gibt, die wir aus der Leitlinie rausholen wollen. Gut, denn jetzt noch mal, was heißt Snow-Meter nix mit Schnee-Medizin zu tun, sondern bedeutet was. Als SNOMED CT ist eine Kurzform natürlich von dem Wort Systemeist Nomenclature auf Medicine-Clinical Terms. Also es hat nichts mit Schnee zu tun, sondern mit der Nomenclature der Medizin. Okay, für personalisierte Behandlungsvorschläge ist auch klar. Das heißt irgendwann möchte ich also vielleicht reingeben können. Der Patient hat irgendwelche Augenprobleme und fährt ansonsten viel mit dem Fahrrad. Gibt es dazu irgendwelche Leitlinien? Dann holen wir noch das letzte Basswort am Point of Care.
Das bedeutet, du baust eine mobile App. Leider nein, es Point of Care bedeutet ja nur, dass das die Formation dort zur Verfügung stehen, wo der Arzt behandelt. Brüche am Patientenbett oder auch im Arzt sind wir auch immer ja sie gerade im Krankenhaus befindet. Das soll eigentlich ausdrücken, dass die Informationen sofort und live praktisch für ihn zur Verfügung stehen.
Also wenn ich jetzt mal einen Beispiel in der Art. Also in Größenthalz werden wir immer mit Mammakarzinomen S3-Leitlinien arbeiten wir jetzt in zur Zeit am meisten. Und das würde bedeuten, dass jetzt zum Beispiel diese Leitlinie verbunden werden kann mit den klinischen Daten sprich, wenn man jetzt eine junge Dame hat, wir hat einen bestimmten Tumor und der hat eine gewisse TNM-Klassifikation und ein bisschen vorgeschichte, dass dann mein Stück Software diese Information, also strukturiert, wir rundstrukturiert Informationen mit der Leitlinie verbinden und er dann genau sieht, die Leitlinie sagt bei dieser Patientin, der nächste Schritt sollte, eine Mastektomie sein zum Beispiel oder etwas anderes. Und genau das könnte dann sehen, was laut der Leitlinie halt der nächste Schritt wäre und dann darauf entscheiden, ob er diese Empfehlung annimmt oder davon abweicht und müsste es dann begründen.
Wie würde diese Behandlungsempfehlung dann vorliegen? Das wäre dann auch wieder Freitext. Du zeigst einfach dann entsprechende Passagen aus dieser, in dem Beispiel, dann S3, Mama, C. A., Leitlinie an.
Ganz genau. Wir würden sehen, also er müsste sich halt nicht durch die gesamte PDF-Datei, der Leitlinie, die ja mehrereundert Seiten umfassen kann, durchlesen und da müsste sich auch nicht immer die neueste aktualisierte Version jedes Jahr durchlesen, sondern hätte sofort die Information, die erbreuchte, direkt vor Augen und könnte dann entscheiden.
Spannend. Das heißt, alleine schon diese eine Geschichte, dass man in Zukunft dort deutsche Texte reinwerfen kann. Das funktioniert hoffentlich nicht nur mit Leitlinie Texten, sondern das wird ja dann dem Stücksoftware-Gasein. Man kann davon, wo ich da noch Arztbriefe reinwerfen und der schaut dann und dann das No-Mitsity-Code zurück.
Also so bin ich jetzt auch gerade im Moment dabei die Precision und Recall, der… Du wirst dann noch besser als… Richtig. Diese beiden Wert zu ermitteln. Also wie gut ist die Qualität der Ergebnisse, die ich aus diesen Deutsch Texten rausbekommen? Und das mach ich moment mit Arztbriefen, wobei es sehr, sehr schwierig ist, deutsche anonymisierte Arztbriefe zu bekommen. Deswegen muss man sehr auch ein bisschen einfalls reich sein, wie man diese Texte heranschaffen kann. Deswegen versuche ich es teilweise mit technischen Texten, weil in amerikanischen Bereich gibt es sehr viele Arztbriefe, die man einfach so verwenden kann. Ich habe ja schon schon versucht, auch mit dem Google Translate auf Deutsch übersetzen und meinen Algorithmus nochmal drüber laufen zu lassen. Und ich muss sagen, so meine Überraschung ist dieser Google Translate gar nicht mal so schlecht. Also es geht hervorragend damit. Und damit wird es halt dann geguckt, wie gut ist der Algorithmus. Im Moment sind wir noch in der Phase, der die Ergebnisse zu verbessern. Also es ist im Moment noch nicht. Wir haben noch keine 100 Prozent. Okay, also für mich nochmal ein bisschen zusammenfassend, was ich kenne, für Produkte, die ich weiß nicht, ob es schon an Flächendeckend im Einsatz sind. Aber es gibt Produkte, die eben auch Freitext, dokumentierten Freitext, Scannen und nachher Vorschläge machen. Vielleicht sollte es noch den ECD mit reinen, den OPS. Der Ziel bei diesen Produkten ist dann logischerweise die Erlössteigerung. Das Ziel bei dir, wenn ich es richtig verstanden habe, ist dann aber weniger die Erlössteigerung, sondern oder vielleicht eher nachgelagert, sondern eher, dass man ja die Bannungsqualität steigert. Oder das heißt, dass dann im Jahr automatisch Bannungsvorschläge gemacht werden.
Ganz genau, also die derzeitigen Ansätze auf dem deutschen Markt zumindest sind so, dass ich wirklich nur insbesondere OPS-Codes zum Beispiel aus OP-Berichten ziehen möchte, um die Abrechnung zu verbessern. Also Geld regiert die Welt und deswegen da ist natürlich immer die große Fogus drauf, in den harten Gesundheitswesen. Meine Arbeit beschäftigt sich damit halt gar nicht, was Abrechnung angeht, sondern wirklich nur Behandlungsvorschläge. Wobei man sagen muss, da ich mit UMLS-Codes arbeite, also eine große Datenbank praktisch über verschiedene Terminologien, könnte man theoretisch auch aus diesen Codes ECD und OP-S-Codes ableiten. Aber ich möchte dann nicht in Konkurrenz treten mit wirtschaftlichen Produkten. Warum? Das mache ich erst nach der Doktorarbeit. Ok, baust du dir eine Geldspeicherstatt? Richtig, mindestens, mindestens.
Dann auch ein Stichwort, nachdem das Ganze jetzt ja nur ein Prototyp vermutlich ist und dann, wenn man das Ganze so einsetzen würde in der Klinik, hast du dir der Überlegung gemacht, inwieweit das der Medizinproduktere relevant wäre? Ja, es wäre natürlich eine Entscheidungsunterstützung und da wäre das vermutlich, natürlich auch Medizinprodukt und müsste dann wahrscheinlich auch durch sämtliche Regulare und durch, wie any Medikament auch. Aber wie gesagt, das ist ja nur ein Prototyp und möchte beweisen, dass es so und mit diesem Algorithmus, um diesem Konzept funktionieren könnte.
Dann vielleicht von dir noch eine Einschätzung. Das Nomad CT ist der zu unrecht, dann in Deutschland stiefmütterlich behandelt, ist es eigentlich eine super Sache, sollte man das mehr machen. Auf einer Skala von 1 bis 17, wie gut findest du das Nomad 17, hervorragend, du würdest den gern heiraten. Eins eher so, ja, schade, da sich das in der Doktorarbeit behandeln muss. Es ist ein interessantes Kala-Kristian. Und ich würde es auf 16, denke ich mal, typen. Wenn das international halt die Nomenklatur, die alle benutzen. Also die Schweiz zum Beispiel ist jetzt ein neues Nomad CT mit die Z land, die haben sich dazu entschieden, auch damit zu machen. Und ich denke, dass Deutschland früher oder später nicht darum rumkommt. Und im Ehelsgesetz steht ja auch, dass man mehr auf internationale Standards setzen soll. Und ich denke, da kommt man auch ein Nomad CT nicht vorbei. Also es wird früher oder später kommen.
Dazu müsste es dann allerdings auch ein Übersetzung geben, also wirklich eine deutsche Version und von der Nomad CT. Was ja, das dem, die in 20 Jahren nicht geschafft hat. Das ist richtig. Wir muss auch sagen, der Nomad CT wäre relativ teuer, meines Wissens nach. Also ich glaube, die Zenskosten für den Land, die sind schon sehr hoch. Ich denke, wenn man für Flughilfen und irgendwelche Konzertäuser für Geld hatte, kann man auch für eine gute Klassifikation auch ein bisschen was investieren.
Du hast einen Bahnhilfe vergessen. Ich würde sagen, du hast schon irgendwo was veröffentlicht. Das heißt, falls Leute sich dafür interessieren, dass wir dann einen Post dazu zum Beispiel aus Wien, Zwinker zwinker irgendwie verlinken können oder irgendwie sowas. Selbstverständlich habe ich erst klassische Veröffentlichung unter anderem bei eHealth in Wien und auch bei der GMDS erst jetzt in München habe ich einen Post dazu. Also bei der Wien war es halt Vortrag und auf der GMDS ersten Post dazu. Können wir gerne für Öffentlichen da drunter. Und es wird auch bald eine Projekt-Webseite geben bei uns, wo die Arbeit auch noch vorgestellt wird, jetzt, wo wir die ersten Ergebnisse haben. Weißt, was richtig cool wäre, wenn du dort ein Webservice anbieten würdest. Wo man einfach Text hochllädst und du dann dir kannst nur mit CT-Codes zurückgibt. Das ist ja richtig cool, ne? Wer eine super Wettstararbeit für jemanden aus Konstanz. Ich glaube, ich muss mal, wo ist dein Dr. Vater essen? Vielleicht muss ich mal fragen, ob das nicht eigentlich auch mit reingehört in so eine Dissertation. Ja, mach das mal in besuchlich meinen Konstanz. Und nicht wegen Rock am See. Okay, ja gut, das ganze klingt sehr spannend. Ich hoffe, die Audio-Qualität hat jetzt auch gepasst. Nachdem du ja Arma, Dr. Und Biss, Konzule, kein Hedset leisten. Ich finde es spannend. Und werde das weiter beobachten? Ja, also es dauert ja noch zwei Jahre, bis das Ding fertig ist. Also, ich bin noch relativ am Anfang. Und wie du ja weißt, was ja auch mal irgendwann mal promoviert vor 15 Jahren. Sag. Es war eine Anfang, muss man erst mal das Thema finden und das dauerte halt eine gewisse Zeit, bis man auch sieht, welche Methoden funktionen, welche nicht. Oftmals forscht man ja ins Nirvana und merkt, oh, das funktioniert ja gar nicht so. Also was ich gelernt habe, ist, forschen kann man nicht planen. Schöner Watz, ne?
Schlagwörter
SNOMED-CT (Systematized Nomenclature of Medicine – Clinical Terms), Klassifikation, Codierung, Point of care, OPS-Code
