eHealth-Podcast Wissensarchiv

Das eHealth-Wissensarchiv ist ein studentisches Projekt der Hochschule HTWG

Folge #112 – Bioinformatik

Written by

in

Beschreibung

In dieser Folge sprechen wir ganz viel über Themen aus der Medizinsichen Informatik. In den letzten Jahren hat darüber hinaus die Bioinformatik immer mehr an Bedeutung gewonnen.

Aber was genau ist eigentlich Bioinformatik? Um welche Fragestellungen geht es da? Welche Kenntnisse brauche ich dazu? Wie trägt die Bioinformatik zu Erforschung von Krankheiten bei und was hat es mit der Entwicklung von neuen Technologien, wie z. B. CRISPR auf sich.

Darüber spricht Bernhard mit der Bioinformatikerin Katja Hebestreit, die aus den USA zugeschaltet ist. Tolle Werbung für ein hochinterdisziplinäres Studienfach mit vielen offenen Fragen, wenn man Biologie mag 🙂

Podcast: Play in new window

Transkription

Das Thema für die heutige Folge ist Bioinformatik. Etwas weiter entfernt vom eigentlichen Themenbereich des eHealth-Podcast, aber auch ein wichtiges Thema in der medizinischen Informatik. Und daher wollen wir uns heute diesem spannenden Thema widmen, von dem ich allerdings gar nicht so viel Ahnung habe und mir aus diesem Grund mal wieder ein Gast eingeladen habe. Und diesmal ganz speziell am Wahltag eine Schalte nach Kalifornien, nach Amerika und ich freue mich sehr, dass ich Katja begrüßen darf, Katja Hebestreit. Hallo. Vielleicht stellst du dich einmal ganz kurz vor, wer bist du und was machst du gerade in Amerika? Und dann werde ich noch mal so kurz die Agenda vorstellen, was wir heute so vorhaben. 

Ja, ich bin Katja Hebestreit. Ich bin in Leipzig geboren, war in Deutschland quasi mein ganzes Leben, bis ich 2014 in die USA gekommen bin und seitdem in der San Francisco Bay Area arbeitet. 

Genau, wir kennen uns aus gemeinsamen Zeiten an der Uniklinik Münster, wo du im Team Bioinformatik und ich im Team Health Informatics aktiv war. Und du hast oder bist in Bioinformatik weg weitergegangen und ja, was machst du jetzt? Ja, ich bin jetzt an einer Firma, die heißt BioMarin, mittelgroßes Pharmaunternehmen, vorher war ich in einem Start-up. Richtig, Silicon Valley Start-up, wo wir so sechs, sieben Leute waren, als ich angefangen habe, wir ging es um neurodegenerative Erkrankungen. Und warum ich eigentlich in nach Kalifornien gekommen war, war ein Postdoc zu machen, an Stanford. Ja, und dann bin ich hier geblieben. Und jetzt wireine 30-minütige Schalte zurück in die USA, das Deutsch noch mal wieder ausgepackt, freut mich sehr. 

Wir wollen heute ganz kurz so was sprechen, was ist überhaupt Bioinformatik, was versteht man darunter, was sind da so konkrete Anwendungen und Fragestellungen, was braucht man dafür für Kenntnisse, was muss man damit bringen, auch vielleicht an Hardware und wie ist dann so die Verknüpfung zur Bioinformatik? Das haben wir uns heute vorgenommen und wir starten einfach mal mit dem Thema, was ist eigentlich Bioinformatik, wiewürdest du das definieren? Wie beschreibst du Leuten, die jetzt nicht unbedingt vom Fach sind, dein Arbeitsgebiet? 

Ja, es ist echt schwierig zu beschreiben, es ist sehr interdisziplinär, es hat einen gewisse Überdeckung mit anderen Bereichen. Gerne auch eigentlich durch und durch. So, es ist quasi angesiedelt, irgendwo zwischenMathematik, Statistik, Datenanalyse, Molekularbiologie, Genetik und Programmieren. 

Im Vorfeld hast du gesagt, es ist ein großer Spielplatz, interessante Definition, warum spielplatz? Es ist ein Spielplatz, weil generell das Biologie und Medizin so relativ unerforscht, obwohl wir da natürlich schon seitJahrhunderten daran arbeiten. Aber jedes Mal, wenn man eine neue Erkenntnis macht, dann wirft das neue Fragen auf. Und es ist quasi ein riesiger Spielplatz in sofern, dass man einfach extrem viel entdecken kann. Und imMoment seit den letzten zehn Jahren oder so, werden halt nur viele große Datenmengen hergestellt. Und einfach diese großen Datenmengen zur Verfügung zu haben, um diese Fragen beantworten zu können, ist, machtenorm Spaß. Also, austoben in den großen Datenmengen, dass die großen Datenmengen sind deine Spielgeräte, um dann mit entsprechenden Informatik und Statistiknethoden darauf loszugehen. 

Was sind eure Fragestellungen oder konkrete Anwendungen? Also, wie muss ich mir jetzt so deine tägliche Arbeit am ersten vorstellen? 

Ja, es ist enorm verschieden. Es gibt Bioinformatiker, die wirklich versuchen, die Grundlagen der Biologie zu erforschen. Also Evolution, welche Arten sind am nächsten verwandt und was unterscheidet Arten voneinander. Und dazu gehören Sachen, wie die Struktur von Proteinen aussieht, wie Proteine funktionieren, wie werden Gene reguliert, aber auch. Und dann mehr konkret auch in der Krankheitsforschung wird in Bioinformatik benutzt. Also, wir müssen ja Molekularbiologie verstehen, um zu verstehen, wie Krankheiten hervorgerufen werden und wie wir die gegebenenfalls therapieren können. Wir benutzen Bioinformatik, um Genetik von Erkrankungen zuerforschen. Und aber auch für die Medikamentenforschung. Wir versuchen, um herauszufinden, warum manche Patienten auf Medikamente ansprechen und andere nicht. Manchmal kann das genetische Ursachen haben, aber auch molecular Biologische Ursachen. Aber es wird auch benutzt. Zum Beispiel, viel haben wir es wahrscheinlich von CRISPR-Cas9-System gehört, was jetzt gerade den Nobelpreis bekommen hat als Genschere. Und da wird auch Bioinformatik benutzt. Weil es wird auch Bioinformatik benutzt für ganz andere Sachen. Zum Beispiel für Bildanalyse. Zum Beispiel werden Unmengen von Mikroskopiebildern hergestellt oder MRT Aufnahmen. Und da kann man zum Beispiel Machine Learning verwenden, um solche Kategorisieren zu können, sodass nicht Personen, die auswerten müssen. 

Also viele Anwendungsfelder, wie steh ich mir das ganz konkret vor? Also du bekommst also einen großen Datensatz zur Verfügung gestellt. Wahrscheinlich irgendwie den Link zu einem großen Festplattenspeicher. Dann eine bestimmte Fragestellung sind diese beiden Lebewesen miteinander verwandt oder ist hier eine Mutation vorliegend? Oder wie muss man sich das vorstellen? Ja, so das Beispiel, was du gerade anbringsst, ist in dem Fall ein Bioinformatiker arbeitet mehr mit einem Biologen und versucht, das ein Fragen zu beantworten. Das macht total Spaß, aber da bin ich eher davon weggegangen. Ich finde es eher spannender, wenn man als Bioinformatiker selber die Fragen stellen kann. Es gibt quasi ja Unmengen von Daten, die hervor generiert worden von Universitäten, vor allem. Und diesen Freizugel nicht. Und wir stellen quasi unsere Fragen. Also wir fragen, wir möchten mehr verstehen, wie das sehen, wie es gut gut geht wird. Und wir haben eine bestimmte Hypothese. Und dann denken wir darüber nach, welche Art von Daten brauchen wir dafür und das zu beantworten. Und in weder gibt es die Daten schon oder wir müssen sie selber erheben. Und dann haben wir z. B. In unserem Team ein sogenannte Functional Genomics Group. Das sind dann Biologen, die im Labor arbeiten und die dann auch diese Daten herstellen können für uns, um diese Fragen zu beantworten. 

Das war die letzte Fragestellung, der du gearbeitet hast, wo du sagst, das interessiert dich aus Forscher sich. Da willst du was rausfinden? Ja, ein großes Gebiet, das ist Systembiologie. Da willst du mein Quasi herauszufinden, wie Gene miteinander reguliert sind und z. B. Gibt es Erkrankungen, die hervorgerufen werden durch Mutationen in ein bestimmten Genen. Aber es ist bekannt, dass dieses Genen, du kannst es nicht wirklich terapieren, du kannst es nicht wirklich ersetzen. Und da macht es z. B. Sinn herauszufinden, oder was sind Gene, die dieses Genen beeinflussen können, die damit quasi verwandt und verknüpft sind. Und dafür nutzt man das Systembiologie und der Hoffnung, dass man Gene findet als Proxies, wenn man die Veränder, deren Genexpression zum Beispiel, dann kann man den Krankheitsverlauf umheeren. Und so was habe ich gemacht, wenn meine Alpenbömer bewirtschaftst, in einem nächsten Bild. 

Und wie läuft das konkret? Suchst du nach Koalition oder suchst du nach anderen statistischen Mustern oder…? Ja, Korrelation wäre, die einfachste Möglichkeit nachzuschauen, z. B. Nur anhand von Genexpressionstalten. Es gibt aber auch wieder Datenbanken, die dir sagen, Protein-Datenbanken, welche Proteine miteinander assoziiert sind und man benutzt auch hier Literaturdatenbanken. Wenn man mehr rauszufinden, welche Assoziationen sind bekannt, dann gibt ja in Norm viele verschiedene Möglichkeiten, um der Erkenntnis einfliegend zu lassen und so eine Lösung. 

Ist das gerade schon gesagt, ihr habt ein interdisziplinäres Team und auch schon so ein paar Fähigkeiten genannt, die man mitbringen muss. Also was für Kenntnisse braucht man, wenn man sich auf den Weg der Bioinformatik begibt. Du selbst bist Statistikerin, die einer medizinischen Informatik oder Bioinformatik promoviert hat. Was muss man alles mitbringen? Ja, mein Fokus war sehr auf Statistik, aber ehrlich gesagt, ich habe mein ganzes Statistik, wir sind vergessen. Generell glaube ich, was aber gut ist. Einfach im Studium lernt, logisch zu denken. Das vergisst man wahrscheinlich nicht. Und ja, man braucht gewisse Interesse für Statistik und Programmieren. Aber ich würde sagen, was am wichtigsten ist, ist Faszination für Biologie. Also man muss wirklich Biologie lieben und da wirklich das Spielplatz empfinden zu können. 

Und könnt ihr denn verschiedene Tools nutzen, mit denen ihr diese Analysen durchführt oder ist das überwiegend so, wie in Münstern verschiedenen Stellen, dass man die Routine eigentlich selber schreibt, dass man in den Papers liest, da gibt es irgendwie einen Zusammenhang und man dann selber eine Routine schreibt, um den sozusagen auch in den eigenen Daten zu entdecken. Die Community, die in dem Bereich, die schreiben extrem gute Software. Und für quasi alle möglichen Fragestellungen gibt es verschiedene Software zur Verfügung, die wir benutzen können. Manchmal gibt es Sachen, der Software noch nicht und das ist ein super für Doktoranden, sodass die schöne Doktorverschreifen können. Weil die großen und ganzen sind alle Methoden 3 verfüglich bei GitHub oder Python. Also geht es eher darum, die richtige Methode auszuwählen und vielleicht noch ein bisschen zu adaptieren und mit den richtigen Parametern zu starten, als jetzt wirklich die Methoden komplett neu zu schreiben. Ja, zumindest wenn man Glück hat und Daten arbeitet für solche, für die solche Methoden schon gibt. Aber ja, oft kann es einer Moment gibt es jetzt so eine extrem schnelle Evolution, dann neuen Daten, die reinkommen. Und da muss man sich selber Gedanken machen, wie man das auswirte. 

Und das braucht man so einen Hardware-Ausstattung, also wenn man da wirklich so ein große Datensetzer hat, mit vielen Genomen-Daten. Das macht man wahrscheinlich nicht auf dem kleinen Arbeitslaptop, sondern das liegt wahrscheinlich irgendwie auf einem Server oder heutzutage alles irgendwo in der Cloud. Ja, ich habe wirklich gar nicht auf meinem Laptop, also ich arbeite in den ganzen Tag. High-Performance-Computern. Vorher habe ich viel die Amazon EC2, das benutzt, also EC2, EC3 und Unis haben auch ihre eigenen Kloster zur Verfügung. 

Jetzt hört man ja immer wieder nicht nur im Zusammenhang der medizinischen Informatik, sondern auch gerade in der Bioinformatik. Die Stichworte Big Data und KI, neuronale Netze sind das bei euch auch Schlagworte, oder ist das sozusagen Alltag? Ich meine, große Datenmengen habt ihr eigentlich immer, ne? Ja, es ist beides. Ja, alle unsere Datenmengen sind groß, aber es wird trotzdem noch benutzt. Und zum Beispiel für Investoren für Startups, Big Data ist in jedem Mund und genauso mit dem Machine Learning. Und es gibt tatsächlich viele Firmen und akademische Gruppen, die das benutzen. Aber tatsächlich wird das glaube ich sehr viel weniger benutzt, als es beworben wird. 

Und versuchen wir mal so ein bisschen den Schwenk zurück zum eHealth-Podcast oder zum Thema E-Heath und Medizin Informatik. Wie kommen eure Erkenntnisse aus deiner Forschung jetzt beispielsweise bei den Patienten im Krankenhaus an? Also passiert das irgendwie über neue Medikamente auf der einen Seite, aber vielleicht auch irgendwie neues Wissen? Wie kann das jetzt vielleicht demenz Kranken im Krankenhaus konkret helfen? 

Ja, natürlich ist unser großer Hoffnung, dass Bio und Informatik auch neue Medikamente hervorbringen kann. Und das vor allem für solche Krankheitsbilder, die relativ unverstanden sind und für diese Momente überhaupt keine Medikamente gibt für neurodegenerative Erkrankungen. Das sind diese werden also sogenannte komplexe Erkrankungen auch bezeichnet, weil die enorm genetisch kompliziert sind. Es gibt ganz viele verschiedene Gene, die da mit einer Rolle spielen, aber auch die Umwelt. Und wir hoffen, dass wir Informatik helfen kann, neue Medikamente zu entwickeln. Das spielt auch enorm eine Rolle für Diagnostik. Also es gibt ja Tausende seltene genetische Erkrankungen. Und z. B. Wenn Kinder mit Epilepsie diagnostiziert werden, ist es z. B. Sehr wichtig, dass man rausfindet. Ist das genetisch bedingt und wenn ja in welchem Gehen? Weil das denkbar, dass man wirklich so was fast live macht, dass man sagt, ich habe im Krankenhaus Informationssystem, gebe ich 1. Symptome ein und stelle fest, die da können viele Ursachen haben und ich lasse im Hintergrund mit diesen Symptomen unter entsprechenden Bioprobe auch mal so ein Gehencheck ablaufen und sagen, also könnte es vielleicht im Hintergrund, also um das, wenn du zu bestätigen oder auszuschließen? Ja, so ein Moment wird es so gehandhabt, dass der Doktor quasi eine Sequenzierungsanalyse veranlasst, blutert nimmt und dann zu einem Sequenzierungslabor geschickt wird. Und das wird dann sequenziert und dann gibt es Bioinformatiker, die diese Daten dann auswerten und dann einen Bericht zu dem Arzt schicken, der dann sagt z. B. Die diese Mutationen sind gefunden worden, aber die müssen dann auch die Interpretation machen und die Interpretationen kann relativ schwierig sein. Zum Beispiel, als wir alle haben 1.000 Millionen von Mutationen in unserem Genomen und herauszufinden, welche tatsächlich die Krankheit vorursachen können, welche Mutationen nicht pathogen sind, ist relativ schwierig herauszufinden. 

Aber da könnte ja dann beispielsweise eine KI eingesetzt werden und das man dann sagt, dass es vielleicht irgendeine Vorstufe bestimmte bekannte Muster werden schon mal vorgefiltert und mit einem Anfangsverdacht bestätigt? Ja, und das ist aber auch wieder sehr abhängig an die Krankheit, weil manchen Erkrankungen weiß, die sind besonders durch Missense-Mutationen vorursacht oder beändern, sind es trunkierende Mutationen und im Moment ist das noch alle sehr manuell. Also noch großes Spielfeld, um bei dem Spielplatz zum Beispiel zu bleiben, also da kann man sicherlich noch sicherlich ganz viel machen. In der Medizinischen Informatik ist ein großes Stichwort immer so die Standards und die Interoperabilität und die Vernetzung. Wie sieht es mit Standards in der Bioinformatik aus? Ja, kann ich mich leider nicht sehr gut aus. Also, ich weiß so, dass für diese Sequenzierungslabore da gibt es garantiert irgendwelche Standards, die müssen dann wahrscheinlich eine gewisse Sequenzierungstiefe für Erzielen zum Beispiel, um eine Motation beschreiben zu können. Und es gibt auch spezielle Standards für manche Erkrankungen, welche Mutationen pathogen sind und welche wahrscheinlich nicht. Aber das ändert sich ständig zumindest wie die Mutationen zum Beispiel interpretiert werden, das ändert sich ständig hier nachdem, welche neue Paper aufgrund kommen. 

Und vielleicht abschließend noch mal so ein bisschen die Frage, was sind die größten Herausforderungen vor denen die Bioinformatik so gerade steht? Was wird so der nächste größere Schritt sein, der da ansteht odergegangen werden muss? Ja, ich glaube, es gibt jetzt etliche Start-up, die Machine Learning und Artificial Intelligence benutzen wollen um neue Medikamente hervorzubringen. Und da ist noch wirklich die große Frage, ist das möglich. Das müssen Sie alles noch beweisen. Und wenn wir wirklich klatten würde, einfach mit Kurven, Hochdurchsatz, Experimenten und dann Machine Learning drauf zu werfen, wenn uns das wirklich näher bringt, dannMedikamente, das wäre ganz schön toll. Ist ein Prinzipiell sehr schönes Schlusswort, aber habe ich noch irgendwas vergessen zu fragen, möchte es noch irgendwas loswert. 

Ja, generell, also ich liebe es, in der Bioinformatik zu arbeiten. Ich wollte immer Biologe werden, weil ich Biologie so spannend fand, aber meine sehr praktischen deutschen Ingenieurs Eltern fanden es besser, wenn ich etwas mit Mathe mache. Ich bin jetzt nicht studiert und jetzt bin ich heil froh, dass mir das helft. Man hat vielleicht nicht doch ein Biologe zu arbeiten. Also es gibt verschiedene Wege, in den Bereich zu kommen und ob man eine Biologie hintergrund hat oder programmiert hintergrund. Alle finden ein Zuhause in der Bioinformatik, wenn man unterrasse hat und Biologe. Ja, ein schönes Werbeplädorie am Anfang und Werbung für ein Fach kannich natürlich nur unterstützen. Also wenn sich der eine oder andere hier angesprochen fühlt, kann ich gerne den Kontakt verwetteln, wer da noch nach Amerika kommen möchte. Je nachdem, wie es heute Abend ausgeht. Ich möchte vielleicht morgen wieder nach Deutschland. Genau, warten wir es mal ab und ich sage aber schon mal an dieser Stelle ganz vielen lieben Dank Katja, dass du dir die Zeit genommen hast und uns hier zurVerfügung standen hast und viele Grüße nach Amerika. Amerika. Sehr gern, lieber Klaus. 

Shownotes