Translational modeling of drug efficacy in cancer

Schätzle, Lisa-Katrin; Schuppert, Andreas (Thesis advisor); Wiechert, Wolfgang (Thesis advisor)

Aachen (2020)
Doktorarbeit

Kurzfassung

Als komplexe Krankheit, die auf dem skalenübergreifenden Zusammenspiel vieler molekularer Mechanismen beruht, stellt Krebs die Entwicklung effektiver Behandlungsmethoden vor große Herausforderungen. In der personalisierten Medizin wird daher untersucht, wie durch die Erfassung genomischer Muster auf die Wirksamkeit verschiedener Medikamente geschlossen werden kann, um therapeutische Entscheidungen gezielt zu unterstützen. Da Krebszelllinien einerseits wichtige Aspekte der biologischen Prozesse in Patienten widerspiegeln und andererseits in standardisierten Hochdurchsatz-Experimenten vergleichsweise schnell und vielfältig untersucht werden können, dienen sie häufig als Grundlage für große pharmakologische Screens. Mit der Anhäufung der Daten wächst zunehmend auch die Vielzahl an mathematischen Modellen, die die krankheitsspezifischen molekularen Profile mit den Wirkungsmustern der Medikamente verknüpfen. Aufgrund verschiedener Verzerrungseffekte, wie der Erfahrung der jeweiligen Entwickler mit der entsprechenden Methode, der Optimierung mit Bezug auf einen beschränkten Datensatz, oder dem Fokus auf einer bestimmten Modell-Komponente statt des gesamten Workflows, sind diese jedoch häufig nicht auf andere Anwendungszwecke übertragbar. Zusätzlich fehlt ihnen oft der direkte Bezug zwischen den in kontrollierten Laborbedingungen erfassten Zellprozessen und den entsprechenden Prozessen in lebenden Patienten. Im Rahmen dieser Arbeit wurde ein R-Package entwickelt, das die systematische Analyse von Routinen ermöglicht, mit denen genexpressionsbasierte Regressionsmodelle mithilfe von Zellliniendaten trainiert und daraufhin unmittelbar an Patientdaten validiert werden. Mit der Variation von Ansätzen der Homogenisierung, Filterung und Präprozessierung der prädiktiven Features, der Transformation der Modell-Outputs und der Regressionsmethode wurde anschließend der aufgespannte Modellraum nach robusten Einstellungen durchsucht. Der erste Teil der Untersuchungen behandelt die Herausforderungen durch kleine Datensätze und Rauschen, die die Übertragbarkeit von translationalen Modellen auf verschiedene Patientendaten beeinträchtigen können. Im direkten Vergleich zwischen vorteilhaften Einstellungen von translationalen Modellen und Modellen, die sich streng auf die Zelllinienvorhersage beschränken, werden außerdem signifikante Unterschiede identifiziert. Nach der Beschränkung auf Modelle, die anhand einer einzigen Zellliniendatenbank trainiert werden, umfassen die nachfolgenden Kapitel weitere Datenquellen, um deren Einfluss auf die finale Modellqualität zu quantifizieren und von anderen Einflussfaktoren abzuheben. Zudem werden verschiedene Maße der Medikamentenwirksamkeit von Zelllinien auf ihren Einfluss auf die Prädiktivität überprüft. Eine systematische Varianzanalyse dient im Folgenden dazu, das Zusammenspiel der einzelnen Modellkomponenten zu entschlüsseln und diese hinsichtlich ihrer Effekte auf die Ergebnisvariabilität einzuteilen. Daraus wird ersichtlich, dass neben dem Regressionsalgorithmus als Hauptfaktor auch andere Einstellungen eine entscheidene Rolle spielen. So haben Konfigurationen, die eine Reduktion der Komplexität anstreben, einen positiven Effekt auf die Vorhersagbarkeit unabhängig davon, welches Medikament modelliert wird. Im finalen Teil der Arbeit liegt der Fokus auf der Kombinierbarkeit mehrerer Modelle, die mithilfe verschiedener Datenquellen oder verschiedener Einstellungen entstehen, in sogenannten Konsensmodellen. Das zugrunde liegende Ziel dabei ist es, durch den Perspektivengewinn die Prädiktivität der integrierten Vorhersage über die der Einzelmodelle anzuheben. Neben der Erkenntnis, dass auch Konsensmodelle durch die Optimierung auf einen zu speziellen Anwendungsfall in ihrer Robustheit beeinträchtigt werden können, liefert dieser Teil auch zuverlässige Konzepte für übertragbare Modelle. Insgesamt liefert die Arbeit ein tieferes Verständnis der Eigenschaften von translationalen Modellen, die anhand von an Zelllinien erworbenen Erkenntnissen die Therapieeffekte für Patienten vorhersagen. Der Einsatz des entwickelten Softwarepakets ermöglicht die systematische Analyse des gesamten Modellierungsworkflows und offenbart robuste Einstellungen, die im klinischen Alltag dazu dienen können zuverlässige Vorhersagen zu generieren. Insbesondere im Hinblick auf das Auslassen intermediärer Validierungsmethoden, wie zum Beispiel Tierversuchen, liefert die Arbeit somit leistungsfähige Ansätze, die die zukünftige Personalisierung von Therapieansätzen unterstützen können.

Identifikationsnummern

Downloads