Ausgehend von den bereits in der Vergangenheit gezeigten Assoziationen des fäkalen Mikrobioms (Fusobacterium spp.) mit gastrointestinalem Krebs sowie zwischen humanen Papillomaviren (HPV) und Kopf- und Halstumoren hat eine internationale Forschergruppe sich der Fragestellung nun erneut gewidmet. Zu diesem Zweck wurden über 18.000 Proben von unbehandelten Patienten (n = 10.418) mit insgesamt 33 verschiedenen Krebsarten aus dem Cancer Genome Atlas auf eine mikrobielle Beteiligung hin untersucht. Bei der Reevaluation der Genom- und Transkriptomsequenzen wurden insgesamt 7,2 % als nichtmenschlich identifiziert. Von diesen wiederum wurden 35,2 % als bakteriell und viral klassifiziert. Mit Maschinellem Lernen, einem Bereich aus der Künstlichen Intelligenz, hat das Forscherteam es geschafft, anhand der mikrobiellen Sequenzen aus Blut- und Gewebeproben verschiedene Krebsarten und frühe Krebsstadien (I a – II c) voneinander zu unterscheiden. Fortgeschrittene Stadien hingegen werden weniger gut identifiziert. Auch nach mehreren Bereinigungen der Daten, um mögliche Kontaminationen weitestgehend auszuschließen, waren die Ergebnisse weiterhin bedeutsam. Die Ergebnisse implizieren, dass Mikrobiomprofile für verschiedene Krebsarten einmalig sind und sich allein durch die entwickelten Modelle des Maschinellen Lernens voneinander unterscheiden lassen.
Der prädiktive Wert des durchs Maschinelle Lernen entwickelten Modells der mikrobiellen Sequenzen war dabei sehr hoch. Um die Relevanz der Daten im klinischen Setting zu testen, sollte zwischen gesunden (n = 69) und krebskranken (n = 100; davon n = 59 Prostatakrebs, n = 25 Lungenkrebs und n = 16 Melanome) Patienten mit High-Grade-Tumoren im Stadium 3 und 4 anhand der aus Plasma gewonnenen mikrobiellen Nukleinsäuren unterschieden werden. Die Ergebnisse waren beeindruckend. Im Vergleich zu den gesunden Kontrollproben wurden Patienten mit Prostatakrebs mit einer Sensitivität von fast 90 % und einer Spezifität von 85,5 % vom Modell erkannt. Lungenkrebs wurde mit einer Sensitivität von 86 % und einer Spezifität von 92,8 % identifiziert. Lediglich bei Melanomen war die Falsch-positiv Rate sehr hoch, und es konnte lediglich eine Sensitivität von 37,5 % bei einer Spezifität von 89,9 % erreicht werden. Auch war es durch das Modell möglich, zwischen den drei Krebsarten untereinander und im Vergleich zu den Kontrollproben zu unterscheiden. Diese Ergebnisse könnten zur Entwicklung von Assays zur Unterscheidung zwischen gesunden und krebskranken Patienten und auch zwischen verschiedenen Krebsarten führen. Diese Erkenntnisse eröffnen neue Ansätze in der Krebsbehandlung und -forschung.