Bild: pexels (Karola G)

Krankheit schläft nicht: Wie Künstliche Intelligenz mehr als 130 Krankheiten erkennen soll

Wer schläft, ist weg. Zumindest fühlt es sich so an. Der Körper macht sein Programm, das Bewusstsein aber ist offline. Und am Morgen? Bleibt oft nur ein Eindruck: gut geschlafen – oder eben nicht. Genau diese Stunden, in denen der Mensch am wenigsten Kontrolle hat, könnten künftig zu einem medizinischen Frühwarnsystem werden.

Denn ein Forschungsteam der Stanford University berichtet, es habe eine Künstliche Intelligenz (KI) entwickelt, die aus den Messdaten einer einzigen Nacht im Schlaflabor das Risiko für mehr als 130 Erkrankungen abschätzen kann – Jahre bevor typische Symptome auftreten. Die Studie erschien Anfang Januar 2026 in der Fachzeitschrift Nature Medicine, begleitet von einer ausführlichen Einordnung der Universität Stanford.

Die Verheißung klingt groß: Früher erkennen, früher handeln, vielleicht Jahre gewinnen. Aber wie belastbar ist ein solches Versprechen – und was passiert, wenn eine Maschine sagt: „Du bist gefährdet“, lange bevor etwas wehtut?

Viele Daten bleiben ungenutzt

Um zu verstehen, worum es hier geht, muss man ins Schlaflabor. Dort wird bei einer sogenannten Polysomnografie gemessen, was der Körper nachts tut. Das Wort klingt zunächst technisch, meint aber einen sehr konkreten Vorgang: Während die Patientin oder der Patient schläft, zeichnen Sensoren gleichzeitig mehrere Körpersignale auf. Dazu gehören etwa die Aktivität des Gehirns, Augenbewegungen, Muskelspannung, Herzsignale sowie Atmungs- und Sauerstoffwerte. Am Ende entsteht ein Datensatz, der so reichhaltig ist wie unübersichtlich. In der medizinischen Praxis wird er häufig auf einzelne Fragestellungen reduziert – etwa, ob jemand an Schlafapnoe leidet oder wie sich der Schlaf auf Leicht-, Tief- und REM-Phasen verteilt. Vieles von dem, was die Messung ebenfalls enthält, bleibt ungenutzt, weil es schwer auszuwerten ist und sich Messaufbauten zwischen Schlaflaboren unterscheiden können.

Genau hier setzt das Stanford-Team an. Die Forschenden nennen ihr System „SleepFM“ und bezeichnen es als „Foundation Model“ für Schlafdaten. Hinter diesem Begriff steckt eine Idee, die man von großen Sprachmodellen kennt: Zuerst lernt eine KI an sehr vielen Daten allgemeine Muster – in diesem Fall nicht in Texten, sondern in Schlafsignalen – und kann später für unterschiedliche Aufgaben eingesetzt werden. SleepFM soll also nicht nur eine einzige Diagnose automatisieren, sondern den Schlaf in seiner Gesamtheit „verstehen“, um daraus Risiken abzuleiten.

Laut der in Nature Medicine veröffentlichten Arbeit wurde das Modell auf mehr als 585.000 Stunden Polysomnografie-Daten trainiert, die von rund 65.000 Personen stammen. Die Daten kommen aus mehreren Kohorten und Kliniken, unter anderem aus der Stanford Sleep Clinic sowie aus großen Studienpopulationen. Die Stanford-Kommunikation betont, dass Teile dieser Daten über sehr lange Zeiträume gesammelt wurden und in vielen Fällen mit Krankenakten verknüpft sind – teils mit einem Follow-up von Jahren bis Jahrzehnten. Das ist wichtig, denn nur so lässt sich prüfen, ob Muster im Schlaf tatsächlich mit späteren Erkrankungen zusammenhängen.

Genaue Analyse trotz fehlender Informationen

Ein zentraler Kniff des Modells ist, dass es mit unvollständigen oder unterschiedlich gemessenen Datensätzen umgehen können soll. In der Praxis ist das entscheidend: Nicht jedes Schlaflabor nutzt exakt dieselben Sensoren und Kanäle, und auch in großen Datensammlungen sind Messreihen oft lückenhaft. Deshalb wurde SleepFM so trainiert, dass es aus einem Teil der Signale auf andere schließen kann. Vereinfacht gesagt: Die KI lernt, wie die verschiedenen Körpersysteme im Schlaf typischerweise zusammenwirken, und wird dadurch weniger empfindlich, wenn einzelne Messungen fehlen oder anders aussehen.

Was bedeutet nun „vorhersagen“ in diesem Zusammenhang? SleepFM stellt keine Diagnose wie eine Ärztin oder ein Arzt. Stattdessen ordnet es Menschen auf einer Risikoskala ein: Wer hat, gemessen an den Schlafdaten, ein höheres Risiko, früher ein bestimmtes Ereignis zu erleben – und wer ein niedrigeres? In der Studie wird die Güte dieser Einordnung unter anderem mit dem sogenannten C-Index angegeben, einem statistischen Maß zwischen 0,5 und 1,0. Man kann sich das so vorstellen: Nimmt man zwei Personen, dann beschreibt der C-Index, wie häufig das Modell richtig liegt, wenn es einschätzt, wer von beiden früher erkrankt oder ein Ereignis erleidet. Ein Wert von 0,5 wäre Zufall, ein Wert von 1,0 wäre perfekt.

Die in der Studie berichteten Werte sind bemerkenswert hoch. Für Demenz wird ein C-Index um 0,85 genannt, für die Gesamtsterblichkeit etwa 0,84, für Herzinfarkt etwa 0,81 und für Herzinsuffizienz ungefähr 0,80. Auch für Schlaganfall und Vorhofflimmern werden Werte um 0,78 berichtet. In der begleitenden Stanford-Darstellung werden zudem weitere Beispiele angeführt, etwa sehr hohe Werte bei Parkinson und einzelnen Krebsarten. Der Kernpunkt bleibt: Aus einer einzigen Nacht sollen sich bei vielen Erkrankungen Risiko-Signaturen herauslesen lassen, die medizinisch relevant sind – und das in einem Umfang, der deutlich über klassische Schlafdiagnostik hinausgeht.

Schlaf als Ursachenerkennung

Warum ausgerechnet Schlaf so viel verraten könnte, erklären die Forschenden mit der besonderen Rolle dieser Phase. Schlaf ist kein „Ausknopf“, sondern ein Zustand, in dem viele Systeme gleichzeitig reguliert werden: Das Gehirn organisiert Prozesse der Verarbeitung, das Herz-Kreislauf-System passt sich an, Atmung und Sauerstoffversorgung verändern sich, und der Körper steuert Hormone, Stressreaktionen und Entzündungsprozesse. Entsprechend, so die Argumentation, könnten sich frühe Störungen nicht nur in einem einzelnen Signal zeigen, sondern gerade in der Art, wie Signale zusammenpassen – oder eben nicht. Die Stanford-Erklärung greift dafür das Bild auf, dass Körpersysteme „aus dem Takt“ geraten können. Wenn etwa Gehirn- und Herzsignale nicht mehr so synchron wirken wie gewöhnlich, könnte das ein Hinweis darauf sein, dass im Körper etwas nicht stimmt – lange bevor es klinisch auffällt.

Wenn die Ergebnisse sich in weiteren Studien bestätigen, wäre das ein Schritt in Richtung nicht-invasiver Früherkennung. Polysomnografie ist zwar aufwendig, aber sie kommt ohne Strahlung und ohne Eingriffe aus, und sie wird bereits heute in großer Zahl durchgeführt. Denkbar wäre, dass Schlafdaten künftig nicht nur zur Abklärung von Schnarchen oder Atemaussetzern dienen, sondern auch als Fenster in die allgemeine Gesundheit. Die Forschenden sprechen zudem davon, dass ein nächster Schritt darin bestehen könnte, das Konzept auf alltagstauglichere Messungen zu übertragen – etwa auf Daten aus Wearables, also Uhren oder Sensoren, die Herzfrequenz, Atmung oder Bewegung über Nacht aufzeichnen. Der Weg dahin ist allerdings lang, weil Wearables nicht annähernd die Tiefe einer Polysomnografie erreichen.

Auswertungen aus dem Schlaflabor sind nicht repräsentativ für alle Menschen

So beeindruckend die Zahlen klingen: Es gibt auch Gründe zur Vorsicht. Ein wesentlicher Punkt ist die Frage, für wen die Ergebnisse gelten. Schlaflabor-Kohorten sind nicht automatisch repräsentativ für die Allgemeinbevölkerung. Viele Menschen landen im Schlaflabor, weil sie bereits Beschwerden oder Vorerkrankungen haben. Das kann die Vorhersagen verzerren – und es kann bedeuten, dass die KI außerhalb dieser Populationen weniger zuverlässig ist. Genau deshalb betonen die Autorinnen und Autoren zwar die gute Generalisierbarkeit über mehrere Datensätze hinweg, aber die entscheidende Prüfung wird sein, ob das System in der breiten Versorgung und in unterschiedlichen Gesundheitssystemen ähnlich zuverlässig funktioniert.

Hinzu kommt eine psychologische und gesellschaftliche Dimension: Ein Risikowert ist keine Diagnose, aber er kann sich wie eine anfühlen. Was macht es mit Menschen, wenn sie erfahren, dass eine KI in ihrem Schlaf ein erhöhtes Demenz- oder Herzinfarktrisiko sieht? Welche Beratung braucht es, damit solche Informationen nicht verunsichern, sondern helfen? Und wer trägt Verantwortung, wenn ein Modell warnt, die Medizin aber (noch) nichts Konkretes tun kann? Auch darüber wird man sprechen müssen, wenn aus Forschungsresultaten klinische Anwendungen werden sollen.

Über Mario Landauer

Avatar-FotoMario Landauer wurde 1991 in Schweinfurt geboren und ist mittlerweile in Mittelfranken beheimatet. Als Journalist beschäftigt er sich täglich mit den verschiedensten Themen, vom hiesigen Kaninchenzüchterverein hin zu Skandalen oder schwerwiegenden Unfällen. Am liebsten jedoch schreibt er Porträts oder Reportagen, die, wie er sagt, "sehr nahe am Menschen sind".