AI News

SleepFM de Stanford : Dévoiler des prévisions de santé à partir d'une seule nuit de sommeil

Des chercheurs de Stanford Medicine ont dévoilé un modèle révolutionnaire d'intelligence artificielle (artificial intelligence) capable de prédire le risque de plus de 130 maladies en utilisant les données d'une seule nuit de sommeil. Cette avancée marque un saut significatif dans l'IA médicale, transformant le sommeil d'une période de repos passif en une fenêtre diagnostique riche pour la santé à long terme.

Le modèle, connu sous le nom de SleepFM, s'appuie sur une architecture de modèle fondation (foundation model) pour analyser les signaux physiologiques capturés lors de la polysomnographie (polysomnography, PSG) — la référence pour l'analyse du sommeil. En traitant près de 600 000 heures de données de sommeil archivées, l'IA a démontré une capacité sans précédent à prévoir des affections allant de l'insuffisance cardiovasculaire (cardiovascular failure) aux troubles neurologiques tels que la démence (dementia) et la maladie de Parkinson (Parkinson's disease), souvent des années avant l'apparition des symptômes cliniques.

Le potentiel inexploité des données de sommeil

Depuis des décennies, polysomnographie a été l'outil principal pour diagnostiquer les troubles spécifiques du sommeil tels que l'apnée du sommeil ou l'insomnie. Les patients soumis à ces études sont surveillés toute la nuit dans une clinique, où des capteurs enregistrent une grande variété de mesures physiologiques, y compris les ondes cérébrales (EEG), les rythmes cardiaques (ECG), les schémas respiratoires, les mouvements oculaires et l'activité musculaire. Cependant, les méthodes d'analyse traditionnelles ont historiquement écarté une grande partie de ces données, ne se concentrant que sur les signaux spécifiques pertinents pour la pathologie du sommeil.

Les chercheurs de Stanford ont reconnu ces données écartées comme une « mine d'or inexploitable » d'informations physiologiques générales. Emmanuel Mignot, MD, PhD, professeur de médecine du sommeil à Stanford et coauteur principal de l'étude, a souligné que les études du sommeil capturent un instantané unique de la physiologie humaine. Selon Mignot, les données représentent huit heures de surveillance biologique continue dans un environnement contrôlé, offrant une profondeur d'informations que de brèves visites cliniques ne peuvent égaler.

Pour exploiter ce potentiel, l'équipe a développé SleepFM en tant que modèle fondation multimodal. Contrairement aux modèles d'IA traditionnels entraînés pour une seule tâche, les modèles fondation (foundation models) sont conçus pour apprendre des motifs généraux à partir de jeux de données massifs — de manière similaire à la façon dont les grands modèles de langage (Large Language Models, LLMs) comme GPT-4 apprennent à partir de textes. SleepFM a été entraîné sur un ensemble de données comprenant environ 65 000 individus et près de 600 000 heures d'enregistrements physiologiques collectés entre 1999 et 2024.

Ingénierie du « langage du sommeil »

Le développement de SleepFM a nécessité une approche nouvelle en apprentissage automatique. Le modèle ne se contente pas de rechercher des marqueurs connus de maladie ; il apprend plutôt la « grammaire » intrinsèque de la physiologie du sommeil. Les chercheurs ont employé une technique appelée « leave-one-out contrastive learning ». Dans ce processus, le modèle reçoit de courts extraits de cinq secondes de données de sommeil avec un signal physiologique supprimé (par exemple, les données de fréquence cardiaque sont masquées). L'IA est alors mise au défi de prédire le signal manquant à partir des flux de données restants.

Cette méthode d'entraînement oblige le modèle à comprendre les relations profondes et interconnectées entre différents systèmes corporels — comment un changement dans l'activité cérébrale pourrait se corréler avec une variation de la fréquence cardiaque ou de la respiration. Une fois que le modèle a maîtrisé ces relations physiologiques internes, les chercheurs l'ont affiné pour prédire des résultats de santé externes.

En reliant les données de sommeil aux dossiers de santé électroniques couvrant des décennies des mêmes patients, l'équipe a pu corréler des motifs de sommeil spécifiques avec le développement ultérieur de maladies chroniques. Les résultats ont révélé que SleepFM pouvait identifier des signatures subcliniques subtiles de maladies invisibles à l'œil nu.

Une précision prédictive sans précédent

La puissance prédictive de SleepFM s'étend à diverses catégories médicales, notamment l'oncologie, la cardiologie et la neurologie. Dans l'étude, publiée dans Nature Medicine, le modèle a évalué plus de 1 000 catégories de maladies et identifié 130 conditions spécifiques pouvant être prédites avec une grande précision.

Les chercheurs ont utilisé l'indice de concordance (C-index) pour mesurer les performances du modèle. Un C-index de 0.8 ou plus indique une forte capacité prédictive, ce qui signifie que le modèle peut identifier correctement lequel de deux patients est le plus susceptible de développer une maladie dans 80 % des cas. SleepFM a atteint ce seuil élevé pour des dizaines de conditions graves.

Le tableau suivant résume la performance prédictive du modèle pour plusieurs maladies clés :

**Catégorie de maladie Condition spécifique Score C-Index**
Neurologique maladie de Parkinson 0.89
Neurologique démence 0.85
Oncologie cancer de la prostate 0.89
Oncologie cancer du sein 0.87
Cardiovasculaire cardiopathie hypertensive 0.84
Cardiovasculaire infarctus du myocarde (Myocardial Infarction, Heart Attack) 0.81
Santé générale mortalité toutes causes confondues (All-Cause Mortality) 0.84

Ces chiffres suggèrent que SleepFM est particulièrement habile à identifier les risques de conditions impliquant une dégénérescence systémique complexe, telles que la maladie de Parkinson et la démence. Par exemple, la forte précision dans la prédiction de la maladie de Parkinson s'aligne sur la littérature médicale connue reliant les troubles du sommeil — spécifiquement le trouble du comportement en sommeil paradoxal (REM sleep behavior disorder) — à la neurodégénérescence précoce. Toutefois, SleepFM détecte automatiquement ces motifs et quantifie le risque avec précision.

Combler le fossé entre le sommeil et la médecine générale

Les implications de SleepFM dépassent largement la clinique du sommeil. James Zou, PhD, professeur associé en science des données biomédicales et coauteur principal, a noté que, alors que d'autres domaines de la médecine comme la pathologie et la cardiologie ont vu une intégration significative de l'IA, la médecine du sommeil est restée relativement compartimentée. SleepFM démontre que les données de sommeil constituent efficacement un proxy de la santé globale.

Un des aspects les plus prometteurs du modèle est sa capacité à utiliser des données multimodales. Les chercheurs ont constaté que la combinaison de tous les signaux disponibles — cerveau, cœur et respiration — produisait les prédictions les plus précises. Cependant, le modèle a également montré que différentes maladies laissent différentes « empreintes » dans les données de sommeil. Les affections cardiovasculaires étaient mieux prédites en utilisant la fréquence cardiaque et les signaux ECG, tandis que les troubles neurologiques étaient plus fortement liés à l'activité des ondes cérébrales.

Cette granularité permet une approche plus personnalisée des soins préventifs. Un patient réalisant une étude du sommeil de routine pour le ronflement pourrait potentiellement recevoir une évaluation du risque pour les maladies cardiaques ou le cancer, incitant à des dépistages et interventions précoces des années avant l'apparition habituelle des symptômes.

Défis et orientations futures

Bien que les résultats soient prometteurs, le déploiement de SleepFM en pratique clinique fait face à plusieurs obstacles. Le modèle actuel repose sur les données haute fidélité fournies par la polysomnographie, qui implique la fixation de dizaines de capteurs sur le corps du patient. Ce niveau de qualité de données n'est actuellement disponible que dans des laboratoires de sommeil spécialisés.

Cependant, les chercheurs sont optimistes quant au potentiel d'adaptation de cette technologie aux appareils grand public. À mesure que les montres connectées et les anneaux de sommeil deviennent plus sophistiqués, ils commencent à capturer des données qui approximativement correspondent à certains canaux d'un PSG, tels que la variabilité de la fréquence cardiaque et le mouvement. Si une version de SleepFM peut être adaptée pour fonctionner avec les données plus bruyantes et de résolution inférieure des wearables, cela pourrait démocratiser l'accès à ce type de prévision de santé.

De plus, les implications éthiques et de confidentialité d'une technologie prédictive aussi puissante doivent être abordées. La capacité à prédire un risque élevé de démence ou de mortalité des années à l'avance soulève des questions complexes sur la manière dont ces informations doivent être communiquées aux patients et sur leur impact potentiel sur l'assurance ou l'emploi.

Conclusion

SleepFM représente un changement de paradigme dans notre façon de considérer le sommeil. Il valide l'hypothèse selon laquelle notre repos nocturne n'est pas simplement une pause de la conscience, mais un état physiologique complexe qui reflète notre santé biologique globale. En décodant les signaux cachés du sommeil, l'IA de Stanford a ouvert une nouvelle frontière en médecine préventive, où une bonne nuit de sommeil pourrait un jour vous sauver la vie.

À mesure que la technologie mûrit, on peut s'attendre à un mouvement vers une surveillance de la santé plus holistique, où l'IA agit comme un sentinelle silencieuse, analysant les données passives que nous générons pour protéger notre bien-être futur. La « mine d'or inexploitable » des données de sommeil est enfin en cours d'extraction, et les trésors qu'elle recèle pourraient révolutionner les soins de santé.

Vedettes