스탠포드 AI가 단 한 번의 수면으로 130가지 이상의 질병을 예측할 수 있다

Stanford's SleepFM: 단 한 밤의 수면으로 건강 예측 열기

Stanford Medicine 연구진은 단 한 밤의 수면 데이터로 130개가 넘는 질병의 위험을 예측할 수 있는 획기적인 인공지능（artificial intelligence） 모델을 공개했습니다. 이 발전은 의료 AI에서 중요한 도약을 의미하며, 수면을 수동적 휴식의 시간이 아닌 장기 건강을 진단할 수 있는 풍부한 창으로 바꿉니다.

이 모델인 SleepFM은 기반 모델（foundation model） 아키텍처를 활용해 수면 분석의 골드 스탠다드인 수면다원검사（polysomnography）（PSG）에서 포착된 생리학적 신호를 분석합니다. 약 600,000시간에 달하는 보관 수면 데이터를 처리하면서, 이 AI는 심부전에서 치매 및 파킨슨병과 같은 신경학적 질환에 이르기까지 임상 증상이 나타나기 훨씬 이전에 상태를 예측하는 전례 없는 능력을 보여주었습니다.

수면 데이터의 미개척 잠재력

수십 년 동안, 수면다원검사는 수면 무호흡증이나 불면증 같은 수면 관련 질환을 진단하는 주요 도구였습니다. 검사 대상 환자는 클리닉에서 밤새 모니터링을 받으며, 뇌파(EEG), 심박동(ECG), 호흡 패턴, 안구운동, 근활동 등 다양한 생리 지표가 기록됩니다. 그러나 전통적인 분석 방법은 역사적으로 이 데이터의 많은 부분을 버리고, 수면 병리와 직접 관련된 특정 신호에만 집중해왔습니다.

Stanford 연구진은 버려진 이 데이터를 일반적인 생리학 정보의 “미개척 금광”으로 인식했습니다. 수면의학 교수이자 공동 책임 저자인 Emmanuel Mignot 박사(MD, PhD)는 수면 연구가 인간 생리의 독특한 스냅샷을 포착한다고 강조했습니다. Mignot에 따르면 이 데이터는 통제된 환경에서 연속적으로 수행된 8시간의 생물학적 모니터링을 나타내며, 짧은 임상 방문으로는 얻을 수 없는 깊은 통찰을 제공합니다.

이 잠재력을 활용하기 위해 연구팀은 SleepFM을 다중모달 기반 모델（multimodal foundation model）로 개발했습니다. 단일 작업을 위해 훈련된 전통적 AI 모델과 달리, 기반 모델은 GPT-4와 같은 대형 언어 모델（Large Language Models, LLMs）이 텍스트에서 학습하는 방식과 유사하게 방대한 데이터셋에서 광범위한 패턴을 학습하도록 설계됩니다. SleepFM은 1999년부터 2024년 사이에 수집된 약 65,000명의 개인과 거의 600,000시간에 달하는 생리 기록으로 훈련되었습니다.

"수면의 언어" 엔지니어링

SleepFM 개발에는 기계 학습에 대한 새로운 접근법이 필요했습니다. 이 모델은 단순히 알려진 질병 표지를 찾는 것이 아니라 수면 생리의 내적 “문법”을 학습합니다. 연구진은 "leave-one-out 대조 학습（leave-one-out contrastive learning）"이라는 기법을 사용했습니다. 이 과정에서 모델은 심박수 데이터처럼 한 생리 신호를 제거한 짧은 5초 분량의 수면 데이터 스니펫을 입력으로 받고, 남은 데이터 스트림을 기반으로 누락된 신호를 예측하도록 도전받습니다.

이 훈련 방법은 모델이 서로 다른 신체 시스템 간의 깊고 상호연결된 관계—뇌 활동의 변화가 심박수나 호흡의 변화와 어떻게 연관되는지—를 이해하도록 강제합니다. 모델이 이러한 내부 생리 관계를 숙달하면, 연구진은 이를 외부 건강 결과를 예측하도록 미세 조정했습니다.

수면 데이터를 동일 환자의 수십 년간 전자건강기록（electronic health records）과 연결함으로써, 팀은 특정 수면 패턴과 만성 질환의 이후 발병을 연관시킬 수 있었습니다. 그 결과 SleepFM은 사람 눈에 보이지 않는 미세하고 임상적 기준 아래의 질병 서명을 식별할 수 있음이 드러났습니다.

전례 없는 예측 정확도

SleepFM의 예측 능력은 종양학, 심장학, 신경학 등 다양한 의료 분야에 걸쳐 확장됩니다. Nature Medicine에 게재된 연구에서, 모델은 1,000개 이상의 질병 범주를 평가했고, 높은 정확도로 예측할 수 있는 130개의 특정 상태를 확인했습니다.

연구진은 모델 성능을 측정하기 위해 일치 지수（concordance index, C-index）를 사용했습니다. C-index가 0.8 이상이면 강한 예측 능력을 의미하며, 이는 모델이 두 환자 중 누가 질병에 걸릴 가능성이 더 높은지를 80%의 확률로 올바르게 식별할 수 있음을 뜻합니다. SleepFM은 수십 가지 심각한 상태에서 이 높은 기준을 달성했습니다.

다음 표는 몇몇 주요 질환에 대한 모델의 예측 성능을 요약한 것입니다:

**Disease Category	Specific Condition	C-Index Score**
Neurological	Parkinson's Disease	0.89
Neurological	Dementia	0.85
Oncology	Prostate Cancer	0.89
Oncology	Breast Cancer	0.87
Cardiovascular	Hypertensive Heart Disease	0.84
Cardiovascular	Myocardial Infarction (Heart Attack)	0.81
General Health	All-Cause Mortality	0.84

이 수치들은 SleepFM이 파킨슨병 및 치매와 같이 복잡한 전신적 퇴행과 관련된 상태의 위험을 식별하는 데 특히 능숙함을 시사합니다. 예를 들어 파킨슨병 예측에서의 높은 정확도는 REM 수면 행동장애（REM sleep behavior disorder）와 초기 신경퇴행 사이의 알려진 의학적 연관성과 일치합니다. 그러나 SleepFM은 이러한 패턴을 자동으로 감지하고 위험을 정밀하게 수치화합니다.

수면과 일반 의학 사이의 격차를 잇다

SleepFM의 함의는 수면 클리닉을 훨씬 넘습니다. 공동 책임 저자이자 생물의학 데이터 과학 부교수인 James Zou 박사(PhD)는 병리학과 심장학 같은 다른 의학 분야가 AI 통합을 상당히 경험한 반면, 수면 의학은 상대적으로 고립되어 왔다고 지적했습니다. SleepFM은 수면 데이터가 사실상 전반적인 건강의 대리 지표임을 보여줍니다.

이 모델의 가장 유망한 측면 중 하나는 다중모달 데이터 활용 능력입니다. 연구진은 뇌, 심장, 호흡 등 사용 가능한 모든 신호를 결합했을 때 가장 정확한 예측이 나온다는 것을 발견했습니다. 그러나 모델은 또한 서로 다른 질환들이 수면 데이터 안에 서로 다른 “지문”을 남긴다는 것을 보여주었습니다. 심혈관 질환은 심박수 및 ECG 신호로 가장 잘 예측되는 반면, 신경학적 질환은 뇌파 활동과 더 강하게 연관되어 있었습니다.

이러한 세분화는 예방 치료에 보다 개인화된 접근을 가능하게 합니다. 코골이 때문에 일상적인 수면 검사를 받는 환자가 심장병이나 암에 대한 위험 평가를 받아, 일반적으로 증상이 나타나기 훨씬 이전에 조기 검사와 개입을 받게 될 수 있습니다.

과제와 향후 방향

결과는 유망하지만, SleepFM을 임상 실무에 도입하는 데는 여러 장애물이 있습니다. 현재 모델은 환자의 몸에 수십 개의 센서를 부착하는 수면다원검사에서 제공되는 고충실도 데이터를 기반으로 합니다. 이러한 수준의 데이터 품질은 현재 전문 수면 연구실에서만 이용 가능합니다.

그러나 연구진은 이 기술을 소비자용 웨어러블에 적응시킬 가능성에 대해 낙관적입니다. 스마트워치와 수면 링이 더 정교해지면서 심박변동성이나 움직임과 같은 일부 PSG 채널에 근접한 데이터를 포착하기 시작했습니다. 만약 SleepFM의 버전이 웨어러블에서 나오는 더 시끄럽고 저해상도의 데이터로 작동하도록 적응할 수 있다면, 이러한 유형의 건강 예측 접근은 민주화될 수 있습니다.

또한 그러한 강력한 예측 기술의 윤리적·개인정보 보호 관련 문제들도 해결되어야 합니다. 수년 앞서 치매나 사망 위험이 높다고 예측하는 능력은 환자에게 어떻게 이 정보를 전달할지, 그리고 이것이 보험이나 고용에 어떤 영향을 미칠지에 관한 복잡한 질문을 제기합니다.

결론

SleepFM은 우리가 수면을 바라보는 방식에 패러다임 전환을 가져옵니다. 이는 우리의 야간 휴식이 단순히 의식의 중단이 아니라 전반적인 생물학적 건강을 반영하는 복잡한 생리 상태라는 가설을 입증합니다. 수면 속에 숨겨진 신호를 해독함으로써 스탠포드의 AI는 예방 의학의 새로운 영역을 열었고, 언젠가 좋은 숙면 한 번이 당신의 생명을 구할 수 있는 시대를 열었습니다.

기술이 성숙해짐에 따라 우리는 AI가 우리의 장래 건강을 보호하기 위해 우리가 생성하는 수동적 데이터를 분석하는 조용한 감시자로 작동하는 보다 전체론적 건강 모니터링 쪽으로의 이동을 보게 될 것입니다. 수면 데이터라는 “미개척 금광”은 마침내 발굴되고 있으며, 그 보물이 보건의료를 혁신할 수 있을 것입니다.