
對於全球數以億計的患者來說,識別罕見疾病的過程通常被描述為「診斷艱辛歷程(Diagnostic Odyssey)」——這是一場由專科醫生就診、無定論測試和多年不確定性組成的艱苦馬拉松。本週發表在《自然》(Nature)雜誌上的一項突破性研究介紹了 DeepRare,這是一種新型人工智能(AI)系統,有望將這段旅程縮短至僅需幾分鐘。
由多學科研究團隊開發並在論文「AI 透過 DeepRare 系統成功診斷罕見疾病」中詳細介紹,這一 代理解型 AI 系統(Agentic AI systems) 代表了醫學診斷的範式轉移。與以往作為「黑盒子」運行的模型不同,DeepRare 利用大語言模型(Large Language Models,LLMs)不僅提供準確的診斷,還提供臨床醫生可以驗證的透明、可追溯的推理鏈。
罕見疾病在個體上並不常見,但群體規模巨大,全球估計影響 3 億人。人類臨床醫生面臨的核心挑戰是海量的信息;已知罕見疾病超過 7,000 種,沒有任何一位醫生能夠記住每種疾病複雜的症狀組合(表型)和遺傳標記(基因型)。
「目前的標準護理通常涉及一種可能持續 5 到 7 年的試錯法,」該研究的第一作者在隨附的《自然》新聞簡報中解釋道。「DeepRare 的設計旨在彌補龐大的醫學知識庫與患者具體且通常細微的臨床表現之間的差距。」
DeepRare 通過其複雜的「代理解(Agentic)」構架將自己與標準的醫學聊天機器人或生物信息學工具區分開來。該系統並非簡單地預測句子中的下一個單詞,而是作為一個由三個不同層級組成的推理引擎運行:
這種結構允許 DeepRare 處理多模態輸入(Multimodal inputs)——將患者的基因測序數據與非結構化臨床筆記和症狀列表相結合——以生成潛在診斷的排名列表。
《自然》研究中發佈的性能指標非常引人注目。研究人員在包含 6,401 個病例、涵蓋 2,919 種不同罕見疾病的八個多樣化數據集上對 DeepRare 進行了評估。
關鍵性能指標:
對於臨床採用來說,最關鍵的特徵或許是可追溯性(Traceability)。對於它建議的每一個診斷,DeepRare 都會生成一個有引文支持的推理鏈。在一項盲測評審中,臨床專家在 95.4% 的案例中同意該系統的邏輯路徑,這種可靠性水平為人類與 AI 協作的信任奠定了基礎。
下表說明了 DeepRare 如何改進當前的診斷方法:
| 特性 | 傳統臨床診斷 | 標準生物信息學工具(如 Exomiser) | DeepRare 代理解系統 |
|---|---|---|---|
| 主要輸入 | 臨床觀察與手動文獻檢索 | 結構化遺傳數據 (VCF) 與 HPO 術語 | 多模態:自由文本、HPO、VCF 與文獻 |
| 推理透明度 | 高(人類直覺/邏輯) | 低(基於分數的算法) | 高(帶有引文的可追溯推理鏈) |
| 知識更新 | 慢(依賴於醫生的教育) | 定期(軟件更新) | 實時(網絡規模檢索) |
| 成功率(表型) | 不定(罕見病例漏診率高) | 低(無基因匹配時無效) | 57.18%(卓越的症狀分析) |
| 形成假設的時間 | 數週至數年 | 數小時 | 幾分鐘 |
DeepRare 的潛在影響超出了高科技研究型醫院。通過將專家級的診斷能力封裝在軟件中,該系統可以使罕見疾病專業知識的獲取變得民主化。理論上,農村診所的全科醫生可以將患者的症狀描述和遺傳標記上傳到 DeepRare,並獲得通常需要遺傳學家小組才能提供的專業鑒別診斷。
在論文中突出顯示的一個案例研究中,該系統正確識別了一名經歷過多次無定論評估的患者患有 IV 型黏多醣症(Morquio 症候群 A 型)。DeepRare 分析了患者的步態異常、關節鬆弛和脊柱後凸,將其與 GALNS 基因中的特定基因突變進行交叉比對,並以高置信度標記了該診斷。
雖然結果令人振奮,但作者和《自然》評論員敦促在數據隱私和「人機協同」必要性方面保持謹慎。DeepRare 被設計為一個 臨床決策支持 系統(CDSS),旨在增強——而非取代——醫生。最終的診斷和治療方案仍由人類負責。
此外,此類系統的整合需要跨多樣化人群進行嚴格驗證,以確保 AI 不會繼承歷史醫學數據中存在的偏見。
隨著 Creati.ai 持續關注 AI 融入醫療保健的進程,DeepRare 脫穎而出,成為一個信號,表明該行業正從實驗性聊天機器人邁向強大的代理解系統,能夠解決複雜的生物學謎題。對於數百萬等待答案的家庭來說,這項技術的到來愈快愈好。