Google 與 Included Health 合作展開全國性 AI 虛擬醫療臨床研究

Google 與 Included Health 啟動具歷史意義的全美 AI 虛擬護理研究

在人工智慧融入主流醫學的關鍵舉措中，Google 宣佈與 Included Health 建立策略合作夥伴關係，啟動一項全美隨機對照試驗 (RCT)，評估對話式 AI 在現實世界虛擬護理場景中的表現。這次合作標誌著從理論模型和模擬測試的重大轉向，將前沿 AI 模型推向全美範圍內受監管的直接臨床工作流。

隨著醫療保健行業面臨醫生精疲力竭和可及性挑戰，該倡議代表了首批嘗試之一，旨在嚴格產生證據，說明專為醫療推理調整的大型語言模型 (LLMs) 在標準臨床條件下與真實患者互動時的表現。

超越「藝術的可能性」(Art of the Possible)

在過去的幾年裡，關於醫療 AI 的敘述一直由基準測試和受控模擬主導。Google 自身的研究，特別是關於其 AMIE (Articulate Medical Intelligence Explorer) 系統，證明了在與患者演員進行基於文本的諮詢時，AI 在診斷準確性和臨床態度（bedside manner）方面可以達到甚至超過初級照護醫生。然而，將這些「實驗室結果」轉化為實際醫療服務中混亂且不可預測的現實，需要不同水準的驗證。

這項新研究通過超越回顧性數據分析和模擬環境來填補這一空白。通過與 Included Health（一家擁有龐大虛擬護理足跡的美國領先醫療服務提供者）合作，Google 正在將其研究轉向一項前瞻性、經同意的全美隨機研究。

主要目標是評估對話式 AI 在管理患者互動時的實用性、安全性和影響。與以往專注於可行性的迭代不同，本研究旨在產生高品質的證據，將 AI 增強的工作流與標準臨床實踐進行比較。這種嚴格的方法反映了新藥物干預所使用的臨床試驗，為數位健康技術在廣泛部署前應如何進行驗證建立了新標準。

技術基礎：AMIE、PHA 與 Wayfinding

本研究評估的 AI 系統並非通用的聊天機器人；它們是多年來針對醫療智能不同方面進行專項研究的結晶。Google 圍繞三個核心支柱構建了其開發工作，這些支柱可能會在這次現實世界的應用中融合：

診斷與管理推理 (AMIE)： 這項基礎工作專注於醫療訪談本身。Google 的研究人員通過模擬自我博弈訓練系統進行病史採集並制定鑑別診斷。該系統旨在通過臨床指南和患者病史進行推理，規劃檢查和治療，而非僅僅檢索靜態資訊。
個人化健康洞察 (PHA)： 意識到健康很大程度上發生在診所之外，個人健康助手 (PHA) 研究探索了多模態模型如何解釋來自可穿戴設備的數據（如睡眠模式和活動指標），以充當健康教練和數據科學家。
導航健康資訊 (Wayfinding AI)： 這一流派專注於「導航」（Wayfinding）——通過主動的對話引導，帶領患者穿梭於複雜的醫療迷宮，確保用戶找到清晰、有根據且具可操作性的健康資訊。

通過綜合這些能力，該研究旨在評估一個不僅能診斷，還能以整體方式引導和管理患者健康旅程的 AI 系統。

定義新的證據標準

與 Included Health 的合作實現了以前無法達到的評估規模。該研究遵循「分階段方法」，這是一種獲得機構審查委員會 (IRB) 批准所必需的安全第一的方法論。

在這次全美啟動之前，Google 與貝斯以色列女執事醫療中心 (Beth Israel Deaconess Medical Center) 進行了單中心可行性研究。該特定階段旨在對安全協議進行壓力測試，衡量指標包括人類安全主管的中斷次數。隨著初始階段顯示出強烈的安全性跡象，研究現在正擴展到分佈式的全美群體。

下表概述了 Google 醫療 AI 研究的進展，突出了這一新階段的重要性：

Google 醫療 AI 研究階段比較

階段	場景	參與者	主要目標
基礎研究	模擬環境	患者演員與合成場景	展示「藝術的可能性」與診斷準確性
可行性研究	單中心 (Beth Israel)	有限的患者群體	驗證安全協議與主管中斷情況
全美 RCT	現實世界虛擬護理	經同意的真實患者（全國性）	評估實用性、結果與比較有效性

增強而非取代醫生

這項研究的一個關鍵組成部分是其人機協作（human-in-the-loop）設計。其敘述並非取代，而是增強。目標是確定 AI 是否能處理資訊收集、臨床推理和初步對話等繁重工作，從而「在真正重要的地方，將時間還給醫生與其患者」。

在虛擬護理環境中，臨床醫生通常在處理行政負擔的同時與患者互動，而一個能夠準確準備病例、建議鑑別診斷或起草管理計劃的 AI 可以從根本上提高效率。Included Health 的平台為此提供了理想的測試台，因為它已經為數百萬遠程獲取護理服務的會員提供服務。

如果研究證明 AI 可以安全有效地管理這些互動，它可能會開啟一個未來，無論患者身處何地，都能按需獲取高品質的醫療專業知識。AI 充當了有限的人類臨床醫生供應的效能倍增器。

對遠程醫療未來的意義

這項研究的結果可能會為未來十年醫療保健領域生成式 AI 的監管批准和行業採用定下基調。通過遵循隨機對照試驗的嚴格標準，Google 和 Included Health 正發出信號：在醫學領域，「足夠好」是不可接受的。

如果成功，此處收集的數據將驗證對話式 AI 的安全性和有用性，可能促成監管許可，使這些工具能夠獲得報銷並整合到標準保險計劃中。這代表了從 AI 作為新奇工具到 AI 作為臨床驗證醫療器械的轉變。

隨著研究的進行，業界將密切關注有關患者滿意度、錯誤率和臨床結果的數據。這次合作不僅僅是測試技術；它正在重寫數位時代醫療服務提供的藍圖。