
在一項將人工智慧應用於公共衛生的里程碑式研究中,研究人員開發出一種機器學習(machine learning)模型,能夠辨識出改善 185 個國家癌症存活率所需的精確政策槓桿。該研究發表於著名期刊 Annals of Oncology,標誌著由傳統描述性統計向「精準公共衛生(precision public health)」的重大轉變,為各國政府提供了一條以資料為基礎的路徑圖,以縮小全球癌症結果日益擴大的差距。
數十年來,全球健康界已知癌症存活率會因病患居住地而有顯著差異。然而,要準確指出造成差異的具體原因——超出一般經濟指標之外——一直難以捉摸。由 Memorial Sloan Kettering(MSK)癌症中心與 University of Texas at Austin 的研究人員領導的團隊,利用進階的機器學習演算法來分析來自世界衛生組織(WHO)、World Bank 與 Global Cancer Observatory(GLOBOCAN)的複雜資料集,成功繪製出塑造這些差異的隱性力量。
這項研究的影響遠超學術興趣。政策制定者首次能取得具國家特定差異的分析,明確區分哪些介入是有效的、哪些則影響較小。正如本研究共同領導者、MSK 的住院醫師 Dr. Edward Christopher Dee 所說,研究目標是建立一套可付諸行動的框架。「全球癌症結果差異甚大,很大程度上取決於各國的醫療體系差異,」Dee 醫師指出。「我們希望建立一個可執行、以資料為驅動的框架,協助各國辨認出最具影響力的政策槓桿,以降低癌症死亡率並縮小公平性的差距。」
這項突破的核心在於研究的方法論,該方法回應了線性統計模型常常無法捕捉的醫療系統複雜性。由第一作者 Milit Patel 領導的研究團隊,運用機器學習處理大量影響癌症照護的變數。
模型並非僅依賴原始死亡率,而是聚焦於死亡與發生比(Mortality-to-Incidence Ratio,MIR)。這個指標可作為評估一國癌症照護系統效能的穩健代理;MIR 越低代表診斷病例中導致死亡的比例越少,顯示治療品質與早期偵測能力較佳。
為了解析 AI 決策過程的「黑盒」,研究人員採用了 SHAP(Shapley Additive exPlanations)值。在可解釋的人工智慧(explainable AI,XAI)領域中,SHAP 值對量化各項特徵對模型預測的貢獻至關重要。這使團隊能夠分離出具體變數——例如放射治療中心密度、全民健康覆蓋(Universal Health Coverage,UHC)指數與自付費用(out-of-pocket expenditures)——並衡量它們在特定國家情境下對癌症存活率的精確影響。
「我們選擇使用機器學習模型,因為它們允許我們針對每個國家產生估計值與相關預測,」Patel 解釋道。這種細緻度非常重要,因為在高所得歐洲國家有效的政策,未必能在拉丁美洲或東南亞的發展中經濟體得到相同成效。
這項研究的發現打破了萬用健康政策的做法。透過分析 185 國的資料,AI 揭示出癌症存活的驅動因素高度情境化。雖然經濟實力通常與較佳結果相關,但財富轉化為存活率的具體機制在跨國之間差異極大。
例如,在某些國家,主要瓶頸是實體基礎設施,例如放射治療機器的數量;在其他國家,基礎設施雖具備,卻因財務障礙阻礙病患使用。AI 模型透過將因素分類為「綠色欄」(與改善結果有強烈正向關聯)與「紅色欄」(目前對存活差異影響較小的領域),來凸顯這些細微差別。
下表彙整了 AI 模型為部分國家識別出的主要驅動因素與挑戰,說明全球癌症照護需求的多樣性:
Table: AI-Identified Drivers of Cancer Survival by Nation
| Country | Primary Drivers of Survival (Green Factors) | Key Challenges & Context |
|---|---|---|
| Brazil | 全民健康覆蓋(Universal Health Coverage, UHC) 模型指出擴大 UHC 是改善巴西 MIR 的最有力單一槓桿。 |
人力密度 像是護理師與助產士的人數等因素,目前與立即性的存活率提升相比,關聯較小。 |
| Poland | 放射治療可及性 放射腫瘤服務的可得性是關鍵決定因素。 人均 GDP(GDP per Capita) 經濟穩定性在保險擴展之外也扮演重要角色。 |
一般衛生支出 單純增加一般支出,效果較針對性的保險與專科照護可及性改善為有限。 |
| China | 基礎設施成長 放射治療中心的可及性與上升中的 GDP 是近期改善的強力驅動因子。 |
財務毒性(Financial Toxicity) 高額自付費用仍是關鍵障礙,限縮了實體基礎設施改善的成效。 |
| Japan | 放射治療密度 可用治療中心的總量是預測日本優良結果的最強指標。 |
系統性飽和 由於基線照護已高,邊際收益來自維持高科技基礎設施密度。 |
| USA / UK | 經濟因素 人均 GDP 與廣泛的經濟實力是主要預測因子。 |
成本效率 儘管支出高,模型顯示經濟因素在解釋變異時比特定人力指標權重大。 |
這項研究最具說服力的面向之一,是其在資源有限環境中指引資源配置的潛力。模型中「綠色」與「紅色」因素的區分,為衛生部長們提供了一個優先事項清單。
以中國為例,資料呈現出典型快速發展經濟體的複雜悖論。該國在健康資金與基礎設施方面已有大幅改善,然而 AI 模型仍將「自付費用(out-of-pocket spending)」標示為持續的問題。研究人員觀察到,病患的高額直接成本成為達到最佳癌症結果的「關鍵障礙」。這意味著對中國來說,若未同步推行能使醫療負擔得起的財務保護改革,單純增加醫院數目可能會出現邊際回報遞減的情形。
相反地,在巴西,資料明確指向全民健康覆蓋(UHC)為優先事項。雖然增加專科醫療人員通常有益,但模型顯示,在巴西這一特定的衛生體系發展階段,透過 UHC 確保廣泛可及現有體系,將比微幅提高護理師與病人比更能挽救生命。
Patel 先生也提醒不要誤解那些「紅色欄」——影響分數較低的因素。「紅色欄並不表示這些領域不重要或應被忽視,」他闡明道。「相反,它們反映了根據模型與目前資料,這些領域目前較不可能解釋出最大的結果差異。」這一細微之處對於詮釋至關重要;它意謂著一旦主要瓶頸(綠色欄)被解決,次要因素的相對重要性可能會上升。
雖然該研究代表了一項技術躍進,作者也承認使用全球資料集所固有的限制。分析依賴國家層級的彙總資料,而非個別病患紀錄,意即它能捕捉體系性趨勢,但可能遺漏大型國家內部的地方性細微差異。此外,資料品質差異顯著;來自低收入國家的「地面實況」資料,可能不如全球北方既有登記資料的可靠度高。
然而,採用透明的 AI 模型有助於透過揭示不確定性與變數貢獻來降低部分風險。這項研究作為「精準公共衛生(precision public health)」的概念驗證——一門讓大數據與機器學習匯聚,並以個人化醫療相同的精準度來訂製健康介入措施的學科。
隨著全球癌症負擔持續增長——預計到 2050 年將顯著上升——像這樣的網路型 AI 框架將變得不可或缺。它們提供一種在醫療預算複雜性中導航的方法,讓國家能超越政治上的憑感覺決策,朝向能以每一美元最大化存活率的證據導向策略邁進。
Dee 醫師的結論與人工智慧在醫療領域的更大使命互相呼應:「它把複雜的資料轉化為政策制定者可理解、可執行的建議,使精準公共衛生成為可能。」隨著這些模型的精進與資料品質的改善,AI 對於描繪人類健康隱性地形的能力將日益深化,並有可能透過指引我們走向正確的道路來拯救數百萬條生命。