
加州大學聖地牙哥分校(University of California San Diego)的生物學家與電腦科學家揭示了一款突破性的人工智慧工具,旨在改變聽力損失的研究方式。這款名為 VASCilia(Vision Analysis StereoCilia)的基於深度學習(deep learning)的系統,自動化耳蝸毛細胞(cochlear hair cells)的視覺化與量化,與傳統人工方法相比,將分析過程加速了 50 倍。
發表在 PLOS Biology 的研究說明,VASCilia 提供前所未有的立毛(stereocilia)三維視圖——立毛是位於內耳、負責感知聲音的微小突起束。透過先進的電腦視覺(computer vision),該工具解決了聽覺科學中的關鍵瓶頸,為基因療法(gene therapy)及聽力受損治療的更快速評估鋪路。
人類的耳蝸(cochlea)包含了對聽力至關重要的精細結構,特別是能將聲音振動轉換為神經訊號的毛細胞。這些細胞擁有必須精確排列才能發揮功能的立毛束;較長的毛檢測較低頻率,較短的毛則處理較高頻音。當這些束遭受噪音、老化或遺傳因素的損害時,就會發生聽力損失。
歷來,分析這些結構一直是耗費大量人力的挑戰。研究人員依賴對顯微影像的人工判讀來測量毛束的長度、方向與完整性。這個流程不僅耗時,還容易產生人為錯誤與不一致性。
Uri Manor,UC San Diego 細胞與發育生物學系助理教授,並擔任 Goeddel Family Technology Sandbox 的教務主任,強調了此創新的必要性。「了解立毛束如何隨時間或在暴露於某些環境壓力後變得鬆散,對聽力損失研究非常重要,」Manor 解釋道。「透過目視檢查,我們可以看到正常的束狀模式往往會瓦解……我們想要確切了解這是如何發生的。」
VASCilia 代表生物影像學的一大躍進。由博士後學者 Yasmin Kassim 與 Manor 教授領導的團隊開發,該工具使用五個不同的深度學習(deep learning)模型,這些模型在來自小鼠的專家註釋資料集上訓練而成。這些模型協同工作,簡化先前難以量化的細胞結構分析。
與標準 2D 影像不同,VASCilia 會重建三維資料。它能偵測細胞微小的錯位模式,並以機器精度測量細胞長度與方向等參數。
Yasmin Kassim,Schmidt AI 博士後研究員,強調了效率的提升:「我們已將分析這些細胞長度所需的時間縮短 50 倍,使得許多額外的 2D 與 3D 定量測量能在數分鐘內取得——這些工作否則需要數年的人工作業。」
下表說明了傳統手動分析與新 VASCilia 工作流程在操作上的差異:
| 特徵 | 手動分析 | VASCilia AI 工具 |
|---|---|---|
| 處理速度 | 極為緩慢(大型資料集需數年) | 快速(複雜分析需數分鐘) |
| 維度 | 主要為 2D | 完整 3D 視覺化 |
| 一致性 | 受限於人為變異 | 高機器層級一致性 |
| 可擴展性 | 受勞動工時限制 | 非常可擴展,適用於大型資料集 |
| 模式偵測 | 僅能偵測明顯的結構性破壞 | 偵測細微的錯位與方向性 |
VASCilia 帶來的加速不僅是學術上的;它對臨床治療,尤其是基因療法,具有直接影響。隨著科學家開發可逆轉毛細胞錯位或損傷的療法,他們需要工具來驗證這些療法在數千個細胞上的有效性。
Manor 指出,基因療法的興起是該計畫的主要動機之一。「有些天生失聰的孩童現在能夠聽見,這要歸功於基因療法,我們預期這類針對聽力損失的療法會持續增長,」他表示。「在基因療法實驗中,VASCilia 讓我們能測量所有細胞,並以非常一致且準確的方式對其進行量化。」
此能力讓研究人員能從定性觀察(例如:「細胞看起來較好」)邁向嚴謹的定量數據(例如:「95% 的細胞恢復到最佳方向」)。如此精確對於法規審核與臨床對新療法的信心至關重要。
為了惠及更廣泛的科學社群,UC San Diego 團隊已將 VASCilia 開放原始碼。研究人員期望促成一個全面的耳蝸毛細胞影像圖譜,作為全球聽覺科學的資源。
論文作者總結,此計畫將支持可適應不同物種、標記與影像尺度的基礎模型的開發。透過民主化取得這項高速分析工具,VASCilia 有望加速不僅是 UC San Diego,而是全球聽力研究社群的進展。
本計畫由 Chan Zuckerberg Initiative、National Science Foundation 與 National Institute on Deafness and Other Communication Disorders 支持,展現了將人工智慧與生物研究整合的變革性潛力。隨著 AI 持續精進科學家「看見」微觀世界的方式,治療感覺障礙的時間表可能會顯著縮短。