
在計算生物學與環境保護的一大躍進中,Google 宣布在將人工智慧(artificial intelligence)應用於基因體學(genomics)領域方面取得重大里程碑。透過與 Vertebrate Genomes Project(VGP)及 Earth BioGenome Project 的合作,Google 的人工智慧工具協助成功定序了 13 種瀕危物種的基因組(genomes)。這項計畫在對抗生物多樣性喪失方面具有關鍵意義,提供科學家精準的遺傳地圖,對於保育策略至關重要。
這項工作的緊迫性無可忽視。科學共識顯示,近一百萬種物種面臨滅絕威脅,保護地球生物遺產的時間窗口正在關閉。遺傳多樣性是大自然韌性的基礎;沒有對物種基因組的詳細了解,保育工作常常是在摸黑進行。藉由數位化這些脆弱動物的遺傳指令,研究人員可以更清楚了解其對疾病的易感性、對氣候變遷的適應能力,以及族群動態的複雜性。
Google 不僅提供了此項工作的技術力量,還投入了大量資金支援。Google.org 透過其 "AI for Science" 計畫向 The Rockefeller University 提供資金。這筆補助旨在大幅擴大專案規模,計畫再定序另外 150 種物種。關鍵在於,所有從這項大規模工作中產生的資料都將對全球科學界公開釋出,確保存取障礙不會妨礙 保育 工作。
基因組定序,尤其是複雜脊椎動物的基因組,涉及巨量的運算工作。這需要將數十億個 DNA 鹼基對拼湊成一個連貫且準確的序列。過去,這個流程成本高昂且耗時。然而,由 Google 開發的一套人工智慧驅動工具——特別是 DeepPolisher、DeepVariant 與 DeepConsensus——已經革新了這個流程。
DeepConsensus 在讀取 DNA 的初始階段運作,使用機器學習(machine learning)來修正定序儀器產生的原始資料錯誤。接著,DeepVariant 高精準度地識別遺傳變異,區分真實的生物訊號與定序噪音。這套工具最新的成員 DeepPolisher 在組裝的最後階段扮演關鍵角色。它透過修正剩餘錯誤來精煉基因組組裝,確保最終地圖達到「參考品質」— 這是進行深入科學分析所需的標準。
這些工具共同降低了基因組定序的成本與時間。過去人類基因體計畫(Human Genome Project)花費約 13 年與約 30 億美元,才能完成一個物種的定序;如今,對其他生物而言,這可以在數天內以更低的成本完成。這種效率是促成專案擴展至數百種物種,而非僅限少數的關鍵驅動力。
合作的初期階段聚焦於多樣化的動物,包括哺乳類、兩棲類與爬蟲類。每個物種在野外面臨的威脅各不相同,範圍從棲地喪失到氣候變遷與盜獵。透過定序它們的基因組,科學家得以獲得寶貴洞見,進而指導繁殖計畫與棲地管理。
下表列出了此次定序工作的部分物種,說明其保育現況與面臨的主要挑戰。
Table 1: Selected Endangered Species Sequenced with Google AI
| Species Name | Conservation Status | Primary Habitat | Key Conservation Challenge |
|---|---|---|---|
| Cotton-top tamarin | Critically Endangered | Northwest Colombia | Habitat fragmentation impacts seed dispersal role |
| Golden mantella frog | Endangered | Madagascar | Restricted to fragmented forest habitats |
| Grevy's zebra | Endangered | Kenya & Ethiopia | Substantial population reduction in recent decades |
| Nubian ibex | Vulnerable | Northeast Africa & Middle East | Dwindling populations in mountainous ranges |
| Elongated tortoise | Critically Endangered | South & Southeast Asia | Threatened by trade and habitat destruction |
| Hog deer | Endangered | South & Southeast Asia | Severe decline in genetic diversity |
| Eld's deer | Endangered | Southeast Asia | Inbreeding in managed populations requires genetic management |
| Golden lion tamarin | Endangered | Brazil (Atlantic Coast) | Requires intervention to prevent inbreeding |
| African penguin | Critically Endangered | South Africa & Namibia | Rapid decline in native coastal waters |
這次成功定序的 13 種物種,作為可行性的試驗,驗證了更大規模計畫的可行性。來自 Google.org 的新資金將促成再定序 150 種物種。這種擴展不只是數量上的增加;它代表了一項系統性努力,旨在於不可逆地喪失前捕捉地球生物多樣性的縮影。
該專案由 The Rockefeller University 的 Erich Jarvis 領導,他是 Vertebrate Genomes Project 的核心人物。這項合作強調生物研究與計算創新的共生關係。隨著已定序基因組資料庫的擴充,比較基因體學(comparative genomics)— 即研究不同物種基因組之間關係的領域 — 的潛力也隨之增加。這能揭示演化史並提供線索,說明不同生物如何在千百年中適應其環境。
對於像 Eld's deer 或 Golden lion tamarin 這類因近親繁殖而面臨重大存續威脅的物種,高品質的參考基因組可讓保育人員對繁殖配對做出有根據的決策。這種遺傳管理往往決定一個物種是走向滅絕還是回復到可持續族群水準。
此計畫最具代表性的面向之一是其對開放科學的承諾。在資料常被牢牢鎖在付費牆或專有限制背後的年代,Google 與其夥伴選擇將這些基因組免費釋出。資料民主化意味著,發展中國家的研究人員、大學學生或獨立保育工作者,都能存取與頂尖研究機構科學家相同的高品質遺傳資料。
"AI for Science" 基金反映了科技產業的一股更廣泛趨勢:將為商業應用開發的大量運算力與演算法進步,轉為用於公共善益。透過將這些工具與結果資料公開,該專案邀請全球協作。全球各地的研究人員可以分析這些資料,進而開發野生動物疾病的新疫苗、瞭解耐熱性的遺傳基礎,或單純地編目地球上的生物多樣性。
基因組定序從一項「登月式」的艱鉅任務演進為可擴展、標準化的作法,這證明了人工智慧技術迅速成熟的事實。包括 DeepVariant 與 DeepPolisher 在內的工具套件示範了經由大量資料訓練的機器學習模型,如何解決人類單靠傳統方法無法克服的問題。
在 Vertebrate Genomes Project 的脈絡下,最終目標令人震撼:定序所有已知的脊椎動物物種。儘管這仍屬長期願景,人工智慧所帶來的加速,使其成為一個可實現的現實,而非科幻。這些工具所降低的錯誤率,確保所產出的基因組不只是粗略草圖,而是詳細的藍圖。
隨著 Creati.ai 持續監測人工智慧的發展,此應用案例作為「為善用 AI(AI for Good)」的一個深具意義的示範。它已超越理論上的效率提升,並影響到真實世界,為與我們共享地球數千年的物種提供一條生命線。高效能運算、先進機器學習與生物保育的整合,宣告了一個新時代的到來:科技成為自然的守護者。