
在一個劃時代的展示中,人工智慧(artificial intelligence)正重塑天體物理學──來自 European Space Agency(ESA)的研究人員成功識別了超過 800 個先前未記錄的宇宙異常現象。透過部署一個名為 AnomalyMatch 的嶄新 AI 工具,團隊在數天內快速處理了 35 年來來自 Hubble Space Telescope 的檔案資料,完成了人類天文學家手動檢視可能需數年才能完成的工作。這項發現不僅擴增了我們對奇特天體的目錄,也宣告了科學家們處理現代太空觀測站資料洪流的方法正在發生範式轉移。
Hubble Space Telescope 已經觀測宇宙超過三十年,累積了龐大的影像檔案。雖然天文學家已經仔細研究過特定目標,但龐大的資料量──包含近一億個來源──意味著無數天體異常仍然隱藏在眾多的 Hubble Legacy Archive 之中,肉眼難以察覺。
傳統的發現方法常仰賴機緣或針對已知現象的搜尋。然而,隨著資料量呈指數成長,人工檢視變得不可能。這正是 AnomalyMatch 所扮演的角色:一個以 AI 驅動的異常偵測框架,填補這個缺口。由 ESA 的天文學家 David O'Ryan 與 Pablo Gómez 開發,這個無監督學習(unsupervised learning)演算法的設計不是去尋找我們已知的事物,而是標記那些看起來「異常」的物件。
David O'Ryan,此研究發表在 Astronomy & Astrophysics 的第一作者,強調歷史資料的未被開發潛力:「來自 Hubble Space Telescope 的檔案觀測現在跨越 35 年,提供一個可能藏有天體物理異常的豐富資料集。」
不同於被訓練去辨識特定物件(例如貓、車或螺旋星系)的標準電腦視覺模型,AnomalyMatch 採用無監督學習。於監督式情境中,AI 會被餵入標記好的範例以學習要找的目標;而 AnomalyMatch 則學習資料集的統計「常態」,並識別離群值──那些與學習到的模式顯著偏離的物件。
這個系統的效率令人驚訝。研究人員指派 AI 掃描大約 1 億張影像切割(image cutouts) 自 Hubble 檔案。這個神經網路在不到三天內處理完這龐大資料集。
| Metric | Traditional Manual Inspection | AnomalyMatch AI Processing |
|---|---|---|
| Data Scope | 限定特定目標或小批次 | 整個 Hubble Legacy Archive(100M+ sources) |
| Processing Time | 完整檔案需數年或數十年 | 大約 2.5 天 |
| Detection Logic | 人類直覺或特定篩選器 | 統計離群偵測(無監督) |
| Bias | 偏向已知物件類型 | 無偏;標記任何數學上「罕見」的現象 |
| Scalability | 低;資料更多需更多人力 | 高;可隨運算能力擴展 |
在 AI 標記出一份潛在候選清單後,人為判讀再回歸。O'Ryan 與 Gómez 手動審查了前 1,400 個偵測結果以驗證它們的性質。結果顯示出現代 AI 精準度:其中 1,300 個物件被確認為真正的異常,而其中超過 800 個在科學文獻中從未被提及。
這 800 個新發現的物件代表了一場「宇宙怪異展」,包含許多稀有且具科學價值的現象。由於 AI 在尋找視覺不規則性,所捕捉到的項目涵蓋了多樣化且難以以標準分類歸類的結構。
其中最有價值的發現包含 86 個新的潛在重力透鏡(gravitational lenses)。當前景的大質量星系彎曲背景遙遠天體的光線時,就會產生弧線、環形或多重影像。這些透鏡是宇宙學家的重要工具,充當天然望遠鏡,使我們得以更深入觀測早期宇宙並繪製暗物質的分佈。
AI 成功識別出所謂的「水母星系(jellyfish galaxies)」,因其後方拖曳的氣體與恆星尾流如觸手而得名。這些結構形成於星系穿過星系團的高密度氣體時,導致其星際物質被剝離。研究這類物件有助於天文學家理解塑造星系演化的劇烈環境過程。
最常見的異常為正在合併的星系。這些混亂事件中,兩個或多個星系互相碰撞,會造出扭曲的形狀、潮汐尾以及恆星形成的爆發。雖然星系合併已為人所知,但發現如此大量未被記錄的案例,能提供更好的統計基礎來理解星系如何在宇宙時間尺度內成長。
在較奇特的發現中,有在我們銀河系內的邊緣觀測到的行星形成盤。這些充滿塵埃的盤會遮蔽中央恆星,常呈現一條暗線夾在兩側明亮星雲之間,看起來就像一個漢堡(hamburger)。這些對研究行星系統的誕生至關重要。
AnomalyMatch 的成功不僅僅是一項單次發現;它是天文學未來的概念驗證。即將到來的任務,例如 ESA 的 Euclid、NASA 的 Nancy Grace Roman Space Telescope 與 Vera C. Rubin Observatory,將產生遠超 Hubble 的資料規模。僅 Rubin Observatory 預計就會每夜擷取 20 TB 的資料。
若沒有像 AnomalyMatch 這類的 AI 工具,絕大多數資料將無法被分析。這項研究顯示,無監督深度學習可以成為可靠的「第一道濾網」,篩除 PB 等級的雜訊,呈現給科學家最具科學價值的候選項。
Key Implications for Future Research:
在 35 年資料中發現超過 800 個新的宇宙異常,凸顯了科學的一次關鍵演進:資料不再只是觀測的記錄,而是可供主動開採的資源。European Space Agency 的天文學家與 AnomalyMatch 演算法之間的合作,展現了人類與 AI 夥伴關係的力量。當我們站在天文學進入艾字節(exabyte)時代的邊緣,像 AnomalyMatch 這樣的工具將成為導航者,引導我們在群星的大海中尋找宇宙乾草堆中的針。
對科學社群而言,訊息很清楚:下一個重大发現可能不是來自新的望遠鏡,而是來自一個以舊影像為對象、能看見新細節的新演算法。