【天文物理】以人工智慧打造史上最大的星體資料庫

林彥興

如果你想知道全校學生的學習狀況,你會怎麼做呢?
也許你會找幾個學生,仔細的詢問他們對於課程安排、老師的特質、段考的題型......這些因素對於學生的學習有什麼影響,得到他們清晰而完整的想法。
但你也可以設計一份問卷發給全校所有學生,即使問卷能給你的答案往往不能像當面詢問學生一樣詳細,但卻可以得到全校所有學生整體的觀點,而不用擔心個別學生的偏差。

天文學家使用天文台的方式也與這個類似。
第一種(也許比較符合多數人的印象)是專注的拿望遠鏡盯著特定的目標,鉅細靡遺的觀測它的細節,研究特定天體的結構、組成等等。
第二種,則是將望遠鏡用於拍攝大面積的天空,然後像尋寶一樣,利用統計方法,在海量的資料中尋找擁有科學價值的寶藏。比如星系在宇宙中如何分佈、是紅色的星系多還是藍色的星系多......等等。這樣的拍攝方式,被稱為「巡天 Survey」。世界各地大大小小的巡天計畫琳琅滿目且各有所長,比如在星系天文學領域名聞遐邇的「史隆數位巡天 SDSS」;用於追蹤近地小天體的「卡特林娜巡天計畫 CSS」;善於即時觀測星體亮度變化的「史維基瞬變設備 ZTF」等等。

本次的主角「泛星計畫 Pan-STARRS」團隊正是世界上眾多的巡天計畫之一。泛星計畫全名「全景巡天望遠鏡和快速回應系統」,是由夏威夷大學主導的巡天計畫。它的其中一項重要任務,是像個哨兵一般,藉由頻繁的拍攝大面積的夜空,尋找並監控地球附近危險的「近地天體 NEO」,比如小行星、彗星等等。讓天文學家及早發現可能撞擊地球的危險天體,提供人類足夠的準備時間。

但除了行星防禦之外,泛星計畫產出的大量影像也相當具有科學價值。從 2010 年到 2014 年,它們利用夏威夷哈萊亞卡拉火山山頂一座口徑 1.8 公尺、名為「PS1」的望遠鏡,搭配一個 14 億像素的相機「GPC1」,以「g, r, i, z, y」五種濾鏡 [1],拍攝了全天空 3/4 的面積[2]。
PS1 所拍攝的夜空合成影像。Credit: R. White (STScI) and the PS1 Science Consortium

然而,光有照片還不夠。天文學家想要辨別影像中每一個亮點,到底是哪一種天體(恆星、星系、還是類星體?)以及這些天體的紅移,以此將一張張的「影像」轉化成一個包含每個天體的位置、類型、紅移等諸多資料的「目錄」,才方便進行更深入的研究。但整片星空中的天體如此之多(數十億個以上),用人工來分辨它們恐怕得做到天荒地老,而且準確度欠佳。過去,天文學家會設計各種複雜的軟體,利用光點的大小與不同波段影像的比較進行判斷,但這些方法仍有相當的進步空間。
一張泛星計畫拍攝的影像。你分得出照片中哪些亮點是恆星、星系或是類星體嗎?
Image taken from PanSTARRS-1 archive. An i band image cut at 12:36:49.4 +62:12:58.

這就是人工智慧/機器學習進場的時候啦!早在 2000 年代末,天文學家就開始嘗試利用機器學習進行類似的工作,經過十多年的發展,現在機器學習已經表現得比許多傳統的方法更好。而在這次的研究中,夏威夷大學的天文學家們正是使用了機器學習的方法,來將泛星計畫拍攝的資料轉化成目錄。它們首先將過去其他天文學家已經分類好的資料作為範本,用於訓練人工智慧。然後訓練完成的人工智慧,就能快速而正確的從泛星計畫的觀測資料中識別出星體的類型,並計算他們的紅移,製成目錄。最終的成品一共包含了 2,902,054,648 個天體,打破老前輩 SDSS 的紀錄。而這些海量的資料,將會幫助其他天文學家,繼續攻克宇宙的奧秘。

註解
[1] 《什麼是天體真實的顏色?》科學 Online
[2] 精確的說,泛星計畫第一期的巡天可以分為 3 Pi Survey (佔56%的時間)、Medium Deep Survey(佔25%的時間)、搜尋潛在威脅天體(約佔8%的時間)三個大項目*。而本次介紹的目錄中所使用的,正是 3 Pi Survey 的資料。

延伸閱讀
原始論文
Astronomers produce largest 3-D catalog of galaxies
Pan-STARRS1 data archive home page

Acknowledgment
Huge thanks to Hsu Yun-Hsin and Huang Yu-Hsiu for reviewing this article.

留言