想象一下,星團(tuán)、星云和其他星際現(xiàn)象都是由計算機在無人監(jiān)督的情況下憑空生成的。這聽起來可能像是對未來全息技術(shù)的描述,但是愛丁堡大學(xué)感知研究所和天文學(xué)研究所的研究人員,就在人工智能的幫助下設(shè)計了這樣一個系統(tǒng)。
研究人員描述了一種人工智能模型,該模型能夠生成合成星系的高分辨率圖像,這些圖像遵循了真實的星系分布。
“21世紀(jì)的天文學(xué)發(fā)現(xiàn)自己擁有大量數(shù)據(jù),大部分?jǐn)?shù)據(jù)在捕獲時會被過濾掉,以節(jié)省內(nèi)存存儲,”他們寫道?!皩τ谏疃葘W(xué)習(xí)等現(xiàn)代技術(shù)來說,進(jìn)入這一領(lǐng)域的時機已經(jīng)成熟。星系在這類應(yīng)用中起了關(guān)鍵作用,我們探索了利用人工智能來生成星系圖像的可能性?!?
該團(tuán)隊機器學(xué)習(xí)架構(gòu)的核心是生成對抗性網(wǎng)絡(luò)(GAN)——由生成樣本的生成器和試圖區(qū)分生成樣本和真實樣本的鑒別器組成的兩部分神經(jīng)網(wǎng)絡(luò)。將GAN描述為AI算法中的“神童”并不夸張;它們被用來發(fā)現(xiàn)新藥,制作令人信服的漢堡和蝴蝶照片,甚至生成腦癌的人工掃描圖。
這一星系生成系統(tǒng)由兩個五層GANs組成:階段一GAN和階段二GAN。第一個生成低分辨率圖像(64x64像素),而第二個使用一種叫做超分辨率的技術(shù)將它們轉(zhuǎn)換成高分辨率圖像(128x128像素)。研究人員指出,在實際過程中,階段二GAN會自我填充缺失的像素,更加注重現(xiàn)實性而非準(zhǔn)確性。
為了“鼓勵”階段二GAN中的生成器生成類似于放大實像對應(yīng)物的合成星系圖像,該論文作者引入了一個“雙目標(biāo)函數(shù)”,該函數(shù)計算了分辨率增強圖像和實像之間的誤差標(biāo)準(zhǔn)。其結(jié)果是生成了大量保留星系“更稀有”特征的樣本,如旋臂。
研究人員使用英偉達(dá)GTX 1060 GPU在PC上訓(xùn)練人工智能系統(tǒng),并為其提供來自Galaxy Zoo 2數(shù)據(jù)集的恒星和行星體的全色圖像,Galaxy Zoo 2是一個眾包天文學(xué)項目。他們在評估結(jié)果時考慮了四個屬性:橢圓度,或偏離圓形度的程度;與水平面的仰角;總流量;以及半長軸(橢圓最長直徑的一半)的尺寸測量。
在論文的最后,研究人員寫道,該模型生成了非常類似真實星系“物理真實”的圖像。他們認(rèn)為,這一系統(tǒng)可以被用來擴(kuò)充真實樣本的數(shù)據(jù)庫,實際上這也是深度學(xué)習(xí)模型的數(shù)據(jù)源。
“能夠創(chuàng)建物理真實的星系圖像生成模型有許多實際用途,”他們寫道?!拔覀兊墓ぷ髡故玖薌AN架構(gòu)作為現(xiàn)代天文學(xué)寶貴工具的潛力。”