機(jī)器學(xué)習(xí)算法可以在幾分鐘內(nèi)擊敗世界上最困難的視頻游戲,并且比幾代物理學(xué)家的共同努力更快地解決復(fù)雜的方程式。但是傳統(tǒng)算法仍然很難在繁忙的街道上選擇停車標(biāo)志。
對象識別繼續(xù)阻礙機(jī)器學(xué)習(xí)的領(lǐng)域,特別是當(dāng)圖片是多維的和復(fù)雜的時,就像在高能物理實驗中粒子檢測器發(fā)生碰撞的那樣。但是,新型的神經(jīng)網(wǎng)絡(luò)正在幫助這些模型提高其模式識別能力,并且該技術(shù)可能很快會在粒子物理實驗中實施以優(yōu)化數(shù)據(jù)分析。
今年夏天,費(fèi)米實驗室的物理學(xué)家在將圖形神經(jīng)網(wǎng)絡(luò)嵌入到實驗系統(tǒng)中的努力方面取得了進(jìn)步??茖W(xué)家Lindsey Gray更新了軟件,使這些尖端算法可以部署在CERN的大型強(qiáng)子對撞機(jī)的數(shù)據(jù)上。這些網(wǎng)絡(luò)將首次被集成到粒子物理實驗中,以直接處理檢測器數(shù)據(jù)-打開水閘以大幅提高效率,這將為當(dāng)前和未來的檢測器提供更精確的見解。
格雷說:“一周前只是研究的一個對象,如今已成為一種廣泛使用的工具,可以改變我們分析粒子物理實驗數(shù)據(jù)的能力。”
他的工作最初側(cè)重于使用圖神經(jīng)網(wǎng)絡(luò)分析大型強(qiáng)子對撞機(jī)CMS實驗的數(shù)據(jù),該實驗是對撞機(jī)的四個主要粒子物理實驗之一。
程序員開發(fā)了神經(jīng)網(wǎng)絡(luò)以篩選大量數(shù)據(jù),以搜索特定的類別或數(shù)量,例如在擁擠的街道照片中的停車標(biāo)志。
正常的數(shù)碼照片實質(zhì)上是由紅色,綠色和藍(lán)色正方形像素組成的巨大網(wǎng)格。經(jīng)過訓(xùn)練以識別停車標(biāo)志的樣子后,經(jīng)典的神經(jīng)網(wǎng)絡(luò)會檢查整個像素塊,以查看是否存在目標(biāo)。但是,此方法效率不高,因為模型必須處理大量不相關(guān)的,混淆的數(shù)據(jù)。
計算機(jī)科學(xué)家開發(fā)了新型的神經(jīng)網(wǎng)絡(luò)來改善這一過程,但是算法仍然難以識別圖像中的對象,而不僅僅是二維正方形像素網(wǎng)格。
以分子為例。為了確定化學(xué)物質(zhì)是否有毒,化學(xué)家必須在分子內(nèi)定位某些特征,例如碳環(huán)和羧基。用X射線色譜儀拍攝的化學(xué)藥品照片會生成鍵合原子的3D圖像,每次查看時它們看起來都略有不同。
由于數(shù)據(jù)未存儲在正方形網(wǎng)格中,因此典型的神經(jīng)網(wǎng)絡(luò)很難學(xué)會識別有毒化合物。為了解決這個問題,化學(xué)家已經(jīng)開始采用一套新的神經(jīng)網(wǎng)絡(luò):圖神經(jīng)網(wǎng)絡(luò)或GNN。
與這些典型的神經(jīng)網(wǎng)絡(luò)不同,即使GNN不在二維網(wǎng)格中,它們也能夠分辨出哪些像素相互連接。通過利用數(shù)據(jù)“節(jié)點(diǎn)”之間的“邊緣”(在這種情況下,原子之間的鍵),這些機(jī)器學(xué)習(xí)模型可以更有效地識別所需的主題。
Gray的愿景是將這些模型及其增強(qiáng)的目標(biāo)識別功能簡化用于粒子碰撞的數(shù)據(jù)處理。
“借助圖譜神經(jīng)網(wǎng)絡(luò),您可以編寫一種更好的模式識別算法,以用于像粒子加速器數(shù)據(jù)這樣復(fù)雜的事物,因為它能夠查看所有輸入數(shù)據(jù)之間的關(guān)系,從而找到其中最相關(guān)的部分。信息,”他說。
Gray的研究重點(diǎn)是將GNN應(yīng)用于CMS檢測器的高粒度熱量計或HGCal。CMS每秒拍攝數(shù)十億張高能碰撞圖像,以尋找新粒子的證據(jù)。
量熱儀的一個挑戰(zhàn)是它收集了太多的數(shù)據(jù)(足夠每秒容納2000萬部iPhone的照片),由于存儲空間的限制,必須丟棄大部分?jǐn)?shù)據(jù)。HGCal的觸發(fā)系統(tǒng)必須在幾分之一秒的時間內(nèi)決定哪些數(shù)據(jù)有趣,應(yīng)該保存。其余的將被刪除。
“如果您有一個神經(jīng)網(wǎng)絡(luò),您可以對其進(jìn)行優(yōu)化以在一定時間內(nèi)運(yùn)行,那么您可以更可靠地做出這些決策。您不會錯過任何事情,也不會保留您真正不需要的東西”,另一位與Gray合作的Fermilab科學(xué)家Kevin Pedro說。
HGCal檢測器同時收集有關(guān)粒子相互作用的許多不同信息,這會產(chǎn)生一些非常復(fù)雜的圖像。
格雷說:“這些數(shù)據(jù)的形狀很怪異,它們之間有隨機(jī)的間隙,甚至還遠(yuǎn)未接近連續(xù)的正方形網(wǎng)格。” “這就是圖表出現(xiàn)的地方,因為它們使您可以跳過所有無意義的內(nèi)容。”
從理論上講,將訓(xùn)練GNN分析感興趣的像素之間的聯(lián)系,并能夠預(yù)測應(yīng)保存哪些圖像以及可以更高效,準(zhǔn)確地刪除哪些圖像。但是,由于此類神經(jīng)網(wǎng)絡(luò)對于粒子物理學(xué)是如此新奇,因此尚無法將其直接實現(xiàn)到觸發(fā)硬件中。
圖神經(jīng)網(wǎng)絡(luò)以另一種方式非常適合HGCal:HGCal的模塊是六邊形的,這種幾何形狀雖然與其他類型的神經(jīng)網(wǎng)絡(luò)不兼容,但可以與GNN很好地配合使用。
Fermilab首席信息官Liz Sexton-Kennedy說:“這就是使這個特殊項目取得突破的原因。” “這顯示了Kevin和Lindsey的獨(dú)創(chuàng)性:他們與設(shè)計量熱儀的同事緊密合作,并且利用他們在軟件中的獨(dú)特專業(yè)知識來進(jìn)一步擴(kuò)展實驗的功能。”
Gray還設(shè)法編寫了代碼,擴(kuò)展了PyTorch(一種廣泛使用的開源機(jī)器學(xué)習(xí)框架)的功能,以允許在世界各地的設(shè)備上遠(yuǎn)程運(yùn)行圖神經(jīng)網(wǎng)絡(luò)模型。
格雷說:“在此之前,建立模型然后部署它是非常笨拙和and回的。” “現(xiàn)在,它已經(jīng)可以正常工作了,您只需將數(shù)據(jù)發(fā)送到服務(wù)中,它就可以確定如何最好地執(zhí)行數(shù)據(jù),然后將輸出發(fā)送回給您。”
Gray和Pedro表示,他們希望LHC的Run 3在2021年恢復(fù)運(yùn)行時,圖神經(jīng)網(wǎng)絡(luò)能夠正常工作。這樣,可以在對撞機(jī)的高發(fā)光度升級之前對模型進(jìn)行訓(xùn)練和測試,其對撞機(jī)的增強(qiáng)的數(shù)據(jù)收集能力將使GNN成為可能。更有價值。
一旦網(wǎng)絡(luò)在一個地方啟動并運(yùn)行,讓它在實驗室中的其他實驗中工作應(yīng)該會容易得多。
格雷說:“您仍然可以將我們正在學(xué)習(xí)的有關(guān)HGCal中圖神經(jīng)網(wǎng)絡(luò)的所有相同內(nèi)容應(yīng)用于其他實驗中的其他檢測器。” “我們在高能物理中采用機(jī)器學(xué)習(xí)的速度還沒有接近飽和。人們將繼續(xù)尋找越來越多的方法來應(yīng)用它。”