從材料科學(xué)和地球系統(tǒng)建模到量子信息科學(xué)和網(wǎng)絡(luò)安全,許多領(lǐng)域的專(zhuān)家進(jìn)行模擬并進(jìn)行實(shí)驗(yàn),以收集科學(xué)進(jìn)步所需的大量數(shù)據(jù)。但是從這些數(shù)據(jù)中收集有用的見(jiàn)識(shí)可能是一個(gè)挑戰(zhàn),特別是當(dāng)多個(gè)復(fù)雜變量影響研究結(jié)果時(shí)。
為了更好地分析所謂的多元數(shù)據(jù),能源部橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室的研究人員開(kāi)發(fā)了一種開(kāi)源的,可定制的可視化分析系統(tǒng),稱(chēng)為CrossVis。與傾向于集中于數(shù)值數(shù)據(jù)并提供結(jié)果的單一視覺(jué)表示的類(lèi)似工具不同,CrossVis會(huì)處理基于數(shù)值,分類(lèi)和基于圖像的數(shù)據(jù),同時(shí)提供這些數(shù)據(jù)和其他數(shù)據(jù)類(lèi)型的多個(gè)動(dòng)態(tài),協(xié)調(diào)視圖。
ORNL研究人員John Goodall,Junghoon Chae,Artem Trofimov和ORNL視覺(jué)信息科學(xué)與技術(shù)進(jìn)步實(shí)驗(yàn)室(VISTA)主任Chad Steed使CrossVis 在線(xiàn)可用,并發(fā)布了該系統(tǒng)在圖形和視覺(jué)計(jì)算方面的獨(dú)特功能。
Steed說(shuō):“ CrossVis是一站式商店,用于分析許多不同類(lèi)型的數(shù)據(jù),它揭示了不僅僅是兩個(gè)變量之間的關(guān)系。”
該工具的主視圖由平行坐標(biāo)圖或PCP組成,它是一種流行的信息可視化技術(shù)。PCP將數(shù)據(jù)表的列顯示為垂直軸,將其行顯示為折線(xiàn),折線(xiàn)是連接到軸的相互依賴(lài)的線(xiàn)段的鏈。在這種情況下,CrossVis界面超出了傳統(tǒng)PCP的范圍,以包含非自然數(shù)據(jù)和時(shí)間或基于時(shí)間的非數(shù)值數(shù)據(jù)。
此外,CrossVis還提供了散點(diǎn)圖,圖像窗格和其他補(bǔ)充主視圖的選項(xiàng),以幫助用戶(hù)識(shí)別異構(gòu),多變量數(shù)據(jù)中的關(guān)鍵模式和有趣的異常情況。為了縮小焦點(diǎn),用戶(hù)還可以選擇在所有視圖中同時(shí)突出顯示變量,生成新數(shù)據(jù)或輸入?yún)?shù)以過(guò)濾現(xiàn)有數(shù)據(jù)。
“以前,科學(xué)家必須使用單獨(dú)的程序來(lái)分析圖像數(shù)據(jù),數(shù)值數(shù)據(jù)和分類(lèi)數(shù)據(jù),然后手動(dòng)比較結(jié)果,” Steed說(shuō)。“ CrossVis使他們可以在一個(gè)框架內(nèi)完成所有這些步驟。”
該團(tuán)隊(duì)將系統(tǒng)應(yīng)用到ORNL納米相材料科學(xué)中心(CNMS)的研究人員領(lǐng)導(dǎo)的基因工程項(xiàng)目中,利用該系統(tǒng)分析分類(lèi)和圖像數(shù)據(jù)的能力,該項(xiàng)目涉及驗(yàn)證來(lái)自人工神經(jīng)網(wǎng)絡(luò)或人工神經(jīng)網(wǎng)絡(luò)的結(jié)果。掃描硅藻的電子顯微鏡圖像。硅藻是藻類(lèi)的一種,會(huì)產(chǎn)生堅(jiān)固的二氧化硅,可用于工業(yè)目的,包括藥物輸送和水過(guò)濾。
具體而言,CNMS小組對(duì)硅藻上的孔進(jìn)行了表征,以區(qū)分這些生物的未經(jīng)修飾的或野生的硅藻與基因修飾的形式。最終,這些見(jiàn)解可以幫助科學(xué)家優(yōu)化和模擬硅藻生物礦化作用,這是這些生物體用來(lái)生產(chǎn)二氧化硅的過(guò)程。
該團(tuán)隊(duì)使用CrossVis檢查了硅藻參數(shù)之間的關(guān)系,該工具的許多視圖揭示了這兩種類(lèi)別之間的細(xì)微差異。例如,研究人員確定,野生硅藻的毛孔要比改良的硅藻小,而修飾的對(duì)應(yīng)硅藻的毛孔要小得多。
Steed說(shuō):“人工神經(jīng)網(wǎng)絡(luò)自動(dòng)得出圖像分類(lèi),將毛孔識(shí)別為分離兩種類(lèi)型的硅藻的重要特征。” “但是,這些結(jié)果并不能清楚地說(shuō)明為什么該算法選擇采用這種方法對(duì)毛孔進(jìn)行分類(lèi),因此CrossVis使CNMS科學(xué)家能夠解釋和驗(yàn)證他們的發(fā)現(xiàn)。”
“沒(méi)有CrossVis,我們不會(huì)基于這些關(guān)鍵參數(shù)(即平均面積和毛孔密度)徹底了解如何區(qū)分野生和改良的硅藻圖像,”負(fù)責(zé)CNMS項(xiàng)目的ORNL研究人員Artem Trofimov補(bǔ)充說(shuō)。
為了在更大范圍內(nèi)證明CrossVis的價(jià)值,Stee和他的合作者還與ORNL領(lǐng)導(dǎo)的團(tuán)隊(duì)合作,開(kāi)發(fā)了能源百億分之一地球系統(tǒng)模型以幫助驗(yàn)證氣候建模技術(shù)。此外,該團(tuán)隊(duì)使用CrossVis驗(yàn)證了美國(guó)國(guó)家海洋與大氣管理局(National Oceanic and Atmospheric Administration)的大西洋颶風(fēng)數(shù)據(jù)庫(kù)中的數(shù)據(jù),該數(shù)據(jù)庫(kù)包含21列和超過(guò)50,000行的有關(guān)颶風(fēng)的位置,大小和其他特征的統(tǒng)計(jì)信息。
Steed說(shuō):“這是一個(gè)很好的用例,因?yàn)樗且粋€(gè)更大的數(shù)據(jù)集,具有更多變量。” “我們發(fā)現(xiàn)的模式可以確認(rèn)已知的颶風(fēng)條件,這表明CrossVis可以在更大范圍內(nèi)有效地驗(yàn)證實(shí)際結(jié)果。”
展望未來(lái),CrossVis團(tuán)隊(duì)旨在進(jìn)一步改善這一資源。例如,研究人員計(jì)劃擴(kuò)大CrossVis的規(guī)模,使其在高性能計(jì)算系統(tǒng)上運(yùn)行。借助ORNL的Summit之類(lèi)的超級(jí)計(jì)算機(jī)的處理能力,CrossVis可以更有效地完成復(fù)雜的計(jì)算。
通過(guò)結(jié)合自動(dòng)機(jī)器學(xué)習(xí)技術(shù),團(tuán)隊(duì)計(jì)劃更積極地捕獲用戶(hù)與數(shù)據(jù)的交互??茖W(xué)家將標(biāo)記數(shù)據(jù)樣本,然后內(nèi)置的人工智能算法將識(shí)別,標(biāo)記和編譯數(shù)據(jù)看不見(jiàn)的部分中的相似模式,從而使用戶(hù)能夠快速分析整個(gè)數(shù)據(jù)集并潛在地進(jìn)行意外發(fā)現(xiàn)。
Steed說(shuō):“如果您嘗試手動(dòng)整理颶風(fēng)數(shù)據(jù)集或氣候模擬數(shù)據(jù)之類(lèi)的數(shù)據(jù),則將需要一生。” “這種人機(jī)合作將領(lǐng)域?qū)<业膭?chuàng)造力和直覺(jué)與計(jì)算機(jī)的數(shù)據(jù)處理能力結(jié)合在一起,是進(jìn)行更有效的數(shù)據(jù)分析的關(guān)鍵。”