手机免费看国产欧美精品_久久精品国产9久久综合_免费无码一区二区三区视频_亚洲综合精品一二三区在线

您的位置:首頁>科學>

深度強化學習框架可用于識別復(fù)雜網(wǎng)絡(luò)中的關(guān)鍵參與者

網(wǎng)絡(luò)科學是一個旨在揭示諸如電信,計算機,生物和社會網(wǎng)絡(luò)等網(wǎng)絡(luò)背后的結(jié)構(gòu)和動態(tài)的學術(shù)領(lǐng)域。近年來,網(wǎng)絡(luò)科學家一直試圖解決的基本問題之一是,確定最能影響網(wǎng)絡(luò)功能的最佳節(jié)點集(稱為關(guān)鍵參與者)。

確定主要參與者可能會極大地受益于許多實際應(yīng)用,例如,增強網(wǎng)絡(luò)免疫的技術(shù),以及輔助流行病控制,藥物設(shè)計和病毒營銷。然而,由于其具有NP難性,使用具有多項式時間復(fù)雜度的精確算法來解決此問題已證明具有很高的挑戰(zhàn)性。

中國國防科學技術(shù)大學,加利福尼亞大學洛杉磯分校(UCLA)和哈佛醫(yī)學院(HMS)的研究人員最近開發(fā)了一種名為FINDER的深度強化學習(DRL)框架,該框架可以識別復(fù)雜網(wǎng)絡(luò)中的關(guān)鍵參與者更有效率。他們的框架(在發(fā)表于《自然機器智能》上的一篇論文中介紹)中接受了由經(jīng)典網(wǎng)絡(luò)模型生成的一小套合成網(wǎng)絡(luò)的訓練,然后應(yīng)用于實際場景。

“這項工作是由網(wǎng)絡(luò)科學中的一個基本問題所激發(fā)的:我們?nèi)绾握业阶罴训年P(guān)鍵角色集,這些角色的激活(或移除)將最大程度地增強(或降低)網(wǎng)絡(luò)功能?”進行這項研究的高級研究人員之一劉養(yǎng)宇告訴TechXplore。“已經(jīng)提出了許多近似和啟發(fā)式策略來處理特定的應(yīng)用場景,但是我們?nèi)匀蝗狈σ粋€統(tǒng)一的框架來有效地解決這個問題。”

FINDER代表通過DEep強化學習在網(wǎng)絡(luò)中尋找關(guān)鍵參與者,它以最近開發(fā)的深度學習技術(shù)為基礎(chǔ),用于解決組合優(yōu)化問題。研究人員在由經(jīng)典網(wǎng)絡(luò)模型生成的大量小型合成網(wǎng)絡(luò)上對FINDER進行了培訓,并使用針對要解決的任務(wù)的獎勵函數(shù)來指導(dǎo)FINDER。該策略可指導(dǎo)FINDER根據(jù)其當前狀態(tài)(即當前網(wǎng)絡(luò)結(jié)構(gòu))確定在一段時間內(nèi)累積最大報酬應(yīng)采取的措施(即應(yīng)選擇的節(jié)點)。

參與這項研究的另一位資深研究員孫益州對《科學》雜志說:“在傳統(tǒng)的強化學習任務(wù)中,例如在機器人技術(shù)中,代表狀態(tài)和動作可能很簡單,而網(wǎng)絡(luò)并非如此。”“在進行該項目時,我們面臨的另一個挑戰(zhàn)是確定如何表示網(wǎng)絡(luò),因為它具有離散的數(shù)據(jù)結(jié)構(gòu)并且位于一個非常高的空間中。為解決此問題,我們擴展了當前的圖神經(jīng)網(wǎng)絡(luò)來表示節(jié)點(動作)和圖形(狀態(tài)),這是與強化學習任務(wù)共同學習的。”

為了有效地表示復(fù)雜的網(wǎng)絡(luò),研究人員共同確定了各個網(wǎng)絡(luò)狀態(tài)和動作的最佳表示,以及當網(wǎng)絡(luò)處于特定狀態(tài)時確定最佳動作的最佳策略。結(jié)果表示可以指導(dǎo)FINDER識別網(wǎng)絡(luò)中的關(guān)鍵參與者。

Sun,Liu及其同事設(shè)計的新框架具有很高的靈活性,因此只需更改其獎勵功能,就可以將其應(yīng)用于各種現(xiàn)實網(wǎng)絡(luò)的分析。它也非常有效,因為發(fā)現(xiàn)它在效率和速度方面都優(yōu)于許多以前確定網(wǎng)絡(luò)中關(guān)鍵參與者的策略。值得注意的是,可以輕松擴展FINDER以分析包含數(shù)千個甚至數(shù)百萬個節(jié)點的廣泛網(wǎng)絡(luò)。

“與現(xiàn)有技術(shù)相比,F(xiàn)INDER在尋找復(fù)雜網(wǎng)絡(luò)中關(guān)鍵參與者的有效性和效率上均取得了卓越的性能,” Liu說。“這代表了解決復(fù)雜的現(xiàn)實世界網(wǎng)絡(luò)上具有挑戰(zhàn)性的優(yōu)化問題的范式轉(zhuǎn)變。FINDER不需要領(lǐng)域特定知識,而只需真實網(wǎng)絡(luò)的程度異質(zhì)性,就可以通過在小型合成圖上進行離線自訓練一次來實現(xiàn)此目標,然后令人驚訝地將現(xiàn)實世界網(wǎng)絡(luò)的各個領(lǐng)域的規(guī)模都大大提高了。”

迄今為止,新的深層加固框架已取得了令人鼓舞的結(jié)果。將來,它可用于研究社交網(wǎng)絡(luò),電網(wǎng),傳染病的傳播以及許多其他類型的網(wǎng)絡(luò)。

Liu,Sun及其同事收集的發(fā)現(xiàn)強調(diào)了經(jīng)典網(wǎng)絡(luò)模型(如Barabási–Albert模型)的希望,并從中汲取了靈感。盡管簡單的模型可能看起來非?;A(chǔ),但實際上,它們通常捕獲了許多現(xiàn)實世界網(wǎng)絡(luò)的主要特征,即程度異質(zhì)性。當嘗試解決與復(fù)雜網(wǎng)絡(luò)有關(guān)的復(fù)雜優(yōu)化問題時,此功能可能具有巨大的價值。

“我的實驗室現(xiàn)在沿著相同的研究方向?qū)で蠖鄠€研究方向,包括:(1)設(shè)計更好的圖表示學習體系結(jié)構(gòu);(2)探索如何在不同圖甚至不同領(lǐng)域的圖之間傳遞知識;(3)研究圖上的其他NP難題,并從學習的角度解決它們。”

當Sun和她在UCLA的團隊計劃研究網(wǎng)絡(luò)科學研究的新技術(shù)時,Liu及其在HMS的團隊希望開始在真實生物網(wǎng)絡(luò)上測試FINDER。更具體地說,他們希望使用該框架來識別可能在人類健康和疾病中發(fā)揮關(guān)鍵作用的蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)和基因調(diào)控網(wǎng)絡(luò)中的關(guān)鍵參與者。

免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!