作為識別和確定蛋白質(zhì)結(jié)構(gòu)的一種手段,人工智能 (AI) 越來越強大。例如,它不再局限于蛋白質(zhì)單體的研究。它開始采用蛋白質(zhì)復合物。然而,與真核生物相比,人工智能更擅長模擬原核生物中的蛋白質(zhì)復合物。為什么?因為當人工智能試圖識別可能相互作用的蛋白質(zhì)對時,如果進化信息可用,它會表現(xiàn)得更好,而且很多。原核生物當然就是這種情況。
原核物種的數(shù)量遠遠超過真核物種。因此,對于原核物種,有更多的機會來檢測共同進化的蛋白質(zhì)。考慮兩個蛋白質(zhì)復合物的情況。據(jù)推測,這種復合體中的每個蛋白質(zhì)都必須有一個相互作用域來補充另一個蛋白質(zhì)中的相互作用域——任何影響一個蛋白質(zhì)相互作用域的突變都必須伴隨著影響另一個蛋白質(zhì)相互作用域的突變。否則,蛋白質(zhì)最終將停止相互作用。
除了原核物種的絕對數(shù)量之外,還有其他因素可以簡化原核蛋白質(zhì)復合物的分析。例如,在原核生物中,蛋白質(zhì)較少,可變剪接和基因組復制輪次是非典型的。這些因素減少了科學家在嘗試以計算方式模擬原核蛋白質(zhì)復合物時必須處理的“噪音”。
盡管真核蛋白質(zhì)復合物的計算分析更具挑戰(zhàn)性,但華盛頓大學蛋白質(zhì)設(shè)計研究所和德克薩斯大學西南醫(yī)學中心的研究人員并沒有氣餒。他們決定使用兩種基于深度學習的結(jié)構(gòu)預測方法 RoseTTAFold 和 AlphaFold 來應對計算挑戰(zhàn)。華盛頓大學發(fā)明的 RoseTTAFold 用于計算蛋白質(zhì)對的接觸概率。AlphaFold 由 Alphabet 子公司 DeepMind 發(fā)明,用于重新評估交互概率和建模復雜結(jié)構(gòu)。
通過利用蛋白質(zhì)組范圍的氨基酸協(xié)同進化分析和基于深度學習的結(jié)構(gòu)建模,科學家們系統(tǒng)地識別并構(gòu)建了釀酒酵母蛋白質(zhì)組中核心真核蛋白質(zhì)復合物的準確模型。科學家們在11 月 11 日發(fā)表在《科學》雜志上的一篇文章(“核心真核蛋白質(zhì)復合物的計算結(jié)構(gòu)”)中詳細介紹了這項工作。
“[我們篩選]了 830 萬對酵母蛋白的配對多重序列比對,”該文章的作者寫道。“[我們確定] 1,505 個可能相互作用并為 106 個以前未識別的組件和 806 個尚未進行結(jié)構(gòu)表征的組件[構(gòu)建]結(jié)構(gòu)模型。這些復合體具有多達五個亞基,幾乎在真核細胞的所有關(guān)鍵過程中都發(fā)揮作用,并為生物學功能提供了廣泛的見解。”