5月9日,谷歌DeepMind和Isomorphic Labs聯(lián)合發(fā)布了最新預測蛋白質(zhì)等結(jié)構(gòu)的大模型——AlphaFold 3。
據(jù)悉,AlphaFold 3可以通過準確預測蛋白質(zhì)、DNA、RNA、配體等的結(jié)構(gòu)以及它們之間的相互作用,增強人類對新藥的發(fā)現(xiàn)方法與效率。
例如,用AlphaFold 3去預測新冠病毒(COVID-19)的刺突蛋白結(jié)構(gòu),深度解讀病毒與宿主細胞ACE2受體之間的相互作用關(guān)系。
醫(yī)療研究人員便能基于該結(jié)構(gòu)的完整信息快速開發(fā)一種小分子藥物,阻斷新冠與ACE2的結(jié)合,從而有效地阻止病毒的入侵、復制和傳播。再經(jīng)過多輪動物、臨床、人體的實驗,一款特效藥、疫苗就能快速誕生了。
所以,不少醫(yī)學領(lǐng)域的科學家對AlphaFold 3的評價非常高,認為AI也有機會去競爭醫(yī)學領(lǐng)域的諾貝爾獎。
目前,AlphaFold 3已經(jīng)免費提供在線使用,手稿論文已在全球頂級期刊《自然》上發(fā)布,稍后會推出編輯整理版。
論文地址:https://www.nature.com/articles/s41586-024-07487-w#citeas

谷歌表示,自AlphaFold系列模型發(fā)布以來,全球數(shù)百萬科研人員在其幫助下實現(xiàn)了多項技術(shù)突破,在瘧疾疫苗、癌癥治療和酶設(shè)計等獲得了大獎。
最新發(fā)布的AlphaFold 3是在2代模型基礎(chǔ)之上研發(fā)而成,并且使用了全新擴散模型、Pairformer等創(chuàng)新模塊,進一步增強對蛋白質(zhì)的預測準確率以及架構(gòu)解讀。
解讀AlphaFold 3創(chuàng)新模塊
從AlphaFold 3的論文來看,雖然AlphaFold 2在預測蛋白質(zhì)結(jié)構(gòu)方面已經(jīng)很優(yōu)秀,但研究人員為了進一步提升其準確率和泛化能力,在AlphaFold 3引入了生成式AI領(lǐng)域非常火的擴散模型。
使用擴散模型的好處是,可以直接在原始原子坐標上操作,而不需要依賴于氨基酸特定的框架或側(cè)鏈扭轉(zhuǎn)角度。這種直接預測原子坐標的方法有助于減少立體化學的損失。
其核心思想是將結(jié)構(gòu)預測問題轉(zhuǎn)化為一個逆向過程,從帶有噪聲的坐標中恢復出真實的生物分子結(jié)構(gòu)。這個過程通過逐步去噪,逐漸精細化結(jié)構(gòu)預測??芍笇lphaFold 3學習如何從噪聲數(shù)據(jù)中恢復出準確的蛋白質(zhì)結(jié)構(gòu)信息。

在上一代AlphaFold 2模型中,Evoformer模塊對準確預測蛋白質(zhì)結(jié)構(gòu)發(fā)揮了重要作用,負責處理多序列比對(MSA)表示、成對表示和單個殘基表示。但Evoformer也有一個非常致命的缺點,就是對算力的消耗非常大,不適用于批量大規(guī)模業(yè)務(wù)。
所以,在AlphaFold 3中用Pairformer替代了Evoformer模塊,徹底去除了對MSA表示的處理,只保留了簡單、高效的成對表示和單個殘基表示。
Pairformer模塊只有4個transformer塊組成,僅使用簡單的加權(quán)平均方法處理MSA表示,接著所有信息都通過成對表示傳遞給48個標準的transformer塊進一步處理數(shù)據(jù)。
這種巧妙的設(shè)計不僅極大節(jié)省了算力,還提升了AlphaFold 3的預測泛化能力,可輕松預測各種非天然化合物。

根據(jù)谷歌公布的測試數(shù)據(jù)顯示,AlphaFold 3 的準確性比 PoseBusters 基準測試中最佳傳統(tǒng)方法高出50%,這也是首個超越基于物理的生物分子結(jié)構(gòu)預測AI模型。
為什么預測蛋白質(zhì)結(jié)構(gòu)很重要
所有的植物、動物和人類細胞內(nèi)部都有數(shù)十億的分子機器,并由蛋白質(zhì)、DNA等多種分子組成。
但是,這些分子并不是獨立工作的,它們需要互相配合才能完成復雜的生命活動。只有通過研究這些分子如何協(xié)同工作,我們才能真正理解生命的運作過程。
例如,當你吃東西的時候體內(nèi)的消化酶(一種蛋白質(zhì))就開始工作,幫助你分解食物。消化酶需要與食物中的分子相互作用,把大的分子分解成小的分子,身體才能吸收這些營養(yǎng)物質(zhì)。

因此,蛋白質(zhì)在所有生物過程中都扮演關(guān)鍵角色,包括細胞信號傳遞、免疫反應(yīng)、代謝和細胞結(jié)構(gòu)維持等。
很多疾病,例如,癌癥、阿爾茨海默病、心血管疾病等,都與蛋白質(zhì)的異常功能或折疊有關(guān)。
只有通過預測和理解特定蛋白質(zhì)的結(jié)構(gòu),醫(yī)療科學家可以更好地理解疾病的分子基礎(chǔ),進而發(fā)現(xiàn)疾病的成因和潛在的治療目標,加速醫(yī)藥的研發(fā)進程。
本文素材來源谷歌官網(wǎng)、AlphaFold 3論文,如有侵權(quán)請聯(lián)系刪除
END
未經(jīng)允許不得轉(zhuǎn)載:RPA中國 | RPA全球生態(tài) | 數(shù)字化勞動力 | RPA新聞 | 推動中國RPA生態(tài)發(fā)展 | 流 > 谷歌重磅發(fā)布AlphaFold 3,增強人類發(fā)現(xiàn)新藥方法!
熱門信息
閱讀 (14853)
1 2023第三屆中國RPA+AI開發(fā)者大賽圓滿收官&獲獎名單公示閱讀 (13857)
2 《Market Insight:中國RPA市場發(fā)展洞察(2022)》報告正式發(fā)布 | RPA中國閱讀 (13084)
3 「RPA中國杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎名單公示閱讀 (13012)
4 與科技共贏,與產(chǎn)業(yè)共進,第四屆ISIG中國產(chǎn)業(yè)智能大會成功召開閱讀 (11646)
5 《2022年中國流程挖掘行業(yè)研究報告》正式發(fā)布 | RPA中國