日韩不卡精品久久_每日更新亚洲超清精品_黄色视频观看一区_色九月亚洲综合网_欧美中文国产字幕_欧美亚洲国产成人影院_漂亮被中出中文字幕色_菠萝蜜视频网在线www_污视频三级片在线观看_日韩欧美国产成人精品高清综合网

首頁 - 關(guān)于我們 - 新聞活動 - 《自然》子刊發(fā)表實驗室最新成果:預訓練框架GPIP,AI驅(qū)動計算物質(zhì)科學研究新范式

《自然》子刊發(fā)表實驗室最新成果:預訓練框架GPIP,AI驅(qū)動計算物質(zhì)科學研究新范式

2024-4-12新聞

近日,上海人工智能實驗室(上海AI實驗室)推出首個針對機器學習勢函數(shù)模型的自監(jiān)督預訓練框架GPIP(Geometry-enhanced Pretraining on Interatomic Potentials),為AI驅(qū)動計算物質(zhì)科學研究提供了新范式。


研究人員將AI與基礎(chǔ)科學深度融合,提出了創(chuàng)新的自監(jiān)督學習策略,使機器學習勢函數(shù)的性能可靠度提升超過30%,同時,使用GPIP獲取數(shù)據(jù)的計算量僅為傳統(tǒng)方法的1%,大幅降低了研究成本。

由于能夠精準模擬物質(zhì)體系中分子的行為,勢函數(shù)模型已成為當前實現(xiàn)高性能分子模擬的關(guān)鍵,在材料設(shè)計、藥物研發(fā)等領(lǐng)域具備巨大應(yīng)用潛力。上海AI實驗室持續(xù)布局計算物質(zhì)科學等AI for Science相關(guān)研究,深入探索AI在物質(zhì)科學研究中的應(yīng)用。

該成果相關(guān)論文Geometry-enhanced Pretraining on Interatomic Potentials已發(fā)表于Nature旗下刊物Nature Machine Intelligence。

論文標題

Geometry-enhanced Pretraining on Interatomic Potentials

論文鏈接

https://www.nature.com/articles/s42256-024-00818-6

勢函數(shù)助力物質(zhì)科學研究
作為理論與實驗科學之間的紐帶,計算科學在自然科學研究中扮演著重要角色。分子動力學(Molecular Dynamics, MD)模擬通過模擬原子的運動,揭示了原子尺度上的微觀細節(jié)和動態(tài)過程,被廣泛應(yīng)用于材料設(shè)計、生物制藥、化學工程、環(huán)境科學及基礎(chǔ)理論研究等領(lǐng)域。近年來,隨著算法發(fā)展和算力提升,傳統(tǒng)的大規(guī)模“試錯”實驗已逐漸被“計算設(shè)計-實驗驗證”的方法所代替。當前,MD模擬描述原子間相互作用力主要基于兩種方法:通過求解復雜物理方程(如Density Functional Theory, DFT)得到原子受力信息,這種方法精度高但速度慢;通過擬合經(jīng)驗公式,即勢函數(shù)或力場的方法,雖計算速度快,但精度較差,往往無法提供有價值的結(jié)論。為此,學術(shù)界提出機器學習勢函數(shù),結(jié)合了DFT的高精度和經(jīng)驗勢函數(shù)的高效率,可在保持計算精度的同時顯著提高計算效率。然而,高性能的機器學習勢函數(shù)往往依賴大量的帶標注原子結(jié)構(gòu)數(shù)據(jù),當前存在數(shù)據(jù)稀缺、DFT計算資源消耗大等問題,限制了機器學習勢函數(shù)的應(yīng)用范圍。

結(jié)構(gòu)高效生成,數(shù)據(jù)準確可靠
針對上述挑戰(zhàn),上海AI實驗室AI for Science團隊推出GPIP幾何增強預訓練框架,旨在解決原子結(jié)構(gòu)數(shù)據(jù)的獲取與利用問題。在GPIP框架中,經(jīng)驗勢函數(shù)通過MD模擬,能夠快速生成大量的目標體系原子結(jié)構(gòu)數(shù)據(jù)。研究團隊進一步設(shè)計了一套幾何增強的自監(jiān)督學習策略,通過掩碼、去噪和對比學習等方法,從原子結(jié)構(gòu)數(shù)據(jù)中提取出有用的三維幾何和拓撲信息,強化了模型的學習能力。通過MD及算法策略,使得原子結(jié)構(gòu)數(shù)據(jù)在高效生成的同時亦符合物理學約束條件。
通過GPIP生成的符合物理規(guī)律的有效水分子結(jié)構(gòu)數(shù)據(jù)(左)與不符合物理規(guī)律的無效水分子結(jié)構(gòu)數(shù)據(jù)(右)。右圖中,原子位置分布與鍵長鍵角等特征不合理。

性能提升超三成,算力需求下降百倍
為驗證GPIP在實際任務(wù)中的可靠性,研究人員使用多種勢函數(shù)模型作為基座模型進行測試,測試數(shù)據(jù)集涵蓋了從小分子到周期性復雜體系。評測結(jié)果顯示,GPIP在各種任務(wù)上的平均絕對誤差下降了30%-50%,且任務(wù)執(zhí)行不依賴于具體的基座模型和下游任務(wù)數(shù)據(jù)集。得益于自監(jiān)督預訓練的引入,初始生成的結(jié)構(gòu)數(shù)據(jù)僅需二至三次迭代即可滿足實驗需要。此外,預訓練使用的原子結(jié)構(gòu)數(shù)據(jù)通過經(jīng)典MD模擬生成,數(shù)據(jù)獲取所需算力僅為傳統(tǒng)方法的1%。
預測值與真實值的誤差(MAE)隨訓練數(shù)據(jù)量的變化情況(左)以及計算資源消耗量(右)。

上海人工智能實驗室Al for Science團隊
面向物理、化學、生命、地球等科學領(lǐng)域,通過深入研究各學科基礎(chǔ)理論,結(jié)合最新人工智能理論,探索AI驅(qū)動重大科學問題的研究范式,搭建微觀到宏觀自然科學的跨學科數(shù)據(jù)和算法開放生態(tài)平臺,使人工智能緊密結(jié)合自然科學,通過基礎(chǔ)及應(yīng)用研究,構(gòu)建從底層創(chuàng)新到產(chǎn)業(yè)落地的完整體系,加速人工智能在化學、新材料、氣象、藥物研發(fā)等領(lǐng)域的滲透與落地,賦能各行業(yè)發(fā)展。


免責聲明:本文轉(zhuǎn)自網(wǎng)絡(luò),版權(quán)歸原作者所有,如涉及作品版權(quán)問題,請及時與我們聯(lián)系刪除,謝謝!


End.


想了解更多產(chǎn)品信息、行業(yè)資訊



長 按 關(guān) 注

     新浪微博    -         視頻號       -         官網(wǎng)



分享、在看與點贊

只要你點我都喜歡