界面新聞?dòng)浾?| 查沁君
界面新聞編輯 | 文姝琪
“‘賦能’這個(gè)詞低估了人工智能對科學(xué)的影響。就科學(xué)而言,人工智能不是一次簡單的工具革命,而是科學(xué)革命的工具,或者說是具有革命性的工具。”
在2月19日舉行的世界互聯(lián)網(wǎng)大會“人工智能賦能科學(xué)研究”(AI For Science)研討會上,世界互聯(lián)網(wǎng)大會人工智能專業(yè)委員會首席主任委員、中國工程院院士、之江實(shí)驗(yàn)室主任王堅(jiān)提到上述觀點(diǎn)。
王堅(jiān)坦言,過去幾年他不敢直接表達(dá)這個(gè)觀點(diǎn),而十天前,當(dāng)麻省理工學(xué)院(MIT)的幾位學(xué)者看到中國帶來的變化后,他們意識到,中國不只是一家公司(或有錢的公司)能做出好的基礎(chǔ)模型,這對大家是很大的鼓舞。人工智能已成為通用語言,將打破學(xué)科壁壘,所以它不只是簡單的賦能,可能是一種新的范式。
王堅(jiān)表示,科學(xué)研究的第一、第二范式都已經(jīng)在科研中廣泛驗(yàn)證,第三范式即計(jì)算機(jī)被引入,基本是計(jì)算機(jī)模擬階段;而第四范式,即由數(shù)據(jù)驅(qū)動(dòng)的范式從未形成過;關(guān)于第五范式的說法不一,但普遍認(rèn)為第五范式與人工智能有關(guān)系,這已形成共識。
會上,王堅(jiān)還強(qiáng)調(diào)了科研資源開放的重要性。大模型時(shí)代的開源實(shí)際上是資源開放,科學(xué)研究需要公共產(chǎn)品。當(dāng)數(shù)學(xué)、人工智能和工程學(xué)等都很好地結(jié)合時(shí),面向全世界的公共科學(xué)研究的公共產(chǎn)品就會出現(xiàn)。這個(gè)公共產(chǎn)品不再像過去那樣只被少數(shù)幾個(gè)科學(xué)家所擁有,而是成為大家都能使用的工具。
發(fā)展至今,AI for Science(AI4S)的概念已逐漸被更多人了解。尤其是去年10月,2024年諾貝爾物理學(xué)獎(jiǎng)和化學(xué)獎(jiǎng)相繼頒給在人工智能與基礎(chǔ)科學(xué)交叉領(lǐng)域?qū)崿F(xiàn)重大突破的科學(xué)家,標(biāo)志著人工智能在科學(xué)研究中的重要地位得到了認(rèn)可。
人工智能正在引發(fā)一場從科研范式、科研方法到應(yīng)用場景的系統(tǒng)性的變革。
例如,在生物藥領(lǐng)域理解多種藥物相互作用產(chǎn)生的復(fù)雜影響,在氣象分析領(lǐng)域處理長時(shí)間跨度的海量氣象信息等等,為科研人員提供了全新視角和分析工具,推動(dòng)科研方向向智能化數(shù)據(jù)驅(qū)動(dòng)轉(zhuǎn)變。
再比如,中山大學(xué)與阿里云合作研究,利用云計(jì)算與AI技術(shù)發(fā)現(xiàn)了180個(gè)超群、16萬余種全新RNA病毒,是已知病毒種類的近30倍,大幅提升了業(yè)界對RNA病毒多樣性和病毒演化歷史的認(rèn)知。
除此之外,阿里巴巴集團(tuán)副總裁、大數(shù)據(jù)和智能實(shí)驗(yàn)室負(fù)責(zé)人葉杰平提到,阿里云還服務(wù)了中科院國家天文臺、FAST望遠(yuǎn)鏡數(shù)據(jù)上云、復(fù)旦大學(xué)科研智算平臺等多個(gè)重大科研項(xiàng)目。
葉杰平表示,相比20年前、10年前、甚至5年前,現(xiàn)在AI大模型在整個(gè)科研流程方面都可以發(fā)揮非常大的價(jià)值。預(yù)計(jì)如果AI模型能力持續(xù)提升,科學(xué)家做科研的方式會發(fā)生深刻的變革。
“AI4S的能力在于有一個(gè)非常強(qiáng)的超高緯度數(shù)據(jù)擬合能力。”中國新一代人工智能發(fā)展戰(zhàn)略研究院執(zhí)行院長龔克提到,科學(xué)的第一范式是靠觀察,并在此基礎(chǔ)上形成定理,其實(shí)就是通過觀察數(shù)據(jù)擬合出自然界規(guī)律。
但要在高維空間中做擬合非常難,甚至無法表達(dá),而現(xiàn)在高度復(fù)雜的神經(jīng)網(wǎng)絡(luò)能表達(dá)大量數(shù)據(jù)中真實(shí)世界的高維度特性。另外,做數(shù)據(jù)處理時(shí),從微觀到宏觀的跨尺度數(shù)據(jù)處理非常困難,而人工智能也做到了。
在龔克看來,歸根結(jié)底,這些體現(xiàn)的是AI的學(xué)習(xí)能力。人工智能自從走上機(jī)器學(xué)習(xí)這條路,就越走越通,因?yàn)閷W(xué)習(xí)是智能的本質(zhì)所在。同時(shí),人工智能還具有通用性,它不是一個(gè)領(lǐng)域的工具,而是涉及所有領(lǐng)域的工具,可以帶來革命性變化的工具。
龔克建議,要繼續(xù)提升AI4S本身的能力,特別要增強(qiáng)模型的可解釋性和透明度,并且共同制定標(biāo)準(zhǔn)和規(guī)范。
與此同時(shí),應(yīng)促進(jìn)資源共享,加強(qiáng)跨學(xué)科、跨行業(yè)的交流合作,來開發(fā)開源的、開放的科學(xué)創(chuàng)新模式;此外還要提升研究者有道德負(fù)責(zé)任運(yùn)用AI4S的能力,恪守科研誠信。
“AI4S雖然具有挑戰(zhàn)性,但與“AI+X”的其他領(lǐng)域相比,相對更容易取得確定的成果。”專委會副主任委員、產(chǎn)業(yè)推進(jìn)計(jì)劃牽頭人,歐洲科學(xué)院外籍院士,清華大學(xué)人工智能研究院常務(wù)副院長孫茂松表示,AI4S的對象是存在不變規(guī)律的自然科學(xué),這正適合人工智能處理。相比之下,應(yīng)用于社會科學(xué)等其他領(lǐng)域反而更困難。
例如小分子、大分子結(jié)構(gòu)是固定的,所以人工智能在自然科學(xué)領(lǐng)域的應(yīng)用,盡管本身有難度,但從性質(zhì)上來說是最容易的,而且由于其與傳統(tǒng)方法不同,使用它一定會取得超出該領(lǐng)域思維定式的結(jié)果。
在應(yīng)用AI4S時(shí),孫茂松認(rèn)為有兩點(diǎn)要認(rèn)真審視:一是要發(fā)現(xiàn)根節(jié)點(diǎn)問題,解決它可能會對該領(lǐng)域產(chǎn)生根本性變革,如AlphaFold選擇的蛋白質(zhì)結(jié)構(gòu)預(yù)測問題;
二是要確保問題有高度相關(guān)的高質(zhì)量數(shù)據(jù),且是人做得不太好的領(lǐng)域。此外,參加公開學(xué)術(shù)比賽也是一條捷徑,AlphaFold就是通過參加學(xué)術(shù)比賽取得第一,從而推動(dòng)了自身發(fā)展。
孫茂松還提到AI4S的另一面——Science for AI以及Science in AI。在他看來,目前大模型雖取得了顯著成果,但對于其產(chǎn)生能力的機(jī)理卻尚未明晰,例如DeepSeek在一些中文復(fù)雜任務(wù)中的表現(xiàn)令人驚嘆,可沒人能說清背后的原理。
他認(rèn)為,研究大模型的機(jī)理迫在眉睫,“一旦揭示清楚,可能會推動(dòng)人工智能的大發(fā)展,實(shí)現(xiàn)經(jīng)驗(yàn)主義與理性主義的結(jié)合,做到小模型、小數(shù)據(jù)、高效,并且研究大模型對腦科學(xué)的發(fā)展也有著巨大的促進(jìn)作用”。
深勢科技創(chuàng)始人兼CEO孫偉杰在圓桌論壇中表示,如今在AI4S時(shí)代下,AI可以幫大家更好地處理文獻(xiàn)數(shù)據(jù),幫助我們整理知識,可以大幅提升計(jì)算模擬精度效率,提升實(shí)驗(yàn)室效率。因此,基于AI4S帶來的工程體系變化,毫無疑問,學(xué)校里的科研和教學(xué)將會發(fā)生很大的改變。
未來,AI4S將會改變科研生產(chǎn)關(guān)系,從而將走向下一個(gè)AI4S時(shí)代。
“當(dāng)前,行業(yè)正在從基礎(chǔ)能力的快速提升期逐步進(jìn)入‘挖深礦’的深耕階段。”去年底,在界面新聞財(cái)經(jīng)年會上,深勢科技藥物發(fā)現(xiàn)部聯(lián)席總裁王冬冬在接受界面新聞采訪時(shí)也提到,AI4S將進(jìn)一步優(yōu)化預(yù)測設(shè)計(jì)的精度和復(fù)雜度;在大數(shù)據(jù)驅(qū)動(dòng)和知識圖譜輔助方面,解決現(xiàn)有數(shù)據(jù)不足和知識遷移問題,以及產(chǎn)業(yè)化與規(guī)模化所面臨的成本、算力、模型可解釋性等挑戰(zhàn)。