界面新聞記者 | 宋佳楠
2月14日,百度在其官方微信公眾號上宣布,將在未來幾個月中陸續推出文心大模型4.5系列,并于6月30日起正式開源。
百度此舉與該公司創始人李彥宏之前對大模型開閉源的看法并不一致。李彥宏本是大模型閉源的支持者。在2024世界人工智能大會等場合,他多次表達了對閉源大模型的支持觀點。
從性能和成本角度來看,李彥宏認為同樣參數規模下,開源模型能力不如閉源,開源模型若想追平閉源,需要更大參數規模,這意味著推理成本更高、反應速度更慢。而閉源模型通常由專業團隊針對特定用途優化,與專門硬件緊密集成,可實現規模經濟,推理成本更低。
盡管他認為開源大模型在學術研究、教學領域等特定場景下有存在的價值,但在激烈的商業競爭環境中,需要讓業務效率比同行更高、成本比同行更低,這時商業化的閉源模型是最能打的。
李彥宏曾表示,閉源才有真正的商業模式,才能聚集人才和算力,優秀人才會更傾向于選擇閉源模型的團隊,因為閉源可以提供更好的資源和發展空間。
與百度所不同,時下在全球AI領域掀起巨浪的DeepSeek以開源著稱,其把AI大模型的所有源代碼托管在開源平臺上,所有人都可下載。企業在符合硬件要求的電腦上部署,可據此打造自己的程序。據看看新聞報道,目前已有超200家頭部企業完成了DeepSeek技術接口的集成部署,涉及領域包括科技、手機廠商、汽車、金融等多個行業。
此次百度選擇開源文心大模型4.5系列,或是受激烈的市場競爭影響。DeepSeek等新興產品的崛起給文心一言帶來一定壓力,而開源可吸引更多開發者和用戶,提升百度在市場中的競爭力。另一方面,隨著技術發展,大模型推理成本大幅下降,百度有條件進行開源,推動技術更廣泛應用。
值得一提的是,2月13日,百度還放出了文心一言自4月1日起全面免費的消息。這一舉措與開源計劃相配合,有助于降低用戶門檻,擴大用戶群體,收集更多數據以優化模型。
而在2月11日的迪拜世界政府峰會(WGS)上,李彥宏表示,大模型推理成本年降90%以上。當被問及DeepSeek的出現是否在意料之中時,他稱,“創新是不能被計劃的,國內營造的創新環境孵化出了DeepSeek這樣 ‘高性能’‘低算力成本’的大模型?!?/p>
文心大模型4.5系列開源后,有望促進行業技術創新與進步,讓更多開發者基于此進行二次開發。同時或重塑競爭格局,吸引更多企業與百度合作,催生新的商業模式和產業生態。