界面新聞記者 | 張熹瓏
1月10日,《博鰲亞洲論壇創新報告2023》(簡稱《報告》)在廣州發布,指出亞洲已成為AI大模型技術的主要產出區。
其中,中國為AI大模型專利最多產出國。華南理工大學法學院知識產權研究所所長關永紅解讀《報告》提及,截至2023年6月,中國AI大模型專利數量占比高達58%,韓國(占比8%)和日本(占比5%)也是亞洲專利主要產出地區;美國占比為18%。
關永紅表示,截至2023年10月,國內大模型達到238個,但截至5月只有79個,反映中國大模型快速增長態勢。
知識產權數量水平是創新能力產業化的標志。《報告》亦顯示,對標紐約、東京等灣區,聚焦四大專利指標(發明專利、PCT專利、同族專利、專利被引頻次),粵港澳大灣區的專利綜合能力已經超越世界其他灣區。
在發明專利和同族專利方面,粵港澳大灣區公開量和復合增長率位居四大灣區之首:2017-2021年,發明專利公開總量及復合增長率分別為176.9萬件和21.74%;同族專利公開量303.21萬件,數量多于其他三大灣區總和兩倍有余,復合增長率為20.24%。
分行業來看,粵港澳大灣區的發明專利集中在新一代信息技術領域,占比達62.37%,數字創意產業占比為19.63%。新能源汽車相關服務、新材料和生物產業也是主要行業。
高附加值的消費電子、新能源、新材料等先進制造集群是粵港澳大灣區發展AI大模型的基礎。迄今為止,華為仍是全球最大的PCT專利申請人,2022年公布了7689件PCT申請,緊隨其后的是韓國的三星電子(4387件)和美國的高通公司(3855件)。
OPPO、vivo、榮耀等手機廠商也紛紛下場。vivo在2023年11月發布藍心大模型,OPPO在今年1月宣布AI大模型在手機端落地。
下一步,AI大模型需要提升邏輯推理能力,并考慮如何產生回報。
1月10日,vivo智能交互技術總監付凡提出,模型本質上是一種介質,“就跟人腦一樣,人腦大概有860億神經元,而vivo發布的模型可以達到約700億神經元的量級。”
“怎樣讓模型學習人類的知識,需要通過模型結構跟數據去做這種算法知識,對模型信息進行壓縮。我們理解到的信息其實基于壓縮機制,對人類信息進行集合、壓縮。基于這個前提,模型的智能就能體現在對人類所有知識的匯總。”付凡說。
付凡透露道,vivo從2018年成立研究院對數據圖譜化處理:“目前整理了大概1.3萬T的多模態數據,包括音頻文字、圖像設計,提供給模型訓練的大概是2800T文本數據,最終模型會形成15T數據。15T是什么概念?相當于電腦、手機硬盤的存儲大小。”為了提供這一量級的數據給大模型學習,在算力支持方面,“目前是頂級GPU大概2000卡的運行訓練,保證模型訓練的效率和穩定性。”
“目前我們感受到模型更多的是一個能力很強的文科生,其邏輯推理能力如何提升,跟心理學、營養學這樣面向用戶的科學該怎么結合,是下一步我們需要探索的。”付凡稱。
德勤中國科技、傳媒和電信行業主管合伙人程中認為,大模型將在產業端應用迎來需求爆發,例如能源行業探索“井下無人”,制造業開始探索無人化的黑燈工廠。
2022年,全球對AGI投資達約45億美元;2023年第一季度該數值達到120億美元。大部分集中在技術端。
程中強調,AGI撬動的只是一個熱點,回到產業端,這項投資要產生回報,有幾個不可忽視的話題。
首先是工程體驗。“以前的產業數字化里經常談敏捷開發,但這只能在技術上解決問題,未來更多的是工程體驗,解決AI人才極度短缺問題,提升工程師效率。”
數據顯示,全球來看,一個開發中的技術工程師平均一周工作量大概是41小時,“但這41個小時有接近一半的時間是在修復bug,不是為了新的功能和效應。如果用工程體驗的模型去優化,讓這21小時變成10個或5個小時,會給企業端帶來很大的價值。”
“另外,要考慮怎么利用通用大模型。很多企業在構建自己的私有模型,但這不叫大模型,因為私有模型的數據涉及商業核心價值。我們預測,未來私有的AI模型跟通用大模型、產業大模型可能是多者融合的狀態。算力方面,因為全球面臨缺芯,算力不可能會野蠻生長,也可以考慮用共享的模式讓算力更敏捷。”程中提到。