文|GPLP犀牛財經 娜娜邱
爆火的ChatGPT熱度還沒減, AutoGPT又橫空出世。
4月18日,釘釘總裁葉軍宣布釘釘正式接入阿里巴巴“通義千問”大模型,并用一根AI魔法棒“/”打開智能化魔法世界。 “/”可以生成智能會議紀要并提煉摘要、待辦,從海量群聊消息中整理關鍵信息、形成摘要,通過對話或拍照生成應用等。大模型再一次搶了眼球。
ChatGPT的火爆出圈,引發了人工智能大模型布局和創業大潮,也引爆了整個人工智能產業。那么,這些大模型未來將何去何從,又將給人工智能產業帶來怎樣的影響呢?
在犀牛財經近日主辦的“ChatGPT沖擊波下的AIGC發展機遇”沙龍上,與會嘉賓對上述問題進行了深入的探討。
ChatGPT引領AI應用熱潮
正如艾瑞數智人工智能首席分析師王紫萌所言,ChatGPT這一現象級突圍產品拉開了大語言模型產業和AIGC產業蓬勃發展的序幕。她認為,相比之前的生成式對話產品,ChatGPT的大范圍連續對話能力,使得生成內容質量、語言理解能力、邏輯推理能力和類人的體驗等都得到了一個大幅度提升,超出了大眾對于一款普通聊天機器人的預期,因此成為AIGC產業發展的一個非常關鍵的節點,也拉開了大語言模型產業和AIGC產業蓬勃發展的序幕。
北京信息科技大學教授、正高級工程師胡涵清認為,ChatGPT快速發展的背后,是經過多年發展后,人工智能技術實現從感知智能升級到認知智能,引發了機器理解、分析和決策能力的突飛猛進。AIGC是實現認知智能產品化的一個重要方式。
最近新晉的AutoGPT則是一個認知能力更強的產品。AutoGPT由GPT 4驅動,主打全自動。不同于ChatGPT的單次提問、單次回答模式,AutoGPT能夠建立一個“思考、行動、觀察結果、決定下一步行動、再次行動、再次觀察結果”的循環。
胡涵清回顧AI發展歷史說,AI發展到現在,經歷了很多次寒冬;每次寒冬或者復蘇,都出現AI的通用化和專業化的分歧。通用化是代表的是人類對AI應用的美好暢想;而專業化則能夠帶來更好的落地部署應用。21世紀前20年,是通用化大模型提出并且獲得發展的一個時代。這一時代大模型訓練與項目任務微調的結合,讓模型應用到各種場景中成為可能,從而極大提升模型的通用能力。
回到當前的AI市場。王紫萌認為,ChatGPT被稱為AI的“iPhone時刻”,以ChatGPT為代表的生成式AI讓每個人命令計算機解決問題成為可能,并通過生產工具、對話引擎、個人助理等應用,起到協助人、服務人,甚至超越人的角色。憑借此革命性突破,ChatGPT在搜索引擎與各類工具軟件中率先掀起應用熱潮,引起了廣大用戶對ChatGPT相關技術的關注與學習。海量下游應用也因此捕捉到新的技術與產業機會,希望通過各類大模型與工程化能力,將類ChatGPT產品能力輸送到原有應用中。一場關于應用的革命序幕就此拉開。
亞信科技AIGC規劃專家廉霄興從產業層面分析說,AIGC代表了內容創作模式上的革新方向,可以提高內容生產的多樣性,提供更加動態且可交互的方式,實現傳統PGC(專業內容生成)與UGC(用戶內容生成)所難以成就的內容廣度,同時在速度、成本和可控性上更優。
大模型混戰終將大浪淘沙
ChatGPT大火之后,國內各大廠商紛紛在大模型領域搶占陣地。據不完全統計,百度、阿里、360、商湯等至少15家企業都宣布已經啟動AI大模型項目。競爭逐漸開始白熱化。
那么,誰將在這唱大模型混戰中脫穎而出呢?
對于這個問題,胡涵清認為,現在下結論還為時太早。但是他堅信,和手機操作系統中的iOS和安卓一樣,以AI大模型為基礎的商業生態中,最終真正成功的通用大模型為數不多,而其他更多的廠商將成為存活下來的通用大模型的生態系統組成部分。
從長期來看,多個通用大模型百花齊放顯然是不現實的。別的且不說,算力支撐就是個瓶頸。。
胡涵清分析說,算力是個吞金獸,大型語言模型對算力的需求很大,且面臨著很大的資源缺口。比如,ChatGPT依賴于英偉達A100顯卡,OpenAI訓練ChatGPT4用了上萬片英偉達A100。4月6日,ChatGPT 還因需求量太大暫停了升級服務,并停止 Plus 付費項目的銷售。
傳言訓練文心一言調用了其幾乎所有A100芯片的百度,一直在積極尋求英偉達A100的替代品。其中,網傳的一份百度集團交流紀要顯示,寒武紀思元590能夠在一定程度上代替A100,但在軟件適配度、穩定性方面仍顯不足。
勵算科技礪算科技聯合創始人、聯席CEO孔德海認為,當前很大程度上算力就是競爭力,但是提供算力的GPU昂貴且短缺。
那么,該怎么來化解這個矛盾呢?孔德海認為,可以從以下四個方面來著手;一是協同化,是指很多運算可以跑在云端,并根據需求進行協同;二是模型小型化,在高質量數據前提下,小型模型可以在單機上運行;三是再訓練,在有限條件下,反復訓練有助于提升用戶體驗;四是融合計算。
4月10日剛剛發布“日日新SenseNova”大模型體系的商湯科技在算力中心改造時的思路在一定程度上與孔德海一致。商湯認為,算力不是“堆卡”,還需要做到卡間連接、提速,才能實現高效訓練。為此,商湯科技完成了升級機柜、改變算存比例、重新連接計算等一系列動作。
行業化賽道大有可為
以ChatGPT為代表的通用大語言模型引發了全民狂歡,但是在企業級市場,情況卻不盡相同。企業級用戶追求應用的穩健性、可靠性、可用性、安全性和合規性,從目前的情況來看,通用大語言模型還不能滿足這一點。
廉霄興就認為,直接使用開源模型賦能通信業存在極大不確定性,存在專業任務能力、內容時效與事實性、專業程度不足等問題。
正因為如此,亞信科技選擇在通信領域構建通信行業GPT大模型。不久前,亞信科技人工智能實驗室聯合清華大學智能產業研究院,面向通信行業數智化轉型,充分利用行業數據資源和行業Know-How,進行預訓練和微調,共同構建通信行業GPT大模型TelcoGPT。
廉霄興介紹,5G/6G通信與生成式AI已被業界視為一組最新的通用目的技術組合,對垂直行業的發展起到提振生產力與賦能的作用。AIGC 的多模態數據全面理解和生成能力,深度賦能通信業各個層面,推動智能通信網絡的演進升級和落地應用。比如說,亞信科技以客戶旅程視角,聚合各類AIGC 能力,賦能客戶完整的、豐富的,沉浸式業務流程體驗。
盡管ChatGPT推出來后,很多人面臨著職業危機。哪個職業將會被ChatGPT淘汰成為一時討論的熱點。比如說,藍色光標上周就宣布,全面用 AI 代替外包,由此廣告人成為首批被AI下崗的人群。但與此同時,大預言模型也帶來了巨大的創業機會。
胡涵清認為,在算力資源不充足的前提下,創業公司可以作為其他通用大模型的生態伙伴,扎根行業深耕行業大模型。
而這一點正是野心勃勃的大廠們喜聞樂見的,為此他們非常關注生態的建設。阿里和百度都已在建設大模型生態,旨在通過云平臺輸出模型能力,支撐更多應用生長。
王紫萌表示,未來大模型產業空間非常廣,每一層都有機會,特別是行業領域;深耕垂直行業解決方案的廠商,可以通過集成大語言模型來優化自己的對話引擎,從而更好地服務下游應用場景。
在廉霄興看來,通用大語言模型擊穿了原來高壁壘的一些行業,從而催生很多新的創業機會;但是需要注意的是,通用大語言模型日新月異,要時刻關注最新的趨勢,盡量避免由這種變化帶來的沖擊。
關注AIGC技術倫理問題
雖然AIGC帶來很多機遇,也帶來很多挑戰。早在今年2月,馬斯克就強調,人工智能是未來人類文明最大的風險之一,其威脅程度超過核技術,需要加強安全監管。
胡涵清從技術角度分析了AIGC帶來的三種挑戰:
一是AIGC帶來的技術倫理問題。胡涵清認為,任何科技都可能帶來倫理問題,從學術研究轉向產業研究的第一步,是探索如何從技術角度來解決可能的技術倫理問題。AI技術發展具有革命性,AI生成內容具有危險性。比如說,2016年微軟在推特上發布了聊天機器人Tay。Tay可以在維特上學習知識并與人互動。但是一天后微軟不得不關閉了Tay,因為此時Tay的言論已經涉及種族歧視、性別歧視等問題。現在很多企業都在運用一些技術避免類似事件的發生,如改善數據質量、增加限制性的條件微調模型,但是做到完全避免非常難。因此胡涵清認為,除了技術倫理問題的預防,使用時的及時警告、緊急關停措施等非常必要。
二是AIGC生成物的版權問題。AIGC是機器學習的一種應用,在模型學習階段會使用大量的數據。目前,業界對訓練后的生成物的版權歸屬問題尚無定論:一種觀點認為因為內容是由學習數據集生成的,所以生成物的版權應歸數據集所有方;另一種觀點認為AIGC的生成過程是完全隨機的,沒有版權問題;即使有版權,它也屬于AIGC的作者或者平臺。胡涵清認為,不管是哪一種觀點,對原創作者都不利。
三是AIGC帶來的欺詐問題。胡涵清分析說,從技術角度來看,AIGC生成內容完全取決于使用者的引導,在安全措施不到位的情況下,AI對惡意的誘導會不加分析或判斷,只會根據學習到的信息輸出新的內容,因此AIGC可能被人用來惡意造謠生事,或者編出一些不利于社會的新聞。可見,AIGC作為內容生產的一種新的范式,在推動數字經濟快速發展的同時,也對國家的相關法律機構及監管治理能力提出了更高的要求。
正因為對倫理和社會責任的擔憂,馬斯克、圖靈獎得主Bengio等千人聯合簽署了公開信,呼吁所有AI實驗室立即暫停訓練比GPT-4更強大的AI系統至少6個月。
也正因為如此,國家互聯網信息辦公室4月11日發布的《生成式人工智能服務管理辦法(征求意見稿)》備受關注。《征求意見稿》明確提出,提供者應當對生成式人工智能產品的預訓練數據、優化訓練數據來源的合法性負責。《征求意見稿》對AIGC生成物的版權歸屬問題進行劃分。
正如嘉賓在交流中所言,AIGC剛剛開始,有很多問題需要解決,有很多未知數在等著我們。讓我們共同期待新的時代。