文|伯虎財經 陳平安
如果非要用一個詞來形容ChatGPT最近的熱度,那我只能稱之為“絕殺”。
已經很久沒有一個科技圈的熱點能夠承包全網小編2周的KPI。從北京中關村到加州硅谷,從創投大佬到普通學生,都在使用、討論和分享,真正屬于是“環球同此涼熱”。
這么些年來,和AI相關的熱點不是沒有,比如之前阿爾法狗和自動駕駛。熱度來的快去的也快,阿爾法狗幾乎已經無人提及,自動駕駛遭遇寒冬,企業集體降維求生。
但這次是真不一樣。ChatGPT顛覆了大眾對于AI的認知,真正把通用模型擺到了普通用戶的面前,不僅能幫你寫材料,敲代碼,還能通過選拔性考試的測驗,美國賓夕法尼亞大學稱,ChatGPT能夠通過該校工商管理碩士MBA課程的期末考試。
ChatGPT的強大甚至還讓國際頂刊《自然》雜志宣布,將人工智能工具列為作者的論文,不能在雜志上發表。
業界大佬們也紛紛出來為它站臺。馬斯克和比爾蓋茨曾經堅定的相信“AI威脅論”,為了預防人工智能帶來的災難性影響,推動人工智能發揮積極作用,馬斯克還參與建立了一家非營利機構,OpenAI。(是的,就是ChatGPT的研發公司)
現在這兩人,一個稱贊“ChatGPT好嚇人,我們離強大到危險的人工智慧不遠了”,一個甚至表示“ChatGPT的意義不亞于PC和互聯網的誕生”。
更為不同尋常的是大廠們的動作。面對ChatGPT,大廠們的反應強烈,谷歌冒著翻車的危險也要強行上線內測產品,國內包括百度、阿里、騰訊、科大訊飛、京東等都宣布了相關的研發上線時間表。
小公司為提振股價強行蹭熱度還可以理解,業務穩定的大公司為何非要冒這個風險呢?
01 AI不會取代你,一個使用AI的人會取代你
要理解ChatGPT的革命性,不如先從搜索聊起。
90后以前的互聯網用戶們應該都知道,國內的中文信息服務大致經歷了三個階段。
第一個階段是導航網站和門戶網站階段,尋找信息要經由導航網站。
第二階段是搜索引擎階段。Page Rank算法的誕生讓用戶的開放性問題被轉換成互聯網信息圖譜上具有關聯性優先級的、一個更具體的選項擴列,人們可以通過搜索來獲得自己想要的信息。
第三階段是移動互聯網階段。智能手機的普及和字節的推薦算法讓那些你想要的信息自動被推送到你的面前。
不難看出,每一個階段的更迭都伴隨著效率的提升。如果把以上三個階段的效率分別比作步行,馬車和汽車,那么ChatGPT則更像是“導彈”。
這也就難怪谷歌CEO皮柴會如此火急火燎的在官網上宣布上馬類ChatGPT產品——一款實驗性的對話AI服務Bard,即便這款產品在內部算不上準備充足。
因為家都快被偷了。
但ChatGPT,或者說將其包含在內的AIGC展現的潛力,遠不止搜索這一個領域。
比如今年2月8日,微軟就推出了由 ChatGPT 提供技術支持的高級 Teams 產品, 不僅可以自動幫助參會者生成會議記錄,即使沒有參加會議,智能回顧功能也能幫助用戶生成會議記錄和要點。
由ChatGPT中分拆而出的CodeX則成為了自動補齊代碼應用 Copilot 的基礎,這款旨在輔助程序員寫代碼的應用從去年 8 月開始收費,每月 10 美元。
至于實際效果?特斯拉前任AI總監Andrej Karpathy透露,現在他80%的代碼都是由AI生成的(GitHub Copilot),而且有80%的準確率。
游戲產業同樣面臨著來自ChatGPT的挑戰。國外開發者Bloc利用ChatGPT為游戲《騎馬與砍殺2》開發了一個實驗性Mod,在ChatGPT的幫助下,原本相對呆板的NPC變得靈動起來,不再只能重復幾句固定的臺詞。
此前社交媒體上討論火熱的AI繪畫同樣如此。去年8月,游戲設計師Jason Allen通過AI繪圖工具Midjourney生成原畫,再經過Photoshop潤色而完成的作品《太空歌劇院》在科羅拉多州博覽會上獲得了數字類別的一等獎。雖然AI繪畫的能力并不能和資深的人類畫師媲美,但無疑大大提高了創作的生產效率。據深燃報道,有業內人士表示,“AI繪圖就已經是生產力的一部分。”
根據騰訊研究院《AIGC發展趨勢2023》,AIGC產業生態正在加速形成和發展,走向模型及服務的未來,其中包括以預訓練模型為主的基礎層;以垂直化、場景化、個性化模型為主的中間層;和以圖像、語音、文字生成等具體AIGC應用為主的應用層。
這意味著ChatGPT這樣的產品或將逐漸成為一種類似基礎設施的存在,一如pc和手機。
當下,已經有許多公司開始利用 GPT-3 系列模型做應用端的開發,根據 gpt3demo 網站統計,現在已經有了 628 個調用 GPT-3 系列模型開發的應用程序。背靠 GPT-3 模型的寫作輔助工具 Jasper,成立 18 個月估值達 15 億美元。
簡而言之就是,以ChatGPT為代表的AIGC是目前少數可預見的,可以提升整個社會生產效率的可落地工具,就像蒸汽機解放雙手,汽車解放雙腿那樣。在這樣的大前提下,移動互聯網時期字節超車百度的事件可能會再次重演。
ChatGPT 在 LinkedIn 分享的一篇,原本針對“ChatGPT會不會讓我失業”的帖子或許也適合回答開頭末尾的那個問題:“AI 不會取代你。一個使用 AI 的人將取代你”。
02 大廠的游戲
ChatGPT所在的AI賽道是典型的資金密集型,能夠參與到這個游戲的玩家寥寥無幾。這點從OpenAI的發展歷程就能看出。
OpenAI 在2015年末成立時是一家非營利性機構,創始人都是硅谷大名鼎鼎的人物,比如特斯拉CEO馬斯克,YC總裁阿爾特曼等,但在“委身”微軟前,資金總是捉襟見肘。
這和2018年以后,OpenAI堅持大模型訓練有關。2015年以前,小模型被公認為是AI模型的最優選。這是因為小型的模型對于硬件的要求較低,同時和大模型相比,小模型具有更高的可解釋性和穩健性。但小模型的缺點在于,對通用任務的處理表現并不好。換言之,他們很難針對特定領域或者場景去進行定制。
在這個背景下,大模型脫穎而出。大模型可泛化能力強,可以做到“舉一反三”,同一模型利用少量數據進行微調或不進行微調就能完成多個場景的任務,從而擺脫小模型應用碎片化、作坊式開發的特點。簡單來說,就是大模型更加“通用”。
2019年,OpenAI推出了大型語言模型GPT-2,參數超過15億,是上一代語言模型 GPT 的十倍,后續迭代的GPT3的參數更是達到1750億。大模型的訓練讓自然語言模型取得了突破性的進展,GPT-2已經能根據用戶輸入的文字生成看上去邏輯正常的文字。
但大模型太花錢了。布羅克曼等人測算,訓練大模型消耗的計算量,每 3、4 個月會翻一倍。據多位業內人士估算,OpenAI 訓練 GPT-3 一年,僅算力成本就有 2000 萬美元。
由于研發所需資金太大,OpenAI 在2019年轉變為盈利上限型組織,和微軟達成了資本掙到有限收益之后,后續收益歸非盈利實體。截至目前,微軟對OpenAI最新一輪投資額達100億美元。
無論是訓練模型所需的龐大數據和算力,還是參與開發的頂級人工智能科學家,亦或是推廣和普及所需的生態支持,都足見產業的門檻之高,國內也只有互聯網巨頭們有這個數據優勢和資金積累。
這也是為什么日前原美團聯合創始人王慧文在社交平臺官宣出資5000萬美元,要打造中國的OpenAI,卻被網友質疑“5000萬美元夠干什么?”的原因。
基于數據安全和應用效果的考慮,國內需要有自己的ChatGPT,互聯網大廠們需要擔負起這個責任。
03 誰能率先突圍?
ChatGPT的爆火也讓很多國內媒體開始反思,為什么中國的科技環境無法誕生這種創新?對于這類看法,伯虎財經認為,對國內AI產業的看法不應如此悲觀。
首先需要承認的是,在ChatGPT上,國內確實存在一定差距,普遍的看法認為這種技術上的差距在2年左右。
同時大模型在某種意義代表著一種暴力美學,訓練大模型需要空前的語料數據。相對于英語語境,中文互聯網在表達習慣上會缺乏嚴謹,比如讓許多中年人頭疼的拼音簡寫,YYDS。這類表達必然會影響AI訓練的效果和效率。這也是為什么ChatGPT爆火后,內容質量相對較高的知乎會迎來一波股價暴漲。
不過我們也要看到國內AI產業也有足夠的底氣。
大模型的訓練離不開算法、算力和數據。算法決定了其本身的學習能力,算力則影響著算法的學習效率,數據決定了AI的訓練效果。
國內擁有世界最大規模的互聯網用戶,在數據積累方面有一定優勢。而根據《2021―2022全球計算力指數評估報告》顯示,在算力上中美大致處于同一梯隊。
和芯片或者操作系統不同,國內玩家在AI產業不需要面對前者必須直面的困難,比如核心技術壟斷,制造上的門檻,即便是ChatGPT,其本質仍然屬于自然語言NLP的范疇,是人工智能技術長期發展和積累的結果。
Meta首席人工智能科學家Yann LeCun也曾評論:“就底層技術而言,ChatGPT 并沒有什么特別的創新,也不是什么革命性的東西。許多研究實驗室正在使用同樣的技術,開展同樣的工作。”
也就是說,國內具備追趕甚至超越的能力。當前國內大廠基本都具備訓練大模型的能力,比如百度的文心大模型,阿里的“通義”大模型,華為的鵬城盤古大模型,騰訊的混元AI大模型等。
從AI相關技術來看,百度是少有的具備AI全棧能力的企業,在芯片、框架、模型、應用四層技術棧均有布局。根據statista2021年的數據,騰訊和百度的AI專利儲備分列世界前兩位。
相對而言,字節在應用端的開發更領先。根據tech星球報道,在ChatGPT被用作寫文章前,字節跳動就研發了Xiaomingbot自動寫稿平臺,自2016年上線以來,已經累計寫了60萬篇文章,覆蓋了17項的體育賽事,支持6種語言。
(圖源:Tech星球)
此前國內AI產業的投入大多面向其他產業方向,ChatGPT的橫空出世等于把方向統一了。當下各家基本上確定了相關研發上線的時間表,最早的比如百度的“文心一言”在3月完成內測后,就將和公眾見面。
Gartner預測,到2025年,生成式AI將占到所有生成數據的10%,目前這個比例還不足1%。
在這波新的智能浪潮里,中國需要土生土長的ChatGPT,互聯網大廠們也需要爭做潮頭的破浪者。
參考來源:
1、量子位:ChatGPT讓游戲NPC活了!交流不再靠選項,問什么答什么,網友直呼童年夢想成真
2、騰訊研究院:《AIGC發展趨勢2023》
3、品玩:谷歌發布自己的ChatGPT!華人團隊主導,緊急上線,新的搜索大戰要來了
4、騰訊研究院:一文讀懂:有關ChatGPT的十個問題
5、晚點LatePost:火雞追上雄鷹,OpenAI 的成功為何難以復制丨TECH TUESDAY