文|數智前線 黃幸怡
編輯|石兆
這兩天,大模型風頭實在強勁。
3月15日,OpenAI剛帶著新出爐的GPT-4在全網刷屏,狂吸了一大波眼球,第二天,百度就帶著第一個中國版ChatGPT——文心一言亮相,又掀起一波熱潮。
雖然在朋友圈中,關于文心一言有不少吐槽,但不少業界人士也對數智前線表示,要對中國自己的大模型追趕者寬容一點,這其中不乏來自百度的競爭對手。
而數智前線獲悉,中國行業龍頭和大用戶,對大模型創新和它帶來的新技術范式高度關注,甚至已經開始倒逼國內互聯網大公司和人工智能企業加速行動。
發布會上,李彥宏也稱,文心一言還不能算完美,但為什么現在發布?是因為無論是百度內部產品還是合作伙伴對大語言模型的需求都非常強烈,“大家都在催”。
01 文心一言謹慎發布
"千呼萬喚"中,文心一言終于亮相。3月16日下午兩點,百度創始人李彥宏帶著五個Demo(視頻短片)登臺展示,宣告了百度新一代大語言模型、生成式AI產品——文心一言的正式發布。
百度對于文心一言的預熱足足進行了幾個月,卻在臨門一腳之際,碰上大洋彼岸的OpenAI 突然“插隊”發布多模態預訓練大模型GPT-4 ,被搶了不少風頭的同時,還難免被用來對比。
就比如,功能展示環節,百度使用提前錄好的Demo,就被不少人拿來和前一天OpenAI發布GPT-4時的實時演示對比,被認為“缺少了現場感”和“不太自信”。
GPT-4是ChatGPT之前使用的大模型GPT-3.5的升級版,與前代相比,文本輸入上限提升至2.5萬字,回復的準確性提高,更重要的是,可以讀圖了,且很會“做題”,包括之前被吐槽的數學題。在SAT考試中,它拿下700分,GRE幾乎滿分,在律師模擬考試中能考到前10%,而GPT-3.5只考到倒數10%。而這些,很多其實也并不為文心一言所有。
“大家的期望值是要對標 ChatGPT,甚至要對標GPT-4,這個門檻還是很高的。全球大廠還沒有一個做出來的,百度是第一個。”發布會上,李彥宏如是表示。
圍繞文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成五個使用場景,他在現場演示了文心一言的一些能力:
幫劉慈欣續寫《三體》,分析推理于和偉和張魯一誰更高,給公司起名、寫slogan、寫新聞稿;解決了此前難倒過ChatGPT的“雞兔同籠”問題,也能理解“洛陽紙貴”,并以此寫一首藏頭詩;幫2023世界智能交通大會生成海報和宣傳視頻,還以一口四川話回答問題……
文心一言雖然在一些方面還比不上OpenAI的GPT產品,但業內認為,它在中文理解、一些多模態生成場景上將有一定優勢。在多模態生成方面,文心一言目前的版本,能生成文字、圖片和語音,而生成視頻是世界級難題,包括谷歌在內的企業,實現的效果還差強人意,百度也未對所有用戶開放。
文心一言并未對全部用戶開放,采用了申請制,這是比較謹慎的做法。在新聞發布會后一小時內,百度透露,排隊申請文心一言企業版API調用服務測試的企業用戶已達3萬多家,申請產品測試網頁多次被擠爆。
李彥宏稱,大語言模型一旦發布出來,就會獲得真實的反饋。有了用戶反饋之后,迭代速度、能力提升會加快。
02 中國客戶倒逼AI公司加快行動
ChatGPT的爆火,最初引起國內一眾人工智能企業和從業者的緊迫感,而現在,這種緊迫感,已經傳導到了更廣闊的范圍,AI公司已經開始被他們的客戶倒逼著開展一些行動。
數智前線獲悉,國內幾家大型互聯網公司和人工智能企業,最近幾乎都遇到過這樣的場景:來自各行各業的客戶紛紛找來,向他們咨詢和了解ChatGPT和大模型相關的內容。
“而且幾乎所有人都是被老板逼著來問的。”知情人士透露,尤其是行業龍頭企業和大型央國企,都有一種焦慮感。
大家普遍關注和擔心的點在于:這些人工智能企業和互聯網公司的大模型進展情況如何?他們的技術是否跟上了潮流?客戶如果在業務中采用了這些公司做的人工智能技術,業務和創新能不能處于前沿?
這使得一些一開始并不打算“追風”的人工智能企業,也在不得不在最近出來發聲,向外界和大客戶分享和介紹他們的大模型相關進展。
實際上,如果單從大模型的數量和研發時間來看,中美并沒有不可逾越的距離。有數據顯示,自2020年起,中國的大模型數量驟增,僅2020年到2021年,中國大模型數量就從2個增至21個,和美國量級同等,大幅領先于其他國家。
具體到目前業界具有代表性的AI大模型上,國外的OpenAI在2021年發布120億參數的多模態大模型CLIP、DALL-E,同年谷歌發布ALIGN 、VIT-G/14時,國內的百度已經有了文心大模型,阿里也推出了國內首個千億參數多模態大模型M6,華為和商湯紛紛在這年推出自己的大模型盤古和書生(INTERN),騰訊則在2022年對外官宣了混元大模型。
參數規模上,國內目前也已經有不少能比肩ChatGPT的大模型,如百度的文心大模型參數量2600億,阿里的多模態大模型M6參數規模突破10萬億,據稱已經遠超谷歌、微軟的大模型參數規模,成為全球最大的AI預訓練模型。
不過,不可否認的是,從效果來看,國內廠商的大模型距離領先的OpenAI仍然還有距離,需要國內企業提速追趕。
曠視科技聯合創始人、CEO印奇認為,國內目前已經公布的大模型,跟GPT-3.5還有較大差距。李開復也在最近表示,自己嘗試過一些所謂的中國ChatGPT,發現他們的確不如ChatGPT。
”這種差異歸咎于英語服務比中國競爭者提供的數據更多、質量更高。但在技術方面,有幾家公司給我留下了相當深刻的印象“。李開復認為,中國公司可能需要一年時間才能獲得同等或可能更大的數據量。
實際上,由于GPT-3之后,OpenAI的所有模型就沒有再開源,GPT-3.5、甚至GPT-4的運行機制是什么,如何達成這種效果,仍需國內企業進一步去跑通。印奇認為,中國攻堅 AI 大模型目前最重要的是要先能把GPT-3.5復現出來,"這是所有事情的起點"。
但這個過程并沒有想象的那么容易。相對于美國在基礎技術上的創新投入,中國 AI 公司還是要面臨相對短周期商業化的壓力,而不可能像OpenAI和DeepMind一樣,“我們沒有那么奢侈的條件。”在印奇看來,中美在 AI 領域差距并沒有那么大,國內只要迎頭趕上還是有優勢的,但也“要有極強的危機感。”
03 大量小模型企業將要轉型
大模型出來之前,各行各業的小模型已經運行了一段時間。相比于大模型展現出的強大能力,做小模型的企業又將何去何從?
“咱們不能拿著錘子,看什么都是釘子,有些場景小模型已經能滿足需求,就沒必要用大模型去解決它。”百度AI中臺總監忻舟告訴數智前線,像門口閘機系統,基本上靠人臉識別就已經用得很好了,就沒必要再用一個大模型去迭代。
但同時,忻舟和不少資深人士都認為,大模型的確給碎片化場景和原來用小模型解決不好的場景,帶來改變。
在忻舟看來,大模型導致了AI產業應用新范式的出現。"原來的范式是每個場景都有一個模型,需要專家做設計、標注數據,新的范式卻是通用大模型加行業數據變成行業大模型,再針對不同場景使用少量數據就能得到場景的模型,場景的模型還可以做數據回流來增強行業大模型的能力。”
在他看來,這種新范式的出現,會給整個人工智能企業的服務生態帶來很大變化。例如,原來在一些單點為客戶提供服務,滿足他們某個領域如金融行業需求的創業公司,在大模型技術到來后,優勢將大幅降低,這些企業如果想繼續活下去,就必須想辦法擁抱有大模型的企業,合作去做相關工作。
與此同時,大模型技術使得人工智能的門檻進一步降低后,由于不需要每家企業從頭訓練NLP或CV能力,會有更多的企業進來,加劇整個行業的競爭。這時,服務好、成本控制好、在大模型的基礎上有更多創新的企業,將被市場篩選出來,也會使原來亂報價的現象得到控制。
“我認為他會給整個人工智能企業服務行業帶來一個正向結果。”忻舟表示。這是一個大的趨勢,尤其是創業企業,誰能最先擁抱這樣的趨勢來對自己的服務模式和商業模式做一定的改變,誰就更能夠在新AI時代活下來。
大模型的熱潮還將長期持續。在大模型的落地部署上,此前一些問題正在出現一些新的解決方向。
比如大模型通常需要更大的算力消耗,尤其是昂貴的GPU,從而導致的高部署成本問題。數智前線獲悉,不少人工智能企業目前已經可以通過一些方法探索如何更合理地控制成本。比如,推理時對模型進行壓縮和蒸餾,使一個大的模型壓縮成一個小的模型,同時確保其效果不降或只降一點點,也能大幅節約成本。
事實上,據業內人士透露,如何將模型做“小”正在成為大模型產業落地的一個重要課題。實在智能CEO孫林君此前就曾表示,大模型生態里,除了專用高質量數據外,最重要的工作是基于預訓練大模型跑出來的參數底座,去微調壓縮訓練垂直領域內的新的專用小模型,這可以降低算力和成本,同時提高自身產品的用戶體驗。
又比如一些人擔心的大模型是否能私有化部署的問題。幾位業界人士告訴數智前線,大模型是可以支持私有云的。李彥宏也表示,圍繞文心一言,百度既有公有云服務,也可以做私有化部署。對于中國客戶青睞的私有化部署,國內的企業都將提供和實踐性價比越來越高的方法。