文|真故研究室 林秋藝
編輯|龔 正
兩三年前,繼馬云、劉強東、黃崢相繼退居二線后,字節跳動創始人張一鳴也選擇在2021年5月20日這天宣布卸任字節跳動CEO。2年來,張一鳴的公開動作一直集中在教育公益上。媒體傳他大部分時間也待在新加坡,“聚焦遠景戰略”。
直到最近,他在香港特區成立了一家個人投資基金,在資本市場重回公眾視野。消息人士稱,這家基金將聚焦科技投資。聯想到媒體報道他最近熱衷于研究AI大模型,以及港府釋出將在本地建人工智能超算中心的計劃,有投資行業人士告訴《真故研究室》,利用香港金融優勢,進行AI的生態布局或將是張一鳴接下來要展開的重點。同時,市場也有未經相關方確認的信息流傳,即字節跳動可能將于年末發布自己的大模型。
01 選中香港,整活AI
Cool River Venture。
這是掛在香港特區公司注冊處網站上,張一鳴成立的個人投資基金名字。這也是卸任字節跳動CEO兩年以來,張一鳴在資本市場上的首次露面。
該基金性質是私人有限公司,2023年5月22日生效,張一鳴擔任該基金董事,唯一股東為Galaxy LLC,持股比例為100%。
據相關人士透露,該基金的主要投資方向是科技行業。
這不難讓人聯想起字節跳動“要做自己的大模型”這一動作。
在此之前,張一鳴已經主動或被動釋放出很多信息。多項消息指向,AGI(通用人工智能)是張一鳴關心的重點之一。
《中國企業家》雜志報道,張一鳴最近正在看一系列的OpenAI論文,甚至熬夜看,已經到了廢寢忘食的地步。
一位字節員工在接受《晚點》訪談時也說,張一鳴近期時常會和一些字節人士分享論文學習心得和對ChatGPT的思考。
如今,選擇在中國香港成立個人投資基金,或是張一鳴準備開始行動的信號。
有投資行業人士告訴《真故研究室》,選擇中國香港成立基金,不但注冊簡便易行、基金結構簡化、籌資容易、稅負較低,也可以依托香港地區,輻射大灣區,利于進行AI行業的全球生態布局。
值得注意的是,就在5月31日,百度也正式宣布設立規模為10億元的「百度文心投資基金」,重點投資孵化大模型領域的優質創業企業,為其提供包括資金、技術、人才在內的一站式資源。
除了金融因素外,香港特區政府近年來,也在加碼對AI領域的重視和投入。
在香港特區2023至24財政年度的財政預算案中,數字經濟是重要發展規劃。
按照計劃,香港將撥款逾7億港元來加快數字經濟的發展。同時,為了推動香港的科研和人工智能產業發展,香港特區政府就建立人工智能超算中心進行可行性研究,并在2023/24年度完成。

5月16日,香港也擴充了優秀人才吸引計劃名錄。這一計劃從2018年開始實施,初期只包含11個職業。2021年擴充到13個職業。而5月16日的這次人才擴招,則一口氣擴充至51個職業,其中就包括人工智能、云端基礎設施、軟件、創新及科技、數據科學、網絡安全這些方面的專家。
投資人士認為,香港地區港幣、美元資金豐富,這也為該地區的AI投資創造了良好條件。而張一鳴在香港成立基金,投資科技行業,也有利于將來與字節自研大模型形成生態協同效應。
02 字節推自研大模型,年底能成嗎?
雖然張一鳴已卸任CEO,但依然是字節跳動重大戰略的籌謀者。從張一鳴的布局來看,字節跳動并不想缺席這場AI盛會。
目前,阿里、騰訊、百度、華為等10余家大型公司都發布了自己的大模型,市場也很關心字節跳動何時推自研大語言模型。
一位接近字節跳動的人士告訴《真故研究室》,時間節點或在年底,智能化程度將瞄準GPT-4。不過該消息并未獲得字節跳動官方確認。
從市場釋放的公開信息看,字節跳動在大模型上的布局分為語言和圖像兩方面。如同百度推的文心一格和文心一言。
語言大模型由字節搜索部門牽頭,目前團隊規模在數十人左右,或會借鑒ChatGPT的經驗,在抖音、Tik Tok上推出類似New Bing的功能;
圖像大模型團隊則由產品研發與工程架構部下屬的智能創作團隊牽頭,或以服務商業伙伴為主,幫助字節的廣告客戶以更低的成本制作圖片、視頻等材料。
兩個團隊負責人的直接或間接匯報對象,均為Tik Tok產品技術負責人朱文佳。
對于字節跳動推自研大模型,市場上有聲音認為,時間上入局晚了。不過也有聲音提出異議。
一家投資機構負責人告訴《真故研究室》,按照字節跳動過往風格,它研發大模型“不是上來就吹牛的邏輯”,而是悶聲干事。再者,這一領域并不存在早發晚發的優勢。
從目前看,研發大模型、類ChatGPT應用與布局AI的時間關系并不大,但與算力、算法、數據以及資金的關聯緊密,而恰好字節在這個層面上有較大優勢,可以靜觀其產品。
但字節同樣有著自己的短板,一是在AI生態的布局上起步較晚,二是參與生態布局的企業不多。
公開資料顯示,字節在AI領域的投資只有5筆,但在企業服務、文化娛樂上的投資分別達到了51筆和44筆。顯然,作為互聯網科技大廠,字節在AI領域的投資是不夠的。
而在2017年決定All in AI的百度,在2018年就以13起投資事件居于AI領域最活躍的企業風投公司名單榜首。2022年,百度新增投資了4家AI企業,全部是之前從未投過的新項目。
阿里對AI賽道的布局則始于2013年對小i機器人的投資。隨后的這些年里,阿里連續投了商湯科技、寒武紀、元戎啟行、思必馳、七牛云等代表性的AI公司。
而BAT最后的騰訊,也在2022年投資了9次AI賽道,其中有3家是對過往被投項目的追加投資。
03 百模大戰,同質化中誰能率先盈利
短短半年內,國內大模型已經經歷了從無到有、到百模大戰的地步。然而,問題也來了,即“產品同質化”。
很多國產大模型都是用ChatGPT來喂養自己,各大廠算力水平接近、數據量相差不大、技術上也沒有重大突破,反而都面臨著類似的短板。

在數據生態方面,國產大語言模型都標榜自己更懂中文,但實際上中文數據生態遠不夠英文數據生態龐大,這也是國產大語言模型經常出現事實性錯誤的原因。
算力問題則是老生常談了。雖然英偉達A800和A100芯片性能差距只有5%,但英偉達已經又推出了新一代計算卡H100了,而A100國內依舊買不了。
此外還有一個最重要的問題,如何商業化落地,并盡快獲得盈利。
目前,一些先發者在摸索商業路徑上的思路主要是向B端收費——先打造所謂的大模型生態,然后向B端提供解決方案,獲得收入。
百度在這方面的動作比較多,正積極擴大B端客戶規模。
據百度官方消息,文心一言剛發布時便有超650家合作伙伴接入,截至目前已有超300家生態伙伴參與文心千帆大模型的平臺內測,合作伙伴主要集中在金融科技、IT服務、辦公生態、算力等領域。
阿里大模型的生態,更優先布局旗下各產品線。包括天貓、淘寶、釘釘、高德地圖、優酷、盒馬等在內的產品,都在陸續接入通義大模型。其目的被認為既能內測產品,又能為市場打樣。
目前,大模型如何向C端收費,國外主要是會員付費訂閱模式。但國內受限于產品本身的成熟度(即還沒有達到GPT-4這樣的成熟程度),估計這條路短時間內還沒有到付費時機。
回到字節跳動的大模型會如何商業化,在目前產品還未出的情況下,猜測無益。倒是字節跳動旗下的火山云,在大模型的變現路徑上稍微清晰一些——向大模型創業公司提供算力支持。
網上流傳的一份《阿里云AI專家交流紀要0401》顯示,在國內大廠的AI算力儲備中,字節跳動排名第二,僅次于阿里。
大模型訓練需要巨大算力支持,而云廠商是公認的算力等基礎設施的最佳載體。
對火山云來說,這樣的商業化落地清晰明確,遠比燒錢做大模型研發更能保證資金正向流動。
目前,圍繞大模型的方向,市場主要有兩類聲音。
一是企業們不再需要浪費時間和精力去“重復造輪子”。二是認為 “多云多模態”才是AI浪潮的發展方向。
不過,還是那句話,能掙到錢的才是討論方向問題的關鍵。前兩年,元宇宙概念火爆,不管是行業還是學界,圍繞元宇宙,也有過“世界終極將只有一個元宇宙”還是會有多個元宇宙的討論。
事實證明,這些討論不說無用,而是由于用戶體驗沒有做到轉折點、商業模式自然也無法跑通,導致的結局就是:高大上的元宇宙也會成為蚊子館。
放在大模型上也一樣。據國盛證券此前對GPT技術訓練成本的估算,GPT-3訓練一次的成本約為140萬美元。對于一些更大的大型語言模型,訓練成本則在200萬美元至1200萬美元之間。
運行費用本身也是天價級別。以 ChatGPT在1月的獨立訪客平均數1300萬進行計算,其對應芯片需求為3萬多片英偉達A100 GPU,初始投入成本約為8億美元,每日電費則在5萬美元左右。
目前顯然各家都還處于燒錢賺吆喝的狀態。關注字節跳動何時推大模型,可能行業更大的關心是,如何能盈利。