文|數智前線 黃幸怡
編輯|游勇
01 ChatGPT里的清華元素
OpenAI旗下大語言模型ChatGPT的成功讓人眼前一亮,更讓外界意想不到的是,這個產品不是出自擁有數千名人工智能團隊的谷歌或者Facebook,而是僅成立8年只有三百多人的OpenAI。
來自全球各地的頂尖人才為OpenAI和ChatGPT的成功奠定了基礎。今年1月,OpenAI創始人及CEO奧特曼透露公司員工人數為375人 ,與谷歌和臉書等科技巨頭從事人工智能工作的數千名員工相比,這是一個很小的數字。“我知道我不應該吹噓OpenAI,我們要感謝我們所有的外包公司為訓練模型提供了必不可少的數據。”
而真正在ChatGPT項目中做出貢獻的人員,據OpenAI官網顯示,共有87人。ChatGPT只是OpenAI其中的一個項目,比如OpenAI之前發布的文本生成圖像的大模型DALL-E,兩個半月注冊人數突破100萬,也在人工智能領域備受關注。
在最近一份由智譜研究聯合AMiner發布的《ChatGPT團隊背景研究報告》中,這群人的顯著特征被歸納為了“年紀很輕”、“背景豪華”、“聚焦技術”、“積累深厚”、“崇尚創業”和“華人搶眼”幾個方面。
智譜研究發布的報告顯示,該團隊平均年齡為32歲,“90后”是主力軍。作為全球人工智能頂尖研發團隊,其成員絕大多數擁有名校學歷,但也并非“清一色”研究生學歷,而是本、碩、博人數相對均衡。同時,其成員大多具有全球知名企業工作經歷,其中,從谷歌跳槽而來的有10人,是為其貢獻最多人才的外部企業(ChatGPT基于的也是谷歌提出的Transformer模型)。作為應屆生直接加入ChatGPT 團隊的也有11人,但不論是來自其他企業,還是作為應屆生加入的人員,背景都相當“豪華”。
而在技術上,該團隊共有包括OpenAI 聯合創始人Wojciech Zaremba在內的5人入選了今年“AI 2000 全球人工智能學者”名單。該名單由AMiner 每年推出,評選出全球人工智能 20個細分領域前 100 名最具影響力學者。這意味著,在 ChatGPT 不足百人的團隊中,就有 5 人屬于全球人工智能各領域頂尖學者,技術積累深厚。
此外,最值得一提的是,華人成為了該團隊中一支重要的科技創新力量,共9人,占團隊總人數的比例超10%。華人學者歐陽龍更是參與了與 ChatGPT 相關的 7 大技術項目中的 4 大項目的研發,是InstructGPT 論文的第一作者,也是RLHF 論文的第二作者。“可見他是這兩個關鍵技術項目的核心人員。”智譜研究分析稱。
在華人團隊中,有5人本科就讀于中國內地高校,其中3人(翁家翌、趙盛佳、袁啟明)均來自于清華大學,并各有1人本科畢業于華中科技大學、北京大學/香港大學。不過,這5人后續均在海外高校繼續深造。
其中,翁家翌是ChatGPT團隊里最年輕的研發工程師之一。他于2020年從清華大學計算機系本科畢業,進入卡內基梅隆大學攻讀碩士學位。在清華期間,翁家翌曾加入清華大學人工智能研究院基礎理論研究中心主任朱軍領導的TSAIL實驗室,并在大三暑假加入加拿大圖靈獎獲得者 Yoshua Bengio 的實驗室,深入開展RL和NLP的研究。其更是一度以本科生身份,成為基于 PyTorch 的強化學習算法庫 Tianshou(天授)的第一作者。
清華大學也以3名成員的數量,與卡內基梅隆大學一起,并列ChatGPT團隊畢業院校的第7名。排在他們之前的分別是斯坦福大學(14 人)、加州大學伯克利分校(10 人)、麻省理工學院(7 人)、劍橋大學(5 人)、哈佛大學(4 人)和佐治亞理工學院(4 人)。
02 清華走出的人工智能大牛
ChatGPT團隊中出現不少的華人力量和清華元素令人意外。但實際上,華人尤其是清華系,早已成為全球人工智能領域中的一個中堅力量。
2021年,AMiner曾根據AI2000人工智能全球最具影響力學者榜單,結合學者H-指數、論文數和影響因子,并經過去重處理后發現,過去十年,全球為AI發展貢獻了力量的高層次學者共有1833位。這些人工智能領域的技術大牛共覆蓋了37個國家,其中,美國1244人,占比62.2%,中國以196名位列第二,遠超以113名排在第三的德國。
而在這196名華人學者中,無論是本碩博畢業院校,清華大學都排在最前列。如本科畢業于清華的有41位,排在其后的分別是中國科技大學(21位)、北京大學(19位);碩士階段畢業院校中,國外的麻省理工和伊利諾伊大學進入前十;到博士階段,排名前十的院校中,國外高校整體數量則進一步增加到一半占比。
類似的情形依然還在上演。在最新的“AI2000全球人工智能學者”名單人工智能細分板塊下,以“在某個領域的頂級期刊和會議上發表的論文的總引文數”作為排序標準的榜單前100學者中,共有19名華人,占比約為兩成,前10榜單中,華人學者占比更是達到了四成。
其中,位列第一的何凱明,本科就讀于清華大學,博士畢業于香港中文大學多媒體實驗室,并在2011年加入微軟亞洲研究院(MSRA),主要從事計算機視覺和深度學習研究,后來又在2016年,加入Facebook AI Research(FAIR)擔任研究科學家。
國內人工智能的創業公司里也有不少清華的身影。
被稱為“AI四小龍”的曠視科技,其CEO印奇、CTO唐文斌和高級副總裁楊沐均畢業于清華大學計算機科學實驗班,也即傳言中“狀元擠破頭都進不去”的“姚班”,師從2000年圖靈獎獲得者,同時也是唯一一個獲得該獎項的中國人——姚期智。而當他們在2011年創業時,印奇才不過23歲,唐文斌24歲,楊沐22歲。
同屬于“AI四小龍”的商湯科技,雖然創始人湯曉鷗并非出自“清華系”,而是在中科大完成本科學業后外出留學,但聯合創始人之一的楊帆卻先后在清華大學獲得了電子工程學學士學位及碩士學位,001號員工徐持衡則是在高二通過奧賽保送至了清華,并在2013年大學畢業后加入湯曉鷗的實驗室,后來成為商湯科技的聯合創始人、001 號員工。而在去年從商湯執行研究總監崗位上離職回到母校任職的代季峰,同樣來自于清華,并在清華一路攻讀到博士以后,一度進入微軟亞洲研究院工作5年之久。
不過,無論是商湯還是曠視主攻的方向是機器視覺,而不是自然語言處理。而這兩家企業也遇到了人工智能技術不好落地和商業變現難的窘境,一直以來虧損比較嚴重。
在此之外,據不完全統計,包括同是“姚班”學生的小馬智行聯合創始人兼CTO樓天城、英語流利說創始人兼CEO王翌、地平線聯合創始人兼CTO黃暢、兆易創新創始人兼CEO朱一明、被賽靈思收購的深鑒科技創始團隊姚頌、汪玉、韓松、單羿等諸多人工智能領域創業公司的創始人和聯合創始人均畢業于清華。而在更早之前的搜狗創始人王小川也是畢業于清華大學計算機系。
各大廠的AI業務線同樣有不少來自清華的大牛。如華為云人工智能領域首席科學家田奇,阿里巴巴平頭哥首席科學家、達摩院高級研究員謝源,京東集團副總裁兼京東人工智能研究院常務副院長、深度學習及語音和語言實驗室負責人何曉冬等。
03 為什么是清華?
1956年,美國新罕布什爾州的達特茅斯學院里,一群科學家正聚在一起討論一個看起來有點異想天開的話題——如何用機器來模仿人類學習及其他方面的先進智能。這場會議足足開了兩個月后,大家并沒有能夠達成普遍共識,但卻為討論的內容起了一個名字:人工智能。
這一年,最終成為了公認的人工智能元年,一個新科技時代的序幕由此拉開。
當人工智能概念開始在大洋彼岸點燃星星之火時,中國也出臺《十二年科技發展遠景規劃》,開始了大踏步追趕世界先進科學技術水平的歷程。清華大學計算機系的前身“自動控制系”也在兩年后正式成立。同年,后來的中國人工智能奠基人之一、中科院院士張鈸從清華大學自動控制系畢業,成為國家第一批自動控制專業畢業生,并開始留校擔任教學任務。
但一直到23年后的1981年,張鈸才作為訪問學者在美國伊利諾依大學進行人工智能、智能機器人的研究工作時,和當時在安徽大學任教的數學家張鈴一起通過長期的跨國合作,聯手完成了一篇人工智能領域的論文,并發表在人工智能領域頂級國際期刊《IEEE模式分析與機器智能匯刊》上。這也成為了中國科學家在人工智能領域的第一篇學術論文。
科研上”跨國交流“尚且不夠,張鈸還通過直接將伊利諾伊大學使用的教材和相關材料全部復印并寄回國內的方式,跨國豐富了清華大學計算機系的教研工作。而后,“智能機器人”實驗室等相關實驗室也逐漸在清華建立起來。
盡管一直到21世紀初,人工智能在國內依然不溫不火。但較早開展AI技術研究無疑是清華后來能在人工智能領域有優異表現的重要原因。
張鈸后來曾在談及清華大學在人工智能方面的優勢時提到,清華大學是最早在中國開展人工智能研究的單位之一,基礎理論方面比較強,且一開始就集中力量進行AI基礎理論的研究;第二點則在于人工智能是一個交叉性尤其明顯的學科,而清華由于較早介入了相關研究,相關交叉學科實力比較強。
實際上,學科交叉這件事,與姚班創辦人姚期智不無關系。早在2010年底,姚期智就率先成立了清華交叉信息研究院,自己親任院長,力圖將量子物理、生物醫學、經濟金融等領域和計算機科學的技術結合起來。
如今AI領域的“清華系”人工智能大牛們,也有大量出自姚期智2005年創辦的姚班。如曠視科技的印奇、唐文斌、楊沐,小馬智行的樓天城等。2019年和2021年,姚班還在清華分別增設了人工智能班(“智班”)、量子信息班(“量信班”),并在2022年8月將姚班、智班、量信班合而為一,重新統稱姚班(即計算機科學實驗班)。
而“姚班”其實也是清華大學“加強國際合作與交流”工作的一項突出成果。過去二十多年間,清華利用企業贊助的資金,邀請世界著名的教授來參與清華的培養工作。姚期智正是清華計算機系第一期(2003-2006年)講席教授組首席教授。
更重要的是,清華的研發資金相對“寬裕”。除國家投入之外,常常有不少清華校友“慷概解囊”。王小川就曾在2016年4月,清華大學105周年紀念日時,向母校捐贈了1.8億元,并聯合清華成立了清華大學天工智能計算研究院,用以研究人工智能相關的前沿技術。在平時,王小川和搜狗更是長期資助清華大學的智能體比賽,鼓勵清華學生寫程序和玩游戲。
這些都在促使清華大學計算機系在一些國際榜單上的排名大幅提升。例如在U.S.News2019年世界大學計算機科排行榜TOP10中,清華大學曾以總分100分的成績位居榜首,同年進入前十的國內高校還有華中科技大學(第6)、浙江大學(第9)和東南大學(第10)。在CSRankings以計算機領域各大頂會的論文數量為衡量指標更新的2020-2021年排名中,清華和北大則力壓CMU,分別排在了第1、2位。
正常人才培養之外,清華還孵化了大量的AI創業團隊。如成立于2018年7月的人工智能技術和行業解決方案提供商“瑞萊智慧(RealAI),孵化自清華大學人工智能研究院,至今已完成5輪融資,最近一次是2021年底的近億元戰略融資,并由清華大學人工智能研究院院長張鈸擔任首席科學家。智譜研究背后的智譜AI同樣孵化自清華,由清華大學計算機系的技術成果轉化而來。
當然,在人工智能領域發光發熱的并不止清華。一位行業內人士透露,浙江大學、上海交大、北大、華中科技大學等高校這些年都在培養人工智能技術人才上比較突出。
此外,值得注意的是,最近一兩年來,學界正在掀起一股“學術大佬回歸潮”,其中不乏人工智能領域的大牛。如人工智能專家朱松純在2020年回國擔任了清華大學基礎科學講席教授、北京大學講席教授,2021年出任北京大學智能學院院長、清華大學通用人工智能研究院(籌)院長。
在ChatGPT爆火之后,國內一度有些“技不如人”的失落,同時也在期盼著中國的ChatGPT和OpenAI。正如王小川在朋友圈所言:“OpenAI的成功,首先是技術理想主義的勝利。中國需要自己的OpenAI,就需要技術理想主義。大廠受自己的業務牽引,追逐資本熱點的創業公司更動作變形。不止如此,這種理想主義還需要有愛國之心、商業智慧和學術尊重去獲得政府支持,推動企業聯盟和學術界協同。中國能誕生自己的OpenAI”。
參考資料:
1、《ChatGPT團隊背景研究報告》,AMiner、智譜研究,2023.02
2、《華人AI學者大盤點:清華培養了最多的高層次人才,韓家煒、吳恩達論文被引數“登頂”》,學術頭條,2021.02
3、《馬少平、周楓、王小川、樓天城、唐文斌……清華計算機系與人工智能的40年》,清華小五爺園,2018.04
4、《清華辦 AI:除了洞見,更有沉淀》,AI科技評論,2020.04