文|融中財經
最新消息,阿里通義千問大模型技術負責人周暢(花名:鐘煌)將從阿里云離職。
周暢原是通義實驗室算法團隊的核心技術骨干之一,此次屬于正常離職。通義大模型的研發和開源工作還在進行中,目前通義實驗室負責人為阿里云CTO周靖人。周暢為“通義千問”的大模型負責人。
根據個人履歷,周暢于2012年本科畢業于復旦計算機科學與技術專業,2017年博士畢業于北京大學計算機軟件與理論專業,而后加入阿里巴巴。他先后在達摩院任職算法專家,再到通義千問的大模型負責人。其專攻領域為深度學習、圖挖掘和分布式計算,他在機器學習、數據挖掘、數據庫領域國際頂級會議上發表30余篇文章。值得一提的是,根據多方媒體報道,周暢已確定要創業,劍指AI。只不過具體方向尚未得知。有意思的是,目前網上有多位獵頭傳出的消息稱,周暢此次創業已經獲得多位投資人的青睞。這其中還包括阿里巴巴吳媽吳泳銘旗下的元璟資本。
目前并沒有關于周暢的具體信息,但根據其2012年本科畢業來推算,周暢大概為一名90后。
這位與“通義大模型家族”的輝煌歷程緊密相連的90后迎來轉身時刻。或將從阿里巴巴集團AI技術瑰寶化身為90后AI創業大軍中的一份子。后續的故事發展如何十分令人期待。
阿里通義大模型的中流砥柱
如今再翻看周暢的領英賬號,發現上面仍顯示其為阿里巴巴資深算法專家。
根據資料顯示,周暢于2017年7月加入了阿里巴巴,曾任達摩院智能計算實驗室高級算法專家。在加入阿里期間,周暢的學術研究收獲碩果累累,論文被各大頂會收錄,谷歌學術被引8000+。
與此同時,周暢在達摩院期間在多個項目中發揮了重要作用,如研發超大規模商品圖表征算法 APP、用戶表征框架 ATRank、基于自監督對比學習的向量召回算法 CLRec 系列等。
加入阿里巴巴后周暢還親眼見證了阿里大模型的發展,并且是其發展過程中的重要推動者。
2020-2021年間,他帶領團隊設計并實現了超大規模的多模態預訓練模型M6,在參數數量和低碳訓練模式上取得了突破。據阿里云當時介紹,M6模型參數規模高達1000億,是多模態預訓練領域史上最大的模型。在阿里云關于M6模型發布的推送下,周暢曾留言稱:"歡迎廣大英才加入我們的團隊繼續這項工作!"
從某種程度上來說,這款M6模型正是如今大眾所熟悉的阿里通義大模型前身。
到今年,國內AI行業已過萌芽期,基礎大模型格局已經形成。像智譜AI、Minimax、月之暗面、百川智能等創業公司涌現。騰訊、百度、字節跳動等大廠也紛紛入局,當然這其中自然少不了阿里巴巴。
以周暢M6為前身的阿里通義大模型最早于2023年4月推出,并邀請用戶測試體驗。作為“阿里版GPT”,通義千問具有多輪對話、文案創作、邏輯推理、多模態理解、多語言支持等功能。
在“通義千問”面世4天后,張勇宣布,未來阿里巴巴旗下所有產品都將接入通義千問。此外阿里云還表示,將面向公眾開放通義千問的能力,幫助企業打造專屬大模型。
到2023年底,ugging Face最新發布的開源大模型排行榜上,“通義千問”(Qwen-72B)取得了令人矚目的成績,以73.6的綜合得分在所有預訓練模型中排名第一。通義千問的表現超越了Llama 2-70B以及眾多商用閉源模型,一舉成為業界最強的開源大模型。
據悉,這個排行榜被公認為是大模型領域最具權威性的榜單,匯集了來自世界各地的上百個開源大模型,并通過六大評測維度進行綜合評價,包括閱讀理解、邏輯推理、數學計算、事實問答等。也就是在這份備受矚目的排行榜上,阿里凸顯了集團在人工智能領域的技術實力,也表明了中國科技企業在大模型研發方面的領先地位。
2024年5月9日,通義大模型發布一周年之際,阿里云正式發布通義千問2.5,模型性能全面趕超GPT-4 Turbo,成為地表最強中文大模型。同時,通義千問1100億參數開源模型在多個基準測評收獲最佳成績,超越Llama-3-70B,成為全球開源領域最強大模型。
在這個大模型群雄并起,互相內卷的時代里,阿里巴巴靠著通義千問交出了一份優異答卷。而在這份答卷的背后,毫無疑問周暢是重要的見證者與親歷者。
2022年時,中國電子學會公布“2021中國電子學會科學技術獎”名單,其中浙江大學、達摩院、阿里云完成的“超大規模高性能圖神經網絡計算平臺及其應用”獲得科技進步一等獎,主要完成人里面就包括楊紅霞、周靖人和周暢等。有意思的是,楊紅霞早已于2022年離職并進行創業,而如今周暢也將離職進行下場創業。
高產大牛下海AI創業
相似的一幕正在國內AI界持續上演。2022年ChatGPT的推出讓AIGC爆火,吸引來無數優秀創業者瞄準此賽道進行創業。不少像周暢這樣的大廠骨干選手被曝單飛創業,AI界的創業熱潮正在如火如荼地進行中。
此前,融中財經采訪了AI營銷公司奧創光年。截至目前,該公司已經完成三輪融資,投資機構中包括萬物資本、真格基金、凱輝基金、美圖等。
根據采訪中,市場部VP任一總透露的消息,在2023年,奧創光年客戶簽約合同金額增幅超300%,破億元。同時,奧創光年已成功服務過如阿里巴巴、百事、歐萊雅和聯合利華、莊臣等上百余家一線品牌集團及電商平臺,眾多客戶仍處于年框合作或續約合作階段,并不斷擴大合作深度與規模。對于一家AI初創公司來說,這樣的業績實屬不易。
值得一提的是,奧創光年的兩位創始人徐哲和楊海此前就是阿里巴巴的工作人員。二人在阿里巴巴相識,并先后離開阿里巴巴各奔前程,在不同的領域闖出了一片天地。對于一個打工人來講,彼時他們二人已經站在了各自事業的頂峰上。
之后的二人在調研了100家企業的一號位,發掘行業痛點,最后決定投身于AI創業,成立了現在的奧創光年。徐哲和楊海也成為了從大廠高管向AI創業者身份的完美轉變。
而像周暢、徐哲、楊海同類型的AI創業者還有很多。
前不久的7月16日,百度研究院副院長,百度認知計算實驗室主任李平離職,創立Ai Infra公司vecml,并擔任CEO。據百度百科資料,李平2007年博士畢業于斯坦福大學,獲得統計學博士學位,計算機科學碩士學位和電子工程碩士學位。博士畢業后,李平曾在康奈爾大學和羅格斯大學任教,并于2013年成為計算機系和統計系終身教授。2017年底,李平以杰出科學家(T10)加入百度美研,成為百度研究院大數據實驗室負責人。2018年,李平晉升為T11,大數據實驗室改名為認知計算實驗室。
根據媒體報道,在百度期間,李平和團隊在深度學習算法、知識圖譜和信息抽取、基于圖的近似近鄰檢索和最大內積檢索、樹模型、哈希算法和近似近鄰檢索(ANN)算法、機器學習基礎理論與方法、推薦和LTR技術、自然語言,大數據,和數據挖掘等方向發表了多篇國際頂會論文,并同百度鳳巢廣告,Feed流,搜索,百度知道,輸入法,百度地圖等多個團隊展開深入合作,把研究成果應用于各項產品,產出顯著效果,并能從實際問題中發展新的研究方向和課題。而他創立的公司vecml則是致力于下一代大模型應用,構建一個成本更低、更加安全、準確性更高的AI 基礎設施。
同樣是在前不久,被稱作“AI教母”李飛飛創立的World Labs也有新消息,已突破10億美元估值,不到4個月成為新晉獨角獸;還有前螞蟻集團副總裁漆遠,其創業方向也被揭秘,產學研并行創立大模型公司無限光年,被曝劍指“可信大模型”;辭去亞馬遜首席科學家一職的李沐,創建了Boson.ai,目前也已經推出了首個大模型成果。
這樣類似的消息不止是在國內發生,像國外的科技巨頭如谷歌、微軟、Open AI都有內部工程師下海進行AI創業的消息傳出。比如Open AI和特斯拉的AI部門主管卡帕西在近期官宣創業,創立了一家AI原生的新型學校Eureka Labs。
在當今快速發展的科技時代,人工智能AI已成為推動各行各業創新的關鍵力量。隨著AI技術的成熟,市場對于AI專業人才的需求激增,這為高管們提供了一個展示自己才華和實現個人價值的平臺。在大廠中,他們可能已經達到了打工人的巔峰,但創業可以為他們提供更大的舞臺。
而相比于無經歷的直接創業者們,在大廠當高管的經歷讓他們無論是技術還是商業運營上都積累了一定經驗,對于“路子”也有了一定的了解,這也讓他們在創業的路上走的得心應手一些。
隨著這些大佬的紛紛加入,風云變幻的AI界也增添了一些新的可能。
AI產業新時代即將來臨
人工智能的熱潮史無前例。前不久的中國互聯網大會上,一組組亮眼數據得到公布。
目前我國共421家國家級的智能制造示范工廠、萬余家省級的數字化車間和智能工廠、超過4500家的人工智能企業……中國信息通信研究院公布的數據顯示,在人工智能領域,2023年我國人工智能產業應用進程持續推進,核心產業規模達到5784億元。而在行業投融資方面,2023中國 AI 行業已發生投融資事件815起,融資總額達2631億元,融資金額比去年上升了51%。
正在持續爆火的人工智能也引發了業界專家們的下一步思考。過去的幾十年里,人工智能技術已經從實驗室的深奧理論走向了現實世界的廣泛應用。這一轉變不僅僅是技術的進步,更是商業模式、工作方式乃至生活方式的徹底革新。隨著機器學習、深度學習等技術的成熟,見證了人工智能如何在醫療、金融、教育、制造業等多個行業中找到其價值的實際落地點。
如今,人工智能正大步走向“應用”,即將催生新一輪的AI產業變革。
此前,摩爾線程產學院執行院長及投融資部總經理羅文勇在融中2024新質生產力創新企業峰會上表示:“現在的AI成了最大的應用場景,就像20年前的移動互聯網,可以賦能千行百業。”
舉例來說,實體經濟是國家立身之本是眾所周知的道理,其中制造業是實體經濟的關鍵。此前國家多次發布政策強調提升制造業的發展質量,以創新驅動發展,加快人工智能等數字技術賦能,全面促進產業升級,催生新模式、新功能的誕生,實現制造業的快速增長。科技部等六部門發布《關于加快場景創新以人工智能高水平應用促進經濟高質量發展的指導意見》,鼓勵在制造等重點行業深入挖掘人工智能技術應用場景,促進智能經濟高端高效發展;另一方面,《“十四五”智能制造發展規劃》等政策強調,加強關鍵核心技術攻關,研發人工智能、5G、大數據、邊緣計算等在工業領域的適用性技術,增強融合發展新動能。
作為國內AI企業的龍頭之一的商湯此前也提供了許多內部的例子。比如針對“老年人難以使用金融APP”這一問題,商湯科技和上海銀行聯手開發了金融大模型,后端金融大模型學習了四千款大模型產品,針對老年人提的各種復雜問題做解答。前端交互做了4K超寫實數字人,就像線下大堂經理、理財顧問一樣,給老年人非常好的專業服務與聊天對話,獲得市場好評。
技術是推動社會創新的源泉,這是毋庸置疑的真理。極佳科技合伙人、工程副總裁毛繼明也明確表示過:“人工智能作為一個技術,一定要完成應用場景落地,一定要為各行各業進行產業升級提供支撐才能發揮其應有的價值。同時,在AI技術與場景結合的過程中,領域數據與經驗也會完成下沉,反哺AI技術底座,令其得到快速進化。技術與場景應用,兩者會相互促進相互推動,產生飛輪效應,這也是企業擁有持續競爭力的重要手段之一。”
AI的發展進入新時代,同時以周暢為例的精英們集體涌入AI創業,他們又會在在新的發展邏輯下講述出什么新故事呢?