文|獵云網 王非
“全力以赴、堅決擁抱”,雷軍為小米大模型發展定調。
繼任命欒劍擔任技術委員會AI實驗室大模型團隊負責人后,雷軍于4月14日晚間在微博發文,首度談及小米對大模型和AIGC的看法。
除了定下發展基調,雷軍還透露,對于大模型,小米“正在研發一些有趣的技術和產品,等我們打磨好了,再給大家展示。”
事實上自3月份以來,各路互聯網大佬和技術大牛,以及BAT華為360商湯等大廠密集發聲,雷軍此番表態,可謂“雖遲但到”。
值得注意的是,雷軍在微博提及小米,在AI領域有AI實驗室、小愛同學、自動駕駛等團隊。
于是,小米在大模型領域的發力方向,可窺一二。
來源:微博截圖
出身微軟,欒劍成小米大模型領頭人
4月14日,據澎湃新聞報道,小米集團發布內部郵件,任命欒劍擔任技術委員會AI實驗室大模型團隊負責人,向技術委員會副主席、AI實驗室主任王斌匯報。
公開資料顯示,欒劍現任小米技術委員會AI實驗室語音生成團隊負責人,曾任東芝研究院研究員、微軟工程院高級語音科學家、微軟小冰首席語音科學家及語音團隊負責人等職位。
目前,網絡上關于欒劍的報道并不多。在知乎上,他的個人標簽為“小米NlP技術高級總監”。
2018年5月,知乎官方發布《我們和微軟小冰發了一首單曲 | 為「新知青年」而唱》一文后,欒劍本人還贊同了該文章。
據SegmentFault報道,2019年11月,在微軟小冰的一場內部WorkShop上,時任微軟小冰首席語音科學家欒劍與另外兩位“首席科學家”共同分享了微軟小冰當年在自然語言處理、語音學研究、多模態生成等領域研究進展。
來源:SegmentFault
彼時,欒劍以《小冰唱歌技術進展》為題演講。他提到,微軟小冰團隊“在語音合成領域大方面的東西可能已經解決,但語義理解方面,可能還需要通過長時間的積累和技術的發酵。”最終,團隊找到了一個更有挑戰性的課題——唱歌。做唱歌主要有三個原因:第一個原因,唱歌的門檻比說話高;第二唱歌的情感表達更加豐富激烈;第三它是一個很重要的娛樂形式。
值得一提的是,欒劍還在現場分享中提到,深度學習其實在上世紀90年代就火過一陣,但那個時候卻沒有取得像今天這么大的成果。他認為主要有兩個主要的原因:
1、因為硬件技術的方法,當時的算力還不夠,現在有GPU,而且GPU還在不斷地升級,所以它的計算能力在提高;2. 另外一個很重要的支撐就是數據,現在有大數據的支持,所以才能夠把深度學習做得這么好。
隨后,欒劍就從微軟跳槽到了小米,具體時間不詳。
北京大學現代信號與數據處理實驗室于2021年5月發布的文章顯示,2020年5月,小米人工智能部語音技術總監王育軍及其團隊應邀來校舉行北大&小米技術交流會。當天,欒劍博士的匯報題目是《語音生成技術》,介紹了語音合成的基本概念,并就該領域的關鍵問題展開討論。
來源:北京大學現代信號與數據處理實驗室
今年以來,ChatGPT爆火后,欒劍也在4月份接連在知乎發布兩篇文章,分享自己的感悟。
作為“一個AI領域近20年的從業者”,欒劍在4月5日發布的《一個關于ChatGPT能力涌現成因的猜想》一文中認為,產生“涌現”能力的三要素可總結為:
大數據:如果數據不夠豐富,就可能也沒必要挖掘出“概念”與“常識”;大模型:如果參數量不夠多,模型沒有足夠的空間去完成“層級結構”;多任務:如果任務比較單一,模型沒有動力去做結構調整,“平行結構”成為模型的“偷懶”選擇。
隨后在4月8日發布的《hatGPT的訓練過程對“雞娃”的啟示》一文中,欒劍“通過類比,嘗試定性地探討兒童教育可以從ChatGPT的訓練過程中得到哪些啟示”。
出身微軟,擁有豐富的AI語音技術儲備和工作經歷,如今擔任小米大模型團隊負責人后,欒劍如何發揮自身優勢,又能與“小愛同學”碰撞出怎樣的火花,我們也只能拭目以待。
內有千人AI團隊,外有金山云護駕
當地時間4月14日,英國《金融時報》援引知情人士消息報道,特斯拉CEO埃隆 馬斯克(Elon Musk)正在組建人工智能初創公司,為了與ChatGPT的研發公司OpenAI展開競爭。
作為中美互聯網圈,最受矚目的“網紅創始人”。馬斯克都來了,雷軍還會遠嗎?
巧合地是,兩人都是在4月14日,針對大模型,顯露出自己的布局。
事實上,小米入局大模型領域可謂“水到渠成”。
從內部人才儲備來看,小米目前已擁有超過1200人的AI團隊。如今,雷軍也終于為大模型團隊選定了欒劍為“舵手”。
來源:小米官網
從服務能力協同來看,雷軍手中亦有金山云這張底牌。金山云是金山軟件的附屬公司,在公司掌舵人雷軍超前布局下,是與阿里巴巴最早在中國全力進軍云計算的企業。
ChatGPT熱潮帶來的AI競爭,最直接的受益者正是云計算平臺。
一方面,生成式AI應用背后的大模型需要更強的算力。OpenAI此前公布過一組數據,目前大模型訓練所需算力的增速保持在3-4個月/倍速度增長,遠超摩爾定律18-24個月/倍。
另一方面,區別于傳統云計算平臺提供的算力、存儲等資源,擁有大模型的云廠商未來可以提供基于大模型開發應用。李彥宏不久前在接受采訪時就拋出過類似的觀點,未來企業在購買云計算的時候不看底層算力,而是看大模型的優劣。
就在本周,阿里和騰訊先后官宣“大動作”。
在4月11日舉辦的阿里云峰會上,張勇表示,智能化時代帶來算力的爆發,同時也提出了更高的要求,阿里云將為AI時代提供好算力基礎和大模型能力,全面服務智能化進程。為此,阿里云要做好核心兩件事:第一,讓算力更普惠,推動自研技術和規模化經營的正循環,持續釋放技術紅利;第二,讓AI更普及,讓每家企業的產品都能接入大模型升級改造,并有能力打造自己的專屬大模型。
隨后在4月14日,騰訊面向大模型訓練,發布“超強算力集群”,要助力企業云上訓練AI大模型,解決中小企業和創業公司的算力壓力。
金山云方面雖然并未像阿里騰訊那樣“聲勢浩大”,但也已有相關動作。
天眼查App顯示,近日,北京金山辦公軟件股份有限公司申請注冊多個“chat 會議”“chat 演示”“chat 表單”“chat Office”“chat everything”等商標,國際分類為網站服務,當前商標狀態均為申請中。
來源:天眼查
內有千人AI團隊并由欒劍掌舵,外有金山云護駕,小米大模型已順利起航。
小愛同學距ChatGPT,還差一個文心一言
早在今年2月的小米投資者日上,對于小米在ChatGPT上的布局,小米手機部總裁曾學忠就表示,ChatGPT基于AI大模型、千億級參數量、數據量、還有人工標注支撐,AI大模型方面小米一直都有投入。手機和汽車業務有很多AI大模型落地的場景。
隨后,在今年3月的2022年財報電話會議上,小米集團總裁盧偉冰談到ChatGPT相關問題時表示,小米很早就在AI大模型方面進行了許多部署,同時采用了多技術路線并行的策略,小愛同學就是小米大模型落地的代表。
據盧偉冰介紹,小愛同學已經做了6年,在與用戶的交互體驗中積累了長期可復用的經驗,同時,小米有豐富的場景落地經驗,小愛同學支持手機、音箱、車等多場景的智能融合。未來小米將繼續大模型研究,引入更加先進的大模型能力,包括探索多模態能力、智能座艙交互體驗提升等。
不難發現,小愛同學或許是小米在大模型領域,最直觀最先落地的產品。
來源:小米官網
然而,需要注意的是,小愛同學的產品能力,與基于GPT-3.5訓練而來的ChatGPT仍有不小差距。何況,OpenAI也已發布了更為先進的GPT-4大模型,就連GPT-5也已身處“傳說”中。
此前,微軟CEO薩蒂亞·納德拉最近在接受英國《金融時報》采訪時表示,蘋果的Siri、亞馬遜的Alexa,微軟自家的Cortana(中文名:小娜)以及公認拔尖的Google Assistant,這些語音助手有一個算一個:都笨得跟石頭一樣。
隨后,微軟在2021年就正式宣布停止支持iOS和Android上的Cortana應用,僅保留對Windows平臺的支持。
直到OpenAI帶來了ChatGPT,微軟直接“滿血復活”,戰斗力爆表。
Siri聯合創始人Adam Cheyer也在近期表示,ChatGPT理解復雜信息的能力讓現有的語音助手看起來很蠢。
那么,“小愛同學+ChatGPT”,究竟會怎樣?
在全球最大的代碼托管平臺Github上,有開發者嘗試將ChatGPT接入小愛同學,Star數已經達到了1.3k。據項目介紹,只要有ChatGPT的賬號、小愛音箱、正常連接ChatGPT的網絡以及python 3.8+,人人都可以在小愛音箱上使用“ChatGPT版小愛同學”。
具體原理為,喚起小愛同學后,以“幫我”開頭詢問的問題會自動以文本形式發送一份給ChatGPT,同時會屏蔽小愛同學原本的回答,替換成“正在問GPT,請耐心等待”,而ChatGPT生成的文本則會被小愛同學通過TTS(語音合成技術)進行語音回答。
從開發者的演示顯示,整個過程足夠流暢,實際回答也遠超小愛同學原本的“智力”。
然而,小米官方顯然不能直接與OpenAI合作,推出“ChatGPT版小愛同學”。
作為對比,早在今年2月,百度旗下人工智能助手“小度”就宣布,小度將融合“文心一言”的全面能力,打造針對智能設備場景的人工智能模型“小度靈機”,并應用到小度全系產品。
隨后在3月份的文心一言發布會上,百度創始人李彥宏曾表示,文心一言差不多是今年1月份ChatGPT的水平,但差距不大,可能只是一兩個月的時間。
由此可見,小愛同學距離ChatGPT,至少還差一個文心一言,然后再加“一兩個月的時間”。