界面新聞記者 | 宋佳楠
4月2日,全球最大的AI開源社區Hugging Face更新大模型榜單,阿里通義千問的端到端全模態大模型Qwen2.5-Omni占據榜首,DeepSeek-V3-0324和群核的SpatialLM-Llama-1B緊隨其后,杭州公司包攬全球開源模型榜單前三。
通義千問的Qwen2.5-Omni能同時處理文本、圖像、音頻和視頻等多種輸入,并能實時輸出文本,進行自然語音合成。在多模態融合任務OmniBench等測評中,它的性能表現刷新業界紀錄。
與那些參數動輒數千億的閉源大模型不同,Qwen2.5-Omni參數規模僅為7B,尺寸小巧,這使得全模態大模型在端側設備和產業場景中的廣泛部署成為可能。
自發布以來,該模型迅速在全球開發者和企業中掀起下載和部署的熱潮,加速了更多智能應用的落地。截至目前,阿里已向全球開源200多款模型,千問衍生模型數量突破10萬,超越美國Llama系列,成為全球最大的開源模型族群。
位居第二的DeepSeek-V3-0324,同樣有著不錯的表現。它在理解復雜指令、邏輯推理以及知識運用等方面較為突出,還針對中文搜索、寫作能力以及前端代碼生成任務等進行了優化。在此次登上全球開源模型總榜前三之前,DeepSeek-V3已經在AI圈內名聲大噪,吸引了眾多開發者和研究人員的關注。
排名第三的SpatialLM-Llama-1B,是群核科技自主研發的空間理解模型。群核科技由黃曉煌、陳航和朱皓于2011年在杭州創辦,三人具有浙大、清華等背景。
SpatialLM-Llama-1B克服了對物理世界幾何與空間關系理解的局限。例如該模型通過一段視頻,可生成符合物理規律的3D場景布局,有望為建筑設計、室內裝修、虛擬場景搭建等領域帶來改變。
事實上,2月Hugging Face發布的開源大模型榜單,排名前十的均為基于阿里通義千問(Qwen)開源模型二次訓練的衍生模型。在Hugging Face 2024年的開源模型下載中,Qwen模型系列中的Qwen2.5-1.5B-Instruct下載量占總下載量的26.6%,是全球下載量最高的開源模型之一。
Hugging Face作為全球最大的AI開源社區,成立于2016年,專注于NLP(自然語言處理)技術,總部位于美國紐約。其發布的榜單測試維度覆蓋閱讀理解、邏輯推理、數學計算、事實問答等多個方面,是衡量開源模型性能的重要參考。
對于開源模型的發展態勢,零一萬物創始人李開復近日在接受界面新聞記者采訪時提及,未來越來越多的基座模型會開源,下一階段的競爭,就是誰能做最好的開源模型。
在李開復看來,全世界每家大模型公司現在只會焦慮自己是否過度依賴閉源模型。相反,主動擁抱DeepSeek等開源模型,盡早做出差異化打法的公司,可以每天睡得很安穩。
此次杭州公司包攬全球開源模型榜單前三,在證明自身技術實力與創新能力之時,也有助于吸引更多人才與資源,從而推動中國AI產業競爭格局朝著更加多元化、創新化的方向發展。