界面新聞記者 | 宋佳楠
1月26日,360公司創始人周鴻祎以視頻形式分析了“中國大模型DeepSeek反超GPT,是怎么做到的”。
他在視頻一開始便給出判斷,稱中美AI競爭日益激烈,但最終中國必將勝利。談及中國大模型公司DeepSeek最近的表現,周鴻祎用 “簡直逆天”來形容,認為在對抗美國AI技術霸權的 “中國大模型技術復仇者聯盟戰隊” 中,DeepSeek必定占有一席之地。
周鴻祎特別指出,由于DeepSeek及其創始人非常低調,其技術能力和未來前景被市場嚴重低估。
“現在硅谷都把DeepSeek叫作來自東方的神秘力量,還有人說DeepSeek是不是雇傭了一批高深莫測的奇才,甚至有人認為,中國制造的大模型將和無人機電動汽車一樣成為不容忽視的創新力量。”周鴻祎稱。
就在1月20日,DeepSeek推出推理模型DeepSeek-R1正式版并開源模型權重,其在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。
不僅如此,該公司于2024年12月推出的DeepSeek- V3也以極低的訓練成本,實現了與GPT-4o和Claude Sonnet 3.5等頂尖模型相媲美的性能。
模式上,DeepSeek采用獨特的算法優化、數據處理和團隊協作模式,大幅降低計算成本,如V2模型將推理成本降低到每百萬token僅需1元,V3版本更是進一步優化。也因此,DeepSeek被稱為AI界的“拼多多”。
對于DeepSeek的強勢表現,美國著名投資公司A16z的創始人馬克·安德森評價稱,DeepSeek-R1是令人驚嘆和印象深刻的突破,強調其開源特性對全球科技界意義重大。
而在匿名職場交流平臺teamblind的熱帖顯示,Meta公司的工程師們為應對DeepSeek帶來的挑戰,夜以繼日地嘗試復制其技術成果。可見,DeepSeek的崛起讓硅谷科技巨頭感受到了競爭壓力,甚至使Meta內部陷入緊張氛圍 。
DeepSeek即為杭州深度求索人工智能基礎技術研究有限公司,成立于2023年7月。公司由知名量化資管巨頭幻方量化創立,作為大廠外唯一一家儲備萬張A100芯片的公司,幻方量化為DeepSeek提供了強大的硬件支持。其創始人梁文鋒是浙大學霸,團隊成員多來自頂尖高校。公司專注于開發先進的大語言模型和相關技術。
隨著對AI技術的持續突破,以及開放共享的策略,DeepSeek有望吸引更多開發者參與,構建繁榮的生態系統。而DeepSeek本身,業已成為中國AI領域的一支重要力量。