1月26日,DeepSeek在美區蘋果App Store免費榜升至第六位,超越Google Gemini、Microsoft Copilot等美國科技公司的生成式AI產品。同日,DeepSeek出現了短時閃崩現象。不少網友反映,使用時遇到 “服務器繁忙” 的提示。對此,DeepSeek回應稱,當天下午確實出現了局部服務波動,但問題在數分鐘內就得到了解決。此次事件可能是由于新模型發布后,用戶訪問量激增,服務器一時無法滿足大量用戶的并發需求。不過,官方狀態頁并未將這一事件標記為事故。
【機會前瞻】
近日,由量化私募巨頭幻方量化創立的人工智能公司DeepSeek再次成為人工智能行業的焦點。自2023年7月成立以來,DeepSeek在大模型領域持續發力,推出多款開源模型,在全球AI市場掀起波瀾。
1月26日,DeepSeek在美區蘋果App Store免費榜升至第六位,超越Google Gemini、Microsoft Copilot等美國科技公司的生成式AI產品。同日,DeepSeek出現了短時閃崩現象。不少網友反映,使用時遇到 “服務器繁忙” 的提示。對此,DeepSeek回應稱,當天下午確實出現了局部服務波動,但問題在數分鐘內就得到了解決。此次事件可能是由于新模型發布后,用戶訪問量激增,服務器一時無法滿足大量用戶的并發需求。
2023年11月2日,DeepSeek發布首個開源代碼大模型DeepSeek Coder,支持多種編程語言的代碼生成、調試和數據分析任務。
2024年5月7日,DeepSeek發布第二代開源混合專家(MoE)模型 DeepSeek-V2,總參數達2360億,推理成本大幅降低,降至每百萬token僅1元人民幣,在降本方面展現出強大競爭力,被業內稱為 “AI 界的拼多多”。
2024年12月26日,DeepSeek-V3發布,總參數達6710億。該模型采用創新的MoE架構和FP8混合精度訓練,訓練成本僅為557.6萬美元,遠低于通常用于預訓練大語言模型的上億美元成本。在性能表現上,DeepSeek-V3在知識類任務、算法類代碼場景、工程類代碼場景、中文能力、數學能力等方面優勢顯著,在多語言編程測試排行榜中,超越Anthropic的Claude 3.5 Sonnet大模型,僅次于OpenAI o1大模型,在聊天機器人競技場(Chatbot Arena)上排名第七,開源模型中位居第一。
2025年1月20日,DeepSeek發布新一代推理模型DeepSeek-R1并開源,性能與OpenAI的o1正式版持平。僅僅六天后,1月26日,DeepSeek登頂美區App Store免費榜第六,超越谷歌Gemini和微軟Copilot等產品,其影響力迅速在全球范圍內蔓延。