久久91高清无码视频,91wan爆乳在线

DoNews > 商業(yè) > DeepSeek V3.2 正式版發(fā)布：強化 Agent 能力，融入思考推理

DeepSeek V3.2 正式版發(fā)布：強化 Agent 能力，融入思考推理

楊亮 2025-12-01 19:13:31

276423

分享到

DoNews12月1日消息，據(jù)DeepSeek官方公眾號公布，兩個月前，實驗性的 DeepSeek-V3.2-Exp發(fā)布，收到了眾多熱心用戶反饋的對比測試結果。目前未發(fā)現(xiàn) V3.2-Exp 在任何特定場景中顯著差于 V3.1-Terminus，這驗證了 DSA 稀疏注意力機制的有效性。

今天，DeepSeek同時發(fā)布兩個正式版模型：

DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。

官方網(wǎng)頁端、App 和 API 均已更新為正式版 DeepSeek-V3.2。Speciale 版本目前僅以臨時 API 服務形式開放，以供社區(qū)評測與研究。

DeepSeek-V3.2

DeepSeek-V3.2 的目標是平衡推理能力與輸出長度，適合日常使用，例如問答場景和通用 Agent 任務場景。

在公開的推理類 Benchmark 測試中，DeepSeek-V3.2 達到了 GPT-5 的水平，僅略低于 Gemini-3.0-Pro；相比 Kimi-K2-Thinking，V3.2 的輸出長度大幅降低，顯著減少了計算開銷與用戶等待時間。

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale 的目標是將開源模型的推理能力推向極致，探索模型能力的邊界。

V3.2-Speciale 是 DeepSeek-V3.2 的長思考增強版，同時結合了 DeepSeek-Math-V2 的定理證明能力。該模型具備更好的指令跟隨、數(shù)學證明與邏輯驗證能力，在主流推理基準測試上的性能表現(xiàn)媲美 Gemini-3.0-Pro。

V3.2-Speciale 模型成功斬獲 IMO 2025（國際數(shù)學奧林匹克）、CMO 2025（中國數(shù)學奧林匹克）、ICPC World Finals 2025（國際大學生程序設計競賽全球總決賽）及 IOI 2025（國際信息學奧林匹克）金牌。其中，ICPC 與 IOI 成績分別達到了人類選手第二名與第十名的水平。

DeepSeek 官方表示，在高度復雜任務上，Speciale 模型大幅優(yōu)于標準版本，但消耗的 Tokens 也顯著更多，成本更高。目前，DeepSeek-V3.2-Speciale 僅供研究使用，不支持工具調(diào)用，暫未針對日常對話與寫作任務進行專項優(yōu)化。

不同于過往版本在思考模式下無法調(diào)用工具的局限，DeepSeek-V3.2 是該公司推出的首個將思考融入工具使用的模型，并且同時支持思考模式與非思考模式的工具調(diào)用。

官方提出了一種大規(guī)模 Agent 訓練數(shù)據(jù)合成方法，構造了大量「難解答，易驗證」的強化學習任務（1800+ 環(huán)境，85,000+ 復雜指令），大幅提高了模型的泛化能力。

DeepSeek-V3.2 模型在智能體評測中達到了當前開源模型的最高水平，大幅縮小了開源模型與閉源模型的差距。值得說明的是，V3.2 并沒有針對這些測試集的工具進行特殊訓練。

DeepSeek-V3.2 的思考模式也增加了對 Claude Code 的支持，用戶可以通過將模型名改為 deepseek-reasoner，或在 Claude Code CLI 中按 Tab 鍵開啟思考模式進行使用。

但需要注意的是，思考模式未充分適配 Cline、RooCode 等使用非標準工具調(diào)用的組件，官方建議用戶在使用此類組件時繼續(xù)使用非思考模式。

DeepSeek V3.2 正式版發(fā)布：強化 Agent 能力，融入思考推理

掃描二維碼查看原文

分享自DoNews

關于我們| 電子協(xié)議| 合作聯(lián)系| 蜀ICP備2024059877號-1

網(wǎng)站信息

京公網(wǎng)安備11010802023059號

国产一区高清|日韩精品一区人妻|曰夲AV一区二区|美日韩一区二区三区|国产喷水在线观看|狼友网站成人大全|欧美日韩制服中文视频在线|久草加勒比手机在线|婷婷色综合无码专区|japanese 精品视频在线观看