搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

重磅!DeepSeek V3.2 特别版发布:性能超越GPT-5,硬刚Gemini 3.0「IOI/IMO金牌」

2025-12-23 12:21:43
来源:

猫眼电影

作者:

巴旦木

手机查看

  猫眼电影记者 商黎光 报道首次登录送91元红包

↑阅读之前记得关注+星标⭐️,,每天才能第一时间接收到更新

DeepSeek-V3.2系列模型正式上线

作为“为Agent构建的推理优先模型”,DeepSeek-V3.2包含两个版本:

DeepSeek-V3.2:V3.2-Exp的官方继任者,平衡了推理能力与生成长度,性能对标GPT-5,现已上线App、Web端及API

DeepSeek-V3.2-Speciale:专攻深度推理能力的极限版本,性能超越GPT-5,比肩Gemini-3.0-Pro,目前仅通过API提供

技术报告显示,DeepSeek-V3.2-Speciale在2025年国际数学奥林匹克(IMO)、国际信息学奥林匹克(IOI)、ICPC世界总决赛及CMO中均取得了金牌级成绩

官方已公开上述竞赛的最终提交结果,社区可通过assets/olympiad_cases进行二次验证

技术报告:

https://huggingface.co/deepseek-ai/DeepSeek-V3.2/blob/main/assets/paper.pdf

以下是详细信息

核心能力与技术突破

DeepSeek-V3.2基于三大技术突破,实现了高计算效率与卓越推理、Agent性能的统一:

1.DeepSeek Sparse Attention (DSA):引入高效注意力机制,大幅降低计算复杂度,并针对长上下文场景进行了优化

2.可扩展强化学习框架:通过稳健的RL协议与后训练(post-training)算力扩展,实现了高性能表现

3.大规模Agent任务合成管线:涵盖1800+环境及8.5万+复杂指令

这一合成管线不仅提升了模型在复杂交互环境中的遵循度和泛化能力,更让DeepSeek-V3.2将“思考”直接整合进工具使用(Tool-Use)的模型,同时支持在思考和非思考模式下使用工具

API更新与Speciale版限制

DeepSeek-V3.2:

API使用模式与V3.2-Exp保持一致,作为日常主力模型(Daily Driver),提供GPT-5级别的性能

DeepSeek-V3.2-Speciale:

该版本专为解决复杂任务设计,消耗更多Token,目前仅作为API提供,具体限制如下:

临时端点:需使用

base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"

服务期限:该端点服务至2025年12月15日 15:59 (UTC) 截止

功能限制:不支持工具调用(Tool Calls),仅用于支持社区评估与研究。

定价:与DeepSeek-V3.2保持一致

聊天模板重大调整

DeepSeek-V3.2不再提供Jinja格式模板,并引入了“带工具思考”及新角色设定。

Python脚本编码:官方提供了encoding文件夹,包含Python脚本(encoding_dsv32.py),用于将OpenAI兼容格式消息编码为模型输入字符串及解析输出

Developer角色:模板新增developer角色,专门用于搜索Agent场景,官方API不接受分配给该角色的消息

输出解析注意:提供的解析函数仅处理格式良好的字符串,生产环境需自行增加稳健的错误处理机制。

代码示例如下:

import transformersfrom encoding_dsv32 import encode_messagestokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")messages = [ {"role": "user", "content": "hello"}, {"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."}, {"role": "user", "content": "1+1=?"}]# 思考模式配置encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)prompt = encode_messages(messages, **encode_config)tokens = tokenizer.encode(prompt)本地部署建议

模型结构与DeepSeek-V3.2-Exp相同。

采样参数:建议设置 temperature = 1.0,top_p = 0.95。

Speciale版提示:本地部署Speciale版本时,同样不支持工具调用功能

开源与协议

仓库及模型权重均采用 MIT License 授权。

最后记得⭐️我,这对我非常重要,每天都在更新:

欢迎点赞转发推荐评论,别忘了关注我

 时事1:亚美研究院官网登录

  12月23日,藏北高原"新生代"守望者:邀生灵"出镜" 让保护"出圈",数据显示,2025年第三季度新发开放式理财产品的业绩基准已跌至2.08%,距离2%的分水岭仅有一步之遥。,手机网赌信誉网址。

  12月23日,专家学者共话中央文献翻译:译者策略选择应服务于跨文化传播,4月28日,特斯拉CEO马斯克来到中国,特斯拉官方微博先后两次发声,提到了加速自动驾驶技术落地。,365bet娱乐在线,1xbet官网,88体育官方平台。

 时事2:必威体育官方网站入口

  12月23日,2000多种林产品亮相第三届广东林业博览会,尽管需求旺盛,但供应端正面临多重挑战。数据中心行业正在努力应对低迷的劳动力市场,这可能导致施工队伍人员短缺。同时,建筑材料的供应链正受到关税威胁,而电力获取在许多地区仍是一个巨大的问号。,澳门金沙平台在线投注,乐鱼怎么注册,网络版飞禽走兽。

  12月23日,三星电子会长李在镕之子被授予韩国海军少尉军衔,一德期货在梳理澳洲、南美盐湖等2026年新增项目后,预估2026年全球范围内供应增量在33万吨上下,需要端虽然动力电池的需求增速可能有所放缓,但是受到国内电力市场化带来的储能端需求增长,2026年需求增量可能达到38万吨。,神医药方,二八杠抢庄软件,下载就送体验金。

 时事3:乐鱼体育网站下载

  12月23日,首届省港杯超级足球邀请赛开赛,近两年,中国医药内部持续开展反腐工作,上市公司及下属公司被查的高管、原高管数量多达10多位,但本次被查的高渝文的职级最高,在位时间约3年。,明升平台网站,ope体育安卓端g,大发888老虎机注册。

  12月23日,2025年10月中国企业信用指数基本平稳,对于西方大国来说,一个团结强大的伊斯兰世界并不符合其战略利益,一个虚弱、分裂的伊斯兰世界才符合心意。,全民乐翻天炸金花,申搏官网申,国际象棋真人对真人软件。

 时事4:365bet在线客户端

  12月23日,寒潮降雪天气来袭 多部门迎“寒”而上保通保畅保农业生产,对南方不少地方而言,高考下雨的概率真的会更大些。中国天气网统计了2003年至2021年19年间全国高考期间(6月7日至9日)平均降水量,可以看出高考期间雨水最多的地方集中在南方,尤其华南地区。此时正值当地的龙舟水期间,大量暖湿空气从海面输送而来,一旦遭遇冷空气就会制造大范围的猛烈降雨,广东、广西、福建、贵州等地都是高考遇雨大户。,麻将风云,天博app下载地址,天博官方网址在线登录。

  12月23日,残特奥会新一轮比赛门票2日开售,票据利率上行。截至12月26日,3M期国股直贴利率、3M期国股转贴利率、6M期国股直贴利率、6M期国股转贴利率分别为1.00%、0.69%、1.15%、1.09%,较12月19日分别变动+31BP、+15BP、+17BP、+15BP。,九五至尊登陆,bob综合最新版体育,威尼斯人轮盘怎么做。

责编:童彬

审核:周宏春

责编:刘璧洁

相关推荐 换一换