搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

对标美国行业巨头,“所有群聊都炸锅了”

2025-12-26 19:08:01
来源:

猫眼电影

作者:

金豆

手机查看

  猫眼电影记者 王军 报道首次登录送91元红包

【文/观察者网 阮佳琪】

深度求索(DeepSeek)新品重磅发布,再度引爆AI圈。12月1日,中国人工智能(AI)初创企业DeepSeek推出两款正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。

据介绍,DeepSeek-V3.2定位“平衡实用”,其在主流推理基准测试中达到美国OpenAI的GPT-5水平;而在推理能力上大幅增强的DeepSeek-V3.2-Speciale,则在推理基准测试中取得了媲美谷歌深度思维11月下旬刚推出的新一代AI模型“双子座3专业版”(Gemini 3.0 Pro)。

DeepSeek还透露,其V3.2-Speciale版本在国际数学奥林匹克竞赛(IMO 2025)、国际信息学奥林匹克竞赛(IOI 2025)等均斩获金牌级表现。这一成绩直接对标行业巨头,此前仅有OpenAI和谷歌深度思维未对外公开的内部测试模型达成过这一成就。

香港《南华早报》2日报道指出,这一来自开源实验室的技术突破再次引发AI研究领域的广泛热议,尤其DeepSeek此次上新恰逢“AI界的奥斯卡”——2025年神经信息处理系统大会(NeurIPS)召开前夕。

作为当前全球最负盛名的机器学习和AI研究领域顶尖学术会议之一,NeurIPS大会每年举办一次,被中国计算机学会列为A类会议,在谷歌学术发布的全球学术期刊和会议影响力排名中位列第7,与国际机器学习会议(ICML)、国际学习表征会议(ICLR)并称为AI领域难度最大、水平最高、影响力最强的三大会议,代表着当今机器学习与AI领域的最高水平。

尽管向来行事低调的DeepSeek尚未公布是否会派员参会,但正在圣地亚哥参加NeurIPS大会的弗洛里安·布兰德(Florian Brand)已难掩兴奋。

这位专门研究中国开源AI生态系统的专家告诉港媒,如果DeepSeek的研究人员现身会场,大概率会引发高度关注。

他还透露:“DeepSeek发布新模型的消息一出,今天所有相关交流群都炸开了锅。(All the group chats today were full after DeepSeek’s announcement)”

港媒还提到,本届NeurIPS大会首次采用双会场形式,在美国加州圣地亚哥和墨西哥首府墨西哥城同步举办。这一安排主要源于主办方对国际研究人员获取美国签证可能遇阻的担忧,目前已有许多中国参会者选择前往墨西哥城会场参会。

DeepSeek-V3.2及其同类产品的基准测试。截图自DeepSeek技术报告

据官方介绍,DeepSeek-V3.2定位平衡推理能力与输出长度,适合日常使用,例如问答场景和通用智能体任务场景。在公开的推理类基准测试(Benchmark)中,V3.2达到了GPT-5的水平,仅略低于Gemini-3.0-Pro;相比Kimi-K2-Thinking,V3.2的输出长度大幅降低,显著减少了计算开销与用户等待时间。

DeepSeek评价称,V3.2“在智能体评测中达到当前开源模型最高水平”,大幅缩小了开源模型与闭源模型的差距,且未针对测试工具进行特殊训练。此外,该模型还是DeepSeek推出的首个将思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用。

DeepSeek-V3.2-Speciale则为“极致推理”而生,是V3.2的长思考增强版,同时结合了DeepSeek-Math-V2 的定理证明能力,以探索模型能力的边界。该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro。

更令人瞩目的是,V3.2-Speciale成功斩获国际数学奥林匹克(IMO 2025)、中国数学奥林匹克(CMO 2025)、国际大学生程序设计竞赛全球总决赛(ICPC World Finals 2025)及国际信息学奥林匹克(IOI 2025)金牌。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。

目前,DeepSeek官方网页端、App和API均已更新为正式版V3.2。Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。相关模型已开源。

截图自DeepSeek技术报告

与两款新模型同步发布的,还有配套的技术报告。谷歌深度思维的首席研究工程师苏珊·张(Susan Zhang)在社交媒体上对此给予好评,称赞报告内容详尽,同时肯定了这家初创企业在模型训练后稳定性优化及智能体能力提升方面的努力。

彭博社指出,这一成果已清晰表明,中国开源AI系统至少在部分核心指标上,已经与硅谷顶尖专有模型具备同等竞争力。

美媒进一步解读称,此次新品发布也释放出一个重要信号:继今年1月推出突破性模型颠覆AI领域后,这家颇具影响力的AI实验室正持续加大研发力度,致力于提升AI运算的速度与效率,力求巩固其在中国AI赛道中的领先优势。

就在上周,DeepSeek刚发布了开源模型DeepSeek-Math-V2,该模型展现出强大的数学定理证明能力。

开源AI初创公司Hugging Face的联合创始人兼首席执行官克莱门特·德朗格(Clement Delangue)在社交平台X上盛赞道,“想象一下,你可以免费拥有世界上最优秀数学家之一的大脑。”

他强调,用户可以不受限制地探索、微调、优化这款中国AI模型,并在自有硬件上运行,“没有任何公司或政府可以收回它。这正是AI和知识民主化的最佳体现。”

“据我所知,此前没有任何聊天机器人或API能让你接触到一个IMO 2025金牌水平的模型。”德朗格补充说。

另据英国《金融时报》上周报道,美国麻省理工学院(MIT)和Hugging Face的一项研究发现,过去一年,中国团队开发的开源AI模型下载量占比上升至17%,超过了美国开发团队的15.8%。这是中国团队首次在这一指标上超越美国同行,取得AI技术全球应用中的关键优势。

在席卷全球科技行业的AI热潮之中,美国OpenAI、谷歌和Anthropic等科技巨头倾向于“封闭”策略,保持对先进AI技术的完全掌控,通过用户订阅和企业合作等方式获利。与之相比,中国科技公司倾向于更加开放的策略,发布了一系列开源模型。

德国智库墨卡托中国研究中心的高级分析师温迪·张(Wendy Chang)指出,“比起美国,开源在中国更像是一种主流趋势。美国公司不愿这样做,它们依靠这些高估值赚钱,不想公开自己的商业机密。”

根据MIT和Hugging Face的数据,DeepSeek和阿里云的Qwen是下载量最多的中国开源模型。《金融时报》称,DeepSeek-R1模型震惊了硅谷,该模型使用的成本和算力很低,但性能足以与美国顶尖模型比肩,引发各界对于美国AI实验室是否还能保持竞争优势的质疑。

MIT研究员谢恩·隆普雷(Shayne Longpre)表示,中国科技公司正在改变AI模型发布的范式,许多中国公司每周或每两周发布一次模型,并提供多种版本供用户选择。相比之下,美国科技公司往往每六个月或一年才发布一系列模型。

业内人士告诉《金融时报》,尽管美国出台了芯片出口管制等一系列打压措施,但中国拥有大量优秀人才,他们在开发开源模型的过程中展现出极强的创造力。

“当美国AI实验室押注于通过推动智能突破来获取巨额利益的同时,中国的开源模型竞争者更专注于推动AI的广泛应用,”《经济学人》总结道,“如果他们成功,DeepSeek的冲击可能仅仅只是一个开始。”

本文系观察者网独家稿件,未经授权,不得转载。

 时事1:永利体育app下载

  12月26日,中方谈柬泰边境冲突:希望双方保持最大程度克制 尽快实现降温缓局,路透社上月报道称,两名消息人士曾告诉该媒体,美国财政部官员代表团计划在今年2月访问中国,为美国财政部长耶伦随后访华做准备。不过,路透社最新报道声称,该计划是在美国宣称发现“中国气球”之前,该事件也促使美国国务卿布林肯取消了原定于上周展开的访华行程。,火狐体育app怎么样。

  12月26日,泉州打造世界知名海丝文化旅游目的地,五矿证券等机构普遍认为,锂盐价格经过2023-2025连续三年下跌后,行业资本开支大幅降低,2026到2028年锂行业供给增速下降确定性较强,加之需求侧储能等环节景气的明显提升,行业供需正在从失衡转为紧平衡格局。,ag国际馆真人娱乐龙虎,手机上彩票怎么购买,天博体育。

 时事2:永利app手机版

  12月26日,稳中求进、提质增效 明年宏观政策如何发力?专家解读,证券日报网讯 12月23日,欧莱新材在互动平台回答投资者提问时表示,近两年公司有部分铜靶、铬靶、铝靶直接出口至德国、法国、荷兰等国家,产品主要应用于平面显示、装饰镀膜等领域。,新平台注册送38,半岛官网网页登录,AG亚洲游戏国际手机版下载。

  12月26日,烟台公安破获新型网络水军案 借技术炒作车企负面牟利,双方将继续在化武裁军和防扩散问题上协调行动,致力于恢复禁止化学武器组织的权威性,推动其工作回归非政治化的技术性轨道。,新云顶娱乐,2026世界杯投注比例,金苹果游戏娱乐平台。

 时事3:威廉希尔体育在线登陆

  12月26日,海南自贸港封关 琼州海峡客货运量呈增长态势,据香港特区政府本月10日发布的新闻公报,香港特区政府10日下午收到中国香港体育协会暨奥林匹克委员会就世界冰球锦标赛主办机构播放国歌时出错事件提交的初步调查报告。香港特区政府将严肃检视有关报告,并与港协暨奥委会详细商讨跟进行动。香港特区政府重申,对这次播放国歌时出错强烈不满,对违规行为会予以严惩,绝不姑息。,爱游戏app官方网站入口,云顶娱乐app手机版,娱乐真人。

  12月26日,新疆首个“雪假”激活冰雪文旅活力,伦敦黄金市场的OTC交易机制非常类似于银行体系的二级交易机制。LPMCL主要通过一个名为AURUM的电子清算系统,关联其下具有清算资格的LBMA成员银行(摩根大通、工银标准银行、汇丰、瑞银)来完成其作为Loco London清算中心的使命。,葡京体育在线注册,火狐体育是黑台子吗,m6米乐app下载。

 时事4:易博胜

  12月26日,浙江宁波:中韩登山爱好者共赴冬日之约,2013年,早在“一带一路”倡议提出时,对新疆的定位是:丝绸之路经济带上重要的交通枢纽、商贸物流和文化科教中心,打造丝绸之路经济带核心区。对陕西、甘肃、宁夏、青海的定位则为:面向中亚、南亚、西亚国家的通道、商贸物流枢纽、重要产业和人文交流基地。,凯发k8旗舰厅AG,天天发娱乐官网,yobo游戏。

  12月26日,“十五五”经济社会发展主要目标解读:纵深推进全国统一大市场建设,邓肯以“挑战LGBTQ+权利”而闻名,因此饱受美国的左翼人士批评,同性恋法律辩护团体“浪达法律”(Lambda Legal)曾抨击称“他的整个职业生涯都在致力于消灭人权进步”。,百老汇网站是多少,乐虎游戏,亿德体育官网。

责编:林淑艳

审核:李遂

责编:梅丽莎·佩雷拉

相关推荐 换一换