搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

对标美国行业巨头,“所有群聊都炸锅了”

2025-12-29 04:41:06
来源:

猫眼电影

作者:

林亚蓉

手机查看

  猫眼电影记者 杜呈靖 报道首次登录送91元红包

【文/观察者网 阮佳琪】

深度求索(DeepSeek)新品重磅发布,再度引爆AI圈。12月1日,中国人工智能(AI)初创企业DeepSeek推出两款正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。

据介绍,DeepSeek-V3.2定位“平衡实用”,其在主流推理基准测试中达到美国OpenAI的GPT-5水平;而在推理能力上大幅增强的DeepSeek-V3.2-Speciale,则在推理基准测试中取得了媲美谷歌深度思维11月下旬刚推出的新一代AI模型“双子座3专业版”(Gemini 3.0 Pro)。

DeepSeek还透露,其V3.2-Speciale版本在国际数学奥林匹克竞赛(IMO 2025)、国际信息学奥林匹克竞赛(IOI 2025)等均斩获金牌级表现。这一成绩直接对标行业巨头,此前仅有OpenAI和谷歌深度思维未对外公开的内部测试模型达成过这一成就。

香港《南华早报》2日报道指出,这一来自开源实验室的技术突破再次引发AI研究领域的广泛热议,尤其DeepSeek此次上新恰逢“AI界的奥斯卡”——2025年神经信息处理系统大会(NeurIPS)召开前夕。

作为当前全球最负盛名的机器学习和AI研究领域顶尖学术会议之一,NeurIPS大会每年举办一次,被中国计算机学会列为A类会议,在谷歌学术发布的全球学术期刊和会议影响力排名中位列第7,与国际机器学习会议(ICML)、国际学习表征会议(ICLR)并称为AI领域难度最大、水平最高、影响力最强的三大会议,代表着当今机器学习与AI领域的最高水平。

尽管向来行事低调的DeepSeek尚未公布是否会派员参会,但正在圣地亚哥参加NeurIPS大会的弗洛里安·布兰德(Florian Brand)已难掩兴奋。

这位专门研究中国开源AI生态系统的专家告诉港媒,如果DeepSeek的研究人员现身会场,大概率会引发高度关注。

他还透露:“DeepSeek发布新模型的消息一出,今天所有相关交流群都炸开了锅。(All the group chats today were full after DeepSeek’s announcement)”

港媒还提到,本届NeurIPS大会首次采用双会场形式,在美国加州圣地亚哥和墨西哥首府墨西哥城同步举办。这一安排主要源于主办方对国际研究人员获取美国签证可能遇阻的担忧,目前已有许多中国参会者选择前往墨西哥城会场参会。

DeepSeek-V3.2及其同类产品的基准测试。截图自DeepSeek技术报告

据官方介绍,DeepSeek-V3.2定位平衡推理能力与输出长度,适合日常使用,例如问答场景和通用智能体任务场景。在公开的推理类基准测试(Benchmark)中,V3.2达到了GPT-5的水平,仅略低于Gemini-3.0-Pro;相比Kimi-K2-Thinking,V3.2的输出长度大幅降低,显著减少了计算开销与用户等待时间。

DeepSeek评价称,V3.2“在智能体评测中达到当前开源模型最高水平”,大幅缩小了开源模型与闭源模型的差距,且未针对测试工具进行特殊训练。此外,该模型还是DeepSeek推出的首个将思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用。

DeepSeek-V3.2-Speciale则为“极致推理”而生,是V3.2的长思考增强版,同时结合了DeepSeek-Math-V2 的定理证明能力,以探索模型能力的边界。该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro。

更令人瞩目的是,V3.2-Speciale成功斩获国际数学奥林匹克(IMO 2025)、中国数学奥林匹克(CMO 2025)、国际大学生程序设计竞赛全球总决赛(ICPC World Finals 2025)及国际信息学奥林匹克(IOI 2025)金牌。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。

目前,DeepSeek官方网页端、App和API均已更新为正式版V3.2。Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。相关模型已开源。

截图自DeepSeek技术报告

与两款新模型同步发布的,还有配套的技术报告。谷歌深度思维的首席研究工程师苏珊·张(Susan Zhang)在社交媒体上对此给予好评,称赞报告内容详尽,同时肯定了这家初创企业在模型训练后稳定性优化及智能体能力提升方面的努力。

彭博社指出,这一成果已清晰表明,中国开源AI系统至少在部分核心指标上,已经与硅谷顶尖专有模型具备同等竞争力。

美媒进一步解读称,此次新品发布也释放出一个重要信号:继今年1月推出突破性模型颠覆AI领域后,这家颇具影响力的AI实验室正持续加大研发力度,致力于提升AI运算的速度与效率,力求巩固其在中国AI赛道中的领先优势。

就在上周,DeepSeek刚发布了开源模型DeepSeek-Math-V2,该模型展现出强大的数学定理证明能力。

开源AI初创公司Hugging Face的联合创始人兼首席执行官克莱门特·德朗格(Clement Delangue)在社交平台X上盛赞道,“想象一下,你可以免费拥有世界上最优秀数学家之一的大脑。”

他强调,用户可以不受限制地探索、微调、优化这款中国AI模型,并在自有硬件上运行,“没有任何公司或政府可以收回它。这正是AI和知识民主化的最佳体现。”

“据我所知,此前没有任何聊天机器人或API能让你接触到一个IMO 2025金牌水平的模型。”德朗格补充说。

另据英国《金融时报》上周报道,美国麻省理工学院(MIT)和Hugging Face的一项研究发现,过去一年,中国团队开发的开源AI模型下载量占比上升至17%,超过了美国开发团队的15.8%。这是中国团队首次在这一指标上超越美国同行,取得AI技术全球应用中的关键优势。

在席卷全球科技行业的AI热潮之中,美国OpenAI、谷歌和Anthropic等科技巨头倾向于“封闭”策略,保持对先进AI技术的完全掌控,通过用户订阅和企业合作等方式获利。与之相比,中国科技公司倾向于更加开放的策略,发布了一系列开源模型。

德国智库墨卡托中国研究中心的高级分析师温迪·张(Wendy Chang)指出,“比起美国,开源在中国更像是一种主流趋势。美国公司不愿这样做,它们依靠这些高估值赚钱,不想公开自己的商业机密。”

根据MIT和Hugging Face的数据,DeepSeek和阿里云的Qwen是下载量最多的中国开源模型。《金融时报》称,DeepSeek-R1模型震惊了硅谷,该模型使用的成本和算力很低,但性能足以与美国顶尖模型比肩,引发各界对于美国AI实验室是否还能保持竞争优势的质疑。

MIT研究员谢恩·隆普雷(Shayne Longpre)表示,中国科技公司正在改变AI模型发布的范式,许多中国公司每周或每两周发布一次模型,并提供多种版本供用户选择。相比之下,美国科技公司往往每六个月或一年才发布一系列模型。

业内人士告诉《金融时报》,尽管美国出台了芯片出口管制等一系列打压措施,但中国拥有大量优秀人才,他们在开发开源模型的过程中展现出极强的创造力。

“当美国AI实验室押注于通过推动智能突破来获取巨额利益的同时,中国的开源模型竞争者更专注于推动AI的广泛应用,”《经济学人》总结道,“如果他们成功,DeepSeek的冲击可能仅仅只是一个开始。”

本文系观察者网独家稿件,未经授权,不得转载。

 时事1:国际上的真人游戏机

  12月29日,赴俄朝鲜工兵回国,金正恩:你们安然无恙,我很欣慰,今年36岁的李樟煜,已经在残疾人自行车项目征战多年。2012年伦敦残奥会,他第一次实现了残奥冠军梦。接下来,从里约到东京,再到巴黎,他带着梦想破风前行,每届残奥会都有金牌入账。据介绍,李樟煜获得的各类国际赛事奖牌已有50多枚。,云顶娱乐网址是多少。

  12月29日,周泓余、吴依铭领衔晋级第五届中国女子围棋名人战四强,有受访房产测绘人士表示,预售商品房的面积是根据建筑设计图纸预测出来的,在房屋建设过程中,可能存在部分区域设计和施工调整,最终在房屋竣工后实际测绘时,产生面积差异,个别商品房项目甚至可能出现交房实测的公摊面积变化较大的情况。以套内面积计价,可以更好解决面积差异带来的房款结算问题,也可避免一些矛盾纠纷。,博天堂在线开户,365bet正规站,优德体育投注。

 时事2:BOB注册App

  12月29日,中国大型船舶即将跨入自主“吊舱”时代,今年5月,拟同意设置金华职业技术大学和浙江机电职业技术大学的消息先后在教育部官网公示,意味着金华、杭州两市将各自再添一所新大学。,手机万博登录,二八杠都需要什么牌,电竞游戏押注。

  12月29日,新华鲜报·“十四五”发展亮点|中国“大市场”不一般!内需平均贡献率86.4%,三是苦练风控能力。多资产、多策略模式下,风险具有隐蔽性、滞后性与传染性,未来需构建具备穿透性、前瞻性、敏捷性的全面风险管理体系,有效应对各类潜在风险。,皇冠线上直营平台,最新捕鱼游戏手机版娱乐,365比分网直播。

 时事3:星速下载app官方下载

  12月29日,日方炒作中国军机雷达照射 军事专家:暴露其险恶用心,鸿蒙的快速成长与发展,不只是一家企业的成果,更是中国科技产业在关键领域自主创新、自力更生的一个缩影。此次盛典,让我们看到了国产操作系统发展背后,那股源自千行百业、万千开发者的的磅礴力量。无数个“我”汇聚,便成了“我们”,“聚是一团火,散是满天星”是无数鸿蒙合伙人最真实的写照。,凯时kb8,开奖爆料(新图推荐),伟德官方网站下载网址。

  12月29日,中国—巴西科技创新中心在里约热内卢启动,《每日经济新闻》记者梳理发现,已有近80个国家和地区的1600多位商界、政界、学术界、社会组织和国际组织嘉宾注册参会。其中,注册参会的有100多位各国政要,900多位商界嘉宾,涵盖制造业、能源、消费、金融业等多个行业。,佰家乐线上娱乐平台,亿博app官方,赢天下。

 时事4:九五至尊vip游戏

  12月29日,与世界各国共享机遇共同发展——扩大高水平对外开放,开创合作共赢新局面,常年打球的张先生告诉《环球时报》记者:“在郑钦文夺冠前的这几年,网球运动在大众层面一直是向上走的态势,加入网球运动行列中的人不断增多。”张先生分析,这也许跟网球是隔网运动有关,因此在疫情期间受到欢迎。,澳门有两个永利皇宫吗,真钱赌场地址下载,多宝真人百家乐。

  12月29日,“十四五”期间 我国数字孪生水利体系框架基本形成,国际媒体一下抓住新闻点,为什么是在中国?美联社的新闻标题写道,“伊朗与沙特在中国的帮助下同意恢复关系”。法新社直接给这一协议打上了“中国制造”(Made in China)标签。《经济学人》报道说,两个宿敌坐在一起已经够惊人的了,但更让人惊讶的是会谈地点在北京,而不是一个中东国家的首都。,威尼斯电玩城,凯发k8体育,m6米乐。

责编:陈育廷

审核:黄佳靖

责编:林瑜宣

相关推荐 换一换