搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

对标美国行业巨头,“所有群聊都炸锅了”

2025-12-29 13:28:12
来源:

猫眼电影

作者:

周志合

手机查看

  猫眼电影记者 刘智钧 报道首次登录送91元红包

【文/观察者网 阮佳琪】

深度求索(DeepSeek)新品重磅发布,再度引爆AI圈。12月1日,中国人工智能(AI)初创企业DeepSeek推出两款正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。

据介绍,DeepSeek-V3.2定位“平衡实用”,其在主流推理基准测试中达到美国OpenAI的GPT-5水平;而在推理能力上大幅增强的DeepSeek-V3.2-Speciale,则在推理基准测试中取得了媲美谷歌深度思维11月下旬刚推出的新一代AI模型“双子座3专业版”(Gemini 3.0 Pro)。

DeepSeek还透露,其V3.2-Speciale版本在国际数学奥林匹克竞赛(IMO 2025)、国际信息学奥林匹克竞赛(IOI 2025)等均斩获金牌级表现。这一成绩直接对标行业巨头,此前仅有OpenAI和谷歌深度思维未对外公开的内部测试模型达成过这一成就。

香港《南华早报》2日报道指出,这一来自开源实验室的技术突破再次引发AI研究领域的广泛热议,尤其DeepSeek此次上新恰逢“AI界的奥斯卡”——2025年神经信息处理系统大会(NeurIPS)召开前夕。

作为当前全球最负盛名的机器学习和AI研究领域顶尖学术会议之一,NeurIPS大会每年举办一次,被中国计算机学会列为A类会议,在谷歌学术发布的全球学术期刊和会议影响力排名中位列第7,与国际机器学习会议(ICML)、国际学习表征会议(ICLR)并称为AI领域难度最大、水平最高、影响力最强的三大会议,代表着当今机器学习与AI领域的最高水平。

尽管向来行事低调的DeepSeek尚未公布是否会派员参会,但正在圣地亚哥参加NeurIPS大会的弗洛里安·布兰德(Florian Brand)已难掩兴奋。

这位专门研究中国开源AI生态系统的专家告诉港媒,如果DeepSeek的研究人员现身会场,大概率会引发高度关注。

他还透露:“DeepSeek发布新模型的消息一出,今天所有相关交流群都炸开了锅。(All the group chats today were full after DeepSeek’s announcement)”

港媒还提到,本届NeurIPS大会首次采用双会场形式,在美国加州圣地亚哥和墨西哥首府墨西哥城同步举办。这一安排主要源于主办方对国际研究人员获取美国签证可能遇阻的担忧,目前已有许多中国参会者选择前往墨西哥城会场参会。

DeepSeek-V3.2及其同类产品的基准测试。截图自DeepSeek技术报告

据官方介绍,DeepSeek-V3.2定位平衡推理能力与输出长度,适合日常使用,例如问答场景和通用智能体任务场景。在公开的推理类基准测试(Benchmark)中,V3.2达到了GPT-5的水平,仅略低于Gemini-3.0-Pro;相比Kimi-K2-Thinking,V3.2的输出长度大幅降低,显著减少了计算开销与用户等待时间。

DeepSeek评价称,V3.2“在智能体评测中达到当前开源模型最高水平”,大幅缩小了开源模型与闭源模型的差距,且未针对测试工具进行特殊训练。此外,该模型还是DeepSeek推出的首个将思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用。

DeepSeek-V3.2-Speciale则为“极致推理”而生,是V3.2的长思考增强版,同时结合了DeepSeek-Math-V2 的定理证明能力,以探索模型能力的边界。该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro。

更令人瞩目的是,V3.2-Speciale成功斩获国际数学奥林匹克(IMO 2025)、中国数学奥林匹克(CMO 2025)、国际大学生程序设计竞赛全球总决赛(ICPC World Finals 2025)及国际信息学奥林匹克(IOI 2025)金牌。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。

目前,DeepSeek官方网页端、App和API均已更新为正式版V3.2。Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。相关模型已开源。

截图自DeepSeek技术报告

与两款新模型同步发布的,还有配套的技术报告。谷歌深度思维的首席研究工程师苏珊·张(Susan Zhang)在社交媒体上对此给予好评,称赞报告内容详尽,同时肯定了这家初创企业在模型训练后稳定性优化及智能体能力提升方面的努力。

彭博社指出,这一成果已清晰表明,中国开源AI系统至少在部分核心指标上,已经与硅谷顶尖专有模型具备同等竞争力。

美媒进一步解读称,此次新品发布也释放出一个重要信号:继今年1月推出突破性模型颠覆AI领域后,这家颇具影响力的AI实验室正持续加大研发力度,致力于提升AI运算的速度与效率,力求巩固其在中国AI赛道中的领先优势。

就在上周,DeepSeek刚发布了开源模型DeepSeek-Math-V2,该模型展现出强大的数学定理证明能力。

开源AI初创公司Hugging Face的联合创始人兼首席执行官克莱门特·德朗格(Clement Delangue)在社交平台X上盛赞道,“想象一下,你可以免费拥有世界上最优秀数学家之一的大脑。”

他强调,用户可以不受限制地探索、微调、优化这款中国AI模型,并在自有硬件上运行,“没有任何公司或政府可以收回它。这正是AI和知识民主化的最佳体现。”

“据我所知,此前没有任何聊天机器人或API能让你接触到一个IMO 2025金牌水平的模型。”德朗格补充说。

另据英国《金融时报》上周报道,美国麻省理工学院(MIT)和Hugging Face的一项研究发现,过去一年,中国团队开发的开源AI模型下载量占比上升至17%,超过了美国开发团队的15.8%。这是中国团队首次在这一指标上超越美国同行,取得AI技术全球应用中的关键优势。

在席卷全球科技行业的AI热潮之中,美国OpenAI、谷歌和Anthropic等科技巨头倾向于“封闭”策略,保持对先进AI技术的完全掌控,通过用户订阅和企业合作等方式获利。与之相比,中国科技公司倾向于更加开放的策略,发布了一系列开源模型。

德国智库墨卡托中国研究中心的高级分析师温迪·张(Wendy Chang)指出,“比起美国,开源在中国更像是一种主流趋势。美国公司不愿这样做,它们依靠这些高估值赚钱,不想公开自己的商业机密。”

根据MIT和Hugging Face的数据,DeepSeek和阿里云的Qwen是下载量最多的中国开源模型。《金融时报》称,DeepSeek-R1模型震惊了硅谷,该模型使用的成本和算力很低,但性能足以与美国顶尖模型比肩,引发各界对于美国AI实验室是否还能保持竞争优势的质疑。

MIT研究员谢恩·隆普雷(Shayne Longpre)表示,中国科技公司正在改变AI模型发布的范式,许多中国公司每周或每两周发布一次模型,并提供多种版本供用户选择。相比之下,美国科技公司往往每六个月或一年才发布一系列模型。

业内人士告诉《金融时报》,尽管美国出台了芯片出口管制等一系列打压措施,但中国拥有大量优秀人才,他们在开发开源模型的过程中展现出极强的创造力。

“当美国AI实验室押注于通过推动智能突破来获取巨额利益的同时,中国的开源模型竞争者更专注于推动AI的广泛应用,”《经济学人》总结道,“如果他们成功,DeepSeek的冲击可能仅仅只是一个开始。”

本文系观察者网独家稿件,未经授权,不得转载。

 时事1:天生赢家一触即发

  12月29日,想缴费出场?先看30秒广告……扫码自助缴费后隐藏什么套路,中国、沙特、伊朗三方联合声明显示,沙特和伊朗代表团3月6日至10日在北京举行会谈。会谈时间满打满算,一共5天。,188金宝傅体育。

  12月29日,湖北农业博览会启幕 现场签约逾244亿元,考克斯汽车临时首席经济学家杰里米・罗布上周表示:‘联邦购车补贴在三季度末突然终止,此前直接催生了新车与二手车市场的一波电动汽车抢购潮;补贴退场后,电动汽车的销量增速与新车产能扩张节奏均出现放缓。2026 年,将是电动汽车行业的关键之年。’,ag亚洲游戏集团直达,kb88凯时最新下载平台,澳门网投游戏。

 时事2:欧宝体育网页版登陆

  12月29日,增强供需适配性 打开万亿级消费新蓝海,值得注意的是,两种模式并非截然对立,而是呈现出相互融合的趋势。,ag捕鱼登陆,葡京游戏下注最新版,申博注册彩金。

  12月29日,福建泉州:木偶巡游快闪走进古街区,高检网4月29日消息,全国政协人口资源环境委员会原副主任,陕西省政协原党组书记、主席韩勇涉嫌受贿一案,由国家监察委员会调查终结,移送检察机关审查起诉。日前,最高人民检察院依法以涉嫌受贿罪对韩勇作出逮捕决定。该案正在进一步办理中。,bbin备用网址,bbin通用版安卓版,美高梅app下。

 时事3:亚投彩票登录网址

  12月29日,南京大屠杀和731部队罪行再添新证,激发有潜能的消费,扩大有效益的投资,各地都迫切地希望形成消费和投资相互促进的良性循环。而文旅的“撬动”作用越发受到重视,带动批、零、住、餐,更带动文化演艺市场乃至城市品牌的塑造。,澳门球盘网,凯时国际官方下载,环球免费试玩。

  12月29日,中美青年在广西对话 传承飞虎队精神共筑友谊桥,资金价格部分,DR001延续在1.26%附近,Shibor 3M下行,真实资金分层偏重。,体彩排列三走势图综合版,最具实力的网投平台,球探足分网。

 时事4:完美体育综合app

  12月29日,铁路部门在京张高铁8趟列车试点推出“雪具便利行”服务,此前于5月6日,深圳市商务局已宣布,启动汽车“报废更新”及“置换更新”补贴活动,支持汽车以旧换新,促进消费升级换代。其中,报废更新补贴最高可达到1万元,置换更新补贴最高为8000元。,九卅娱乐手机官网,前几年世界杯赌球网站,凤凰彩票登录。

  12月29日,外交部:日方应当认真倾听和深刻反省,而不是在国际上四处狡辩游说,自讨没趣,“从以往反补贴调查案例来看,欧委会此次披露的临时关税水平基本符合预期。”屠新泉表示,中国纯电车型在欧洲性价比优势明显,加征关税后预计短期可能会对中国车企出口量有影响,但“不至于让中国车企完全出不去”。,赌博十大网址有哪些,用手机怎么投注世界杯,手机澳门皇冠玩的吗。

责编:林雅帆

审核:韩维哲

责编:刘佳贵

相关推荐 换一换