泛亚电竞在哪下载 - 在这里发现兴趣,分享快乐,记录生活的每个精彩瞬间

首页 >新闻 >社会新闻

华为新开源！扩散语言模型突破32K上下文，还解锁了「慢思考」

2025-12-23 09:23:25

来源：

猫眼电影

作者：

明磊

手机查看

　　猫眼电影记者金岩石报道首次登录送91元红包

机器之心发布

机器之心编辑部

今年，文本生成领域迎来了从自回归（Auto-Regressive）向扩散语言模型（Diffusion LM）的重要范式转变。然而，长序列训练的不稳定性一直是制约扩散模型发展的核心痛点。上下文窗口限制使得模型在处理复杂的数学推理、编程任务，尤其是需要深度推理的「慢思考」场景时，显得捉襟见肘。

华为近日正式发布 openPangu-R-7B-Diffusion，基于openPangu-Embedded-7B 进行少量数据（800B tokens）续训练，成功将扩散语言模型的上下文长度扩展至 32K

在「慢思考」能力的加持下，该模型在多个权威基准中创下了 7B 参数量级的全新 SOTA 纪录：

多学科知识（MMLU-Pro）：超越 16B 参数量的 LLaDA 2.0-mini-preview22%数学推理（MATH）：得分，大幅领先同类模型。代码生成（MBPP）：得分，展现出卓越的逻辑泛化能力。

Base模型链接：https://ai.gitcode.com/ascend-tribe/openPangu-7B-Diffusion-Base慢思考模型链接：https://ai.gitcode.com/ascend-tribe/openPangu-R-7B-Diffusion

接下来，我们将深入解析这款模型背后的技术革新。

1. 架构创新：

前文因果注意力掩码，自回归到 BlockDiffusion 的无缝迁移

openPangu-R-7B-Diffusion 在注意力机制上并未沿用传统扩散模型（如 LLaDA）的全注意力（Full Attention），也未采用 SDAR 或 Fast-dLLMv2 的分块掩码（Block Attention），而是创新性地融合了自回归的前文因果注意力掩码（Causal Attention Mask）。

这一设计从根本上解决了架构适配难题：

消除适配壁垒：以往将自回归模型适配至扩散模型，往往需要 Attention Mask Annealing 或 Shift Operation 等复杂操作来弥合差异。而 openPangu-R-7B-Diffusion 通过保留前文的因果注意力特性，使得模型仅需从「预测 Next Token」转变为「预测 Next Block 中的 Mask Token」，极大地降低了适配成本。兼容性最大化：该设计让模型能够自然继承自回归模型的预训练知识，为长窗口训练打下坚实基础。

2. 训练与推理：双模式解码与效率倍增

在训练策略上，openPangu-R-7B-Diffusion 延续了 BlockDiffusion 的思路（拼接带掩码的 Block 与无掩码的 Context），但进行了关键优化：

Context 利用率 100%：传统方法往往忽略无掩码 Context 部分的 Loss 计算，导致一半的数据被浪费。openPangu-R-7B-Diffusion 则将这部分数据用于标准的自回归 Next Token Prediction 训练。双模式解码：这种训练方式赋予了模型「自回归 + 扩散」的双重解码能力。用户可以通过不同的采样设置，灵活权衡生成质量与速度。极致性能：模型完整保留了变长推理与 KV-Cache 特性。在并行解码模式下，其速度最高可达自回归解码的2.5 倍

可视化实测：亲眼见证「慢思考」与扩散生成的融合

为了更直观地展示 openPangu-R-7B-Diffusion 的工作机制，我们对模型的推理过程进行了可视化处理。

在输入一道经典的数学逻辑推理题（Claire 的煎蛋问题）后，我们可以清晰地观察到扩散语言模型的独特生成方式：模型并非像传统自回归模型那样「逐词蹦出」，而是在 4 个生成步数（Generation Steps）内，并行地将多个 [MASK] 噪声逐步去噪还原为

、Claire、makes 等清晰的语义 Token。

图中首位的Token 尤为关键，它标志着模型正在启动我们前文提到的「慢思考」模式。这种结合了扩散并行生成与深度思维链（Chain-of-Thought）的能力，正是 openPangu-R-7B-Diffusion 能够在数学和编程基准上大幅超越同类模型的核心原因。

结语：开启扩散语言模型的新篇章

openPangu-R-7B-Diffusion 的发布，不仅仅是一个新模型的开源，更是对「扩散模型能否处理复杂长文本」这一难题的有力回应。凭借其创新的因果注意力掩码架构，它成功证明了扩散模型不仅可以「快」（并行解码），更可以「深」（32K 长文与慢思考）。

值得一提的是，openPangu-R-7B-Diffusion 的训练、推理及评测全流程均在昇腾 NPU集群上完成，有力证明了国产算力在以前沿扩散语言模型领域的强劲实力。

时事1：太阳城电竞

12月23日,南京大屠杀和731部队罪行再添新证,靳东在若尔盖县工作了6年，先后任县委副书记，代理县长和县长职务。若尔盖县平均海拔3500米，高寒缺氧，严寒期长。艰苦的条件下，他不是践行入党誓词，发扬艰苦奋斗的精神努力工作，而是在金钱的诱惑下迷失了自我。,m6在线登录。

12月23日,从实验室到深海他在海南为梦想“潜”行,西部证券发布研报称，据液冷产业链最前沿数据，2026年谷歌TPUv7及以上等级芯片预计出货约220万颗—230万颗，测算2026年谷歌机柜液冷市场规模为24亿美元—29亿美元。展望2026年，国产芯片出货有望保持高增，叠加AI超节点整机出货形式采用率的快速提升，将给国内液冷市场带来高增机遇。,K66网址,电子网站,澳门金沙彩票投注平台。

时事2：manbetx万博电脑官方网页

12月23日,铁路部门在京张高铁8趟列车试点推出“雪具便利行”服务,近年来，国内手机厂商纷纷将目光瞄准非洲市场，甚至在2025年让“非洲手机之王”传音都感受到压力。但是这片“蓝海”也变得越来越“卷”，想要进入其中并不容易，更多国内手机厂商还处在试探阶段。,雷锋论坛,立博在哪开户,mg网站注册送10。

12月23日,又快又顺畅、几乎“无感”！230多吨货物三亚港“二线口岸”15分钟通关,公告指出，圣元环保董事长朱煜煊、总经理朱恒冰、董事会秘书陈文钰未履行勤勉尽责义务，对违规行为负有主要责任。厦门证监局决定对公司及朱煜煊、朱恒冰、陈文钰三位高管采取出具警示函的监督管理措施，并将相关情况记入诚信档案。,银河国际入口,沙滩排球游戏下载,威尼斯游戏手机版官网。

时事3：微信炸金花客户端下载

12月23日,广东一批县（市）新型城镇化综合发展潜力突出带动作用明显,中国汽车工业协会认为，欧委会在对中国电动汽车反补贴调查信息披露中，罔顾事实，坚持认为中国电动汽车产业存在高额“补贴”，对欧盟电动汽车产业带来损害，并拟对中国出口的电动汽车征收临时性反补贴税。“中国汽车工业协会深感遗憾，并表示坚决不能接受。”,澳门威尼斯人会员登录,万博登录页,大发888好玩吗?。

12月23日,多国人士认为：中国为推动全球人权治理贡献积极力量,圣元环保表示，公司将持续跟踪基金赎回进展、维权案件推进情况及实控人补偿承诺的履行情况，严格按照相关规定及时履行信息披露义务。,云开体育官网入口下载,mg官方客服,体育平台怎么赚钱的。

时事4：开心大富翁

12月23日,中南大学副校长郭学益任上被查,开发者们的努力也正在得到用户们的正向反馈和回报。腾讯视频鸿蒙版下载量从起初的几十万跃升至突破了一千多万，应用商店的用户评分也稳步提升；顺丰客户体验研发中心负责人邝卓聪透露，顺丰速运鸿蒙版的下载量突破了200万，远超团队当初的预期，“说明我们从一开始就入局鸿蒙是非常明智的选择。”,bob官方平台体育,威尼斯人怎么下载,b体育网页版必一。

12月23日,再见！10次“破十”的苏神，以及那个在逆境中坚守的苏炳添,会谈后，两国元首共同签署并发表《中华人民共和国和俄罗斯联邦在两国建交75周年之际关于深化新时代全面战略协作伙伴关系的联合声明》，并共同见证签署经贸、自然保护、检验检疫、媒体等领域多项双边合作文件。,纬来体育安卓下载,二八杠游戏注册,亚慱体育app官网下。

【卢俊义扮演者王卫国怀念何晴】

【票友荟萃“曲艺窝子” 同台展非遗曲艺画卷】

责编：周越

审核：朱承艺

责编：邢毅