编辑部 整理自 凹非寺量子位 | 公众号 QbitAI
“人工智能要发展到下一个台阶,一定要突破两座大山。第一座大山是Transformer,第二座大山是反向传播算法。”
在大模型规模不断拔高、算力与数据卷到极致的当下,RockAI创始人刘凡平提出了一个与主流共识截然不同的判断。
下一阶段的智能,不在“更大”,而在“活起来”。本质是让模型摆脱静态函数的桎梏,让端侧设备具备原生记忆、自主学习与持续进化的能力。
这意味着AI的方向要从云端集中式的算力竞争,迁移到每一台设备,每一个个体都能参与学习,生成知识的全新范式。
在量子位MEET2026智能未来大会上,刘凡平将这一转折点称为硬件觉醒
当模型在端侧能像大脑一样稀疏激活、实时形成记忆,并在物理世界中不断更新自身,设备就不再是工具,而是“活”的智能体。
而无数这样的智能体在现实世界中学习、协作,便将孕育出真正能够产生知识的群体智能。
这既是对Transformer与反向传播算法这“两座大山”的正面突破,也是迈向通用人工智能的一条新路径。
为了准确呈现刘凡平的完整思考,以下内容基于演讲实录进行整理编辑,希望能提供新的视角与洞察。
MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了主流媒体的广泛关注与报道。
核心观点梳理为Token付费是一件很愚蠢的事情,用户应该为智能付费。端侧模型不是云端大模型的小参数版本,端侧模型关键在于自主学习和原生记忆,Transformer架构模型无法在端侧实现这一点。人工智能要发展到下一个台阶,一定要突破两座大山。第一座大山是Transformer,第二座大山是反向传播算法。原生记忆和自主学习带来的变化除了Token不再收费,更多的还有重新定义硬件的价值。每台设备拥有自己的智能并能向物理世界学习,就会产生群体智能,如同人类社会个体相互合作产生知识。现有大模型(尤其是Transformer架构大模型)本身不产生知识,只是传播知识;群体智能才是迈向通用人工智能的最佳途径。
以下为刘凡平演讲全文:
硬件可能觉醒吗?
很高兴能够和大家在今天分享RockAI在模型层面的思考,也许今天讲的内容和大家平常理解的有些不一样——我们认为通用人工智能一定有自己的发展路径。
今天分享的主题是硬件觉醒。
我们知道硬件是没有生命的,怎么可能觉醒?没错,我们做大模型应该重新思考这一切的东西,这一切就是因为被Transformer束缚了
我想问一下大家,你期待的未来的智能硬件是什么样子?是你的智能手机还是平板,还是前两天的豆包手机?
今天很多大会嘉宾都提到了Agent,提Agent的时候都提到一个点:工具,更高效的工具。
当前很多人还是把大模型当工具用。就像计算器一样,我需要的时候拿过来用一下,不需要的时候就放开了。
从智能发展角度来想想:豆包手机能按照指令打开APP做相应的事情,下一步会发生什么?它能打开微信发信息,那微信未来的样态还是现在这样吗?它能打开高德地图,高德地图十年以后还是现在这样吗?
大家会发现,目前是一个中间状态,并不是终极状态。
为Token付费是一件很愚蠢的事情
刚刚很多嘉宾提到,Token消耗量增长了10倍,尤其是使用上Agent之后。
这本质是在为Token付费。
但大家有没有想过:为Token付费是一件很愚蠢的事情
我们为什么做大模型?是因为智能。如果要付费,应该是为智能付费,为什么为Token付费?
打个比方,有的人讲话只要简单几句就能说清楚,有的人说话很啰嗦,我难道要为它的啰嗦付费吗?肯定是不对的。
细想一下,就会发现为Token付费是一个错误。未来(两年之后)回头看,我相信大家一定也会疑惑当年居然还为Token付过费、充值过。
端侧模型并不是云端大模型的小参数版本
硬件已经发生了很多变化,当前的云端大模型已经慢慢走向了终端设备。
为什么这么说?我们不否定云端大模型的好处,尤其在工具使用上,云端大模型非常优秀。
但是未来AI是属于每一个人的。要让AI走向每一个人的世界,最重要的是端侧的智能
一方面因为端侧离你更近,而且端侧还有一个“数据无处不在”的好处。
我一直以来比较反感把所有数据采集到云端,云端训练好了再下发给用户使用。
数据明明就在你的身边,为什么做不到就让它在你身边?因为云端大模型参数量太大了,也没有这么多设备收集你身边的数据。
端侧大模型如果能在设备上收集数据,而且是完全属于你个人的数据,且这台设备又能和你其他设备关联,那个时候大家就不会单纯把模型当做一个工具来使用了。
很多人觉得端侧受限于设备,算力有限,所以在云端做几十B的“大”模型,端侧做几B的“小”模型,就成了端侧模型。
端侧模型并不是云端大模型的小参数版本
RockAI对端侧大模型有两个非常关键的定义:自主学习和原生记忆。这是我们认为最重要的事情。
如果是Transformer架构的模型,无法在端侧实现自主学习与原生记忆。
跳出Transformer架构去看问题
Transformer很优秀。
我自己就是国内最早研究Transformer的人之一,对它早期的成功非常认可。
但它现在进入到一个死亡螺旋的状态,带来一个问题——为了让模型能力足够突出我们要加大算力、加大数据,带来成本极大提升。大家和竞争对手都在做同样的事情。
你会发现,大家都没有管架构,大家都在干数据和算力。因为“只要我数据算力够了,我就做得更好”。
我们认为,信仰Scaling Law的成功在现在看来是错误的。不仅我这样说,现在很多人也有类似的观点。
核心本质不在于模型不够大,而在于思考的方式错了。
模型本身是一个静态函数,这种静态函数是不太可能会具备真正的智能。因为人的大脑是一个动态函数,每时每刻都在建立新的连接,而新的连接是动态结构的。人的大脑是因为这样才有了记忆的能力。
另一个误区是“更多参数就意味着更多智能”。
在Transformer架构下这样想没错,但如果跳出Transformer架构就不是这样了。
举一个简单的例子——
生物界,一条蛇或者一个小兔子它没有智能吗?应该没有人否定它们的智能。
和人脑相比,它们大脑拥有的“参数”肯定少很多。
另外还有长上下文。
2024年,长上下文方面有很多突破。但我们一直不认为长上下文是一种记忆,真正的记忆应该像人大脑的海马体一样,会把所有信息通过加工处理压缩存储下来,根据需要的情况会移除掉一部分信息。
这种记忆是参数化的记忆,不是靠上下文完成的。靠上下文完成,记忆就会很短。
为什么现在大家又执着于做上下文?是因为Agent,而Agent背后的Transformer架构模型部署后是一个静态函数,没办法,只能通过上下文改变它的能力。
讲到这里大家就会恍然大悟,长上下文其实是一个退而求其次的方案,并不是真正智能的解决方案
上下文窗口超过100万Tokens也好,200万Tokens也好,1000万Tokens也好……但每时每刻产生的Token远远超过了这个量。就拿今天大会大家分享的内容来说,就已经远远超过了1万Tokens。
记忆能让人形成长期认知,是一个过程。我们的价值观就是记忆逐步积累起来的。如果记忆只靠长上下文,那么就形成不了价值观,更不会有知识沉淀。
人的聪明来自长时间的积累。
训推同步,带来自主进化
回到刚才说的,未来的智能硬件最重要的应该是原生记忆和自主学习。
刚才说了原生记忆,现在来说自主学习,自主学习是一定要走向物理世界的
自主学习带来的一大好处就是模型不会因为部署就“死亡”了。
可能大家不知道,因为参数已经固定,所以模型在部署的那一刻就死掉了。想要改变,就只能上传到云端服务器重新训练,过一段时间再下发给大家使用。
一旦能够自主学习,随之而来的自主进化就会带来全新的改变。我们就不再认为它是一个固定的工具,而是可以持续学习的。
我们把这种持续学习状态的技术称之为训练和推理同步进行
训练和推理同步进行,就像我站在这里输出一些内容(可以看成大模型的推理过程)的时候,也在获得一些新的东西。我的推理和训练是同时完成的。大脑不仅在推理,参数也在不断改变,这就是“活”的东西。
今天发布了一个模型,过三个月再去问这三个月里发生的事情,它是不知道的,需要通过知识外挂RAG等方式弥补。这不是临时方案是什么?
我们作为研究者,应该要面临这样的现实——
大模型的很多方案都是临时方案,并不是真正的终局方案,终局方案就是要改架构
我自己的观点是这样的:人工智能要往下发展到更高的台阶,一定要突破两个大山,第一座大山是Transformer,第二座大山是反向传播算法(反向传播算法制约了现在很多设备的发展,包括算力的发展)。
模型架构一定要改
为了让模型不再死亡、能够进化,模型架构一定要改变。
以我们自己研发的Yan架构的大模型为例,整个模型极端稀疏化,激活机制比MoE更稀疏。
它模仿了人类大脑的运行机制。人的大脑大概有860亿参数,但二十几瓦的大脑预算峰值就可以推动大脑运算。
另外,我们在模型中加入了记忆模块。也就是说,推理过程中,随着你跟它沟通,记忆模块会发生改变。所以真正的记忆开始了,真正个性化开始了。
如果一个设备拥有了自主学习,就有了新的可能性。
今年世界人工智能大会我们发布的一个部署了模型的小设备,是一个机器狗,最开始什么能力都没有,但是可以现学现会。我们模型不一定需要云端GPU,手机、CPU上都能直接跑
这还仅仅是一个简单的机器狗。如果范围更大一点,到具身智能呢?
具身智能现在没办法进入千家万户,核心原因是没法在出厂的时候适应每个家庭,服务好每个家庭。它需要学习。
一个人到了酒店,还得看一下酒店的布局,知道书房在哪里,洗漱间在哪里。
未来设备也是一样,它需要专门了解,有一个学习的过程,而不是出厂的时候就会用所用家电了。这个学习的过程是Transformer架构现在很难具备的。
智能会重新定义硬件的价值
原生记忆和自主学习带来的变化不仅仅是Token不再收费了,更多的还有智能重新定义硬件的价值。
举个例子。比如说花两万块钱买了一只宠物狗,它陪伴了你两年,你跟它产生了情感依赖。两年之后你还会花两万块钱把它卖掉吗?我想那个时候你肯定不是思考两万块钱的事情,而是更在意狗和你之间产生了多深的情感。
未来的硬件其实需要让用户与它共同创造价值,而不是为它的功能买单。
就像买一部手机,未来为它付费的不是内存,是与它的价值共创。你买它的时候它的价值是最小的时候
所以我们认为智能会重新定义硬件的价值,它就不再只是一个工具了。
我们的模型能够在手机、具身智能等设备上灵活运行。比如在手机上部署的3B的离线模型,保证了用户的隐私和安全,体验还非常流畅。
特别强调的是,在离线情况下,多模态感知能具备记忆和自主学习能力,那么硬件价值一定会发生很大变化。这也是全新架构带来的全新可能。
Transformer几乎不可能做到这个水平。因为手机上运行它会消耗很高的内存资源。
每台设备拥有自己的能力并能向物理世界学习,就会产生群体智能
当硬件拥有了原生记忆和自主学习,还会发生什么样的变化?
不同于OpenAI,也不同于DeepSeek,我们认为这条路径是群体智能。
每一台设备都拥有了自己的智能,此外还能向物理世界进行学习的时候,就会产生群体智能
群体智能有点像人类社会。每个人都不是全能的,我们不需要造一个全能的人,更不需要人人都全能。大家只需要有自己擅长的点就可以了。
更多智能来自于相互之间的合作,合作过程中会产生真正的知识。
知识有两部分:一个叫产生,一个叫传播。
现在大模型——尤其是Transformer架构大模型——有很大的一个问题,它本身没有产生知识。
真正的智能应该是产生知识。人与人之间随时在产生知识,正是因为每个人的不同产生了不同的解决方案。
真正的智能涌现来自于每个个体,每个个体产生信息之后,再传播给更多的人。我们是在这样的过程中形成了人类逐步发展的文明,而不是靠一个足够聪明的云端通用大模型来造神。
云端通用大模型的厉害之处无非在于收集的数据,而收集的数据无非来自于人类社会的经验。如果它连自己原生的记忆和自主学习都不具备,是不可能产生真正的智能。
RockAI一直认为群体智能才是迈向通用人工智能最佳的方式,而不是OpenAI造神的路径。
我的分享就到这里,谢谢!
《beat365官网》,《首次登录送91元红包》新威尼斯人
“全民世界杯竞猜网站”
YG棋牌
……
{!! riqi() !!}
“幸运快三官方网站”{!! reci() !!}
↓↓↓
{!! riqi() !!},外媒:保加利亚政府宣布辞职,leyuvip1,天境棋牌大厅,米乐m6网页版登录,吉祥彩登陆网址
{!! riqi() !!},成都:非洲青年走进“印象中的中国” 亲身体验发展脉动,聚星登陆地址,龙8娱乐网站官方网站,bet9手机官网登录,新银河娱乐注册
{!! riqi() !!},澳门开启文旅融合新篇章 打造“演艺之都”再获助力,真人那么大版本的国际象棋多少钱,AG亚洲游戏,葡京游戏大厅,波克捕鱼官方最新版
{!! riqi() !!}|解锁成都339塔新视角!男子花5小时环拍近6公里延时摄影|ag旗舰厅注册登录|网上游戏厅|体育bob综合|苹果手机怎么买球
{!! riqi() !!}|科研团队创新设计结构 为柔性可穿戴提供新解法|彩票注册送18块|线上买球平台登录|法国世界杯买球哪里买|bbin手机客户端官网
{!! riqi() !!}|【同心声影】统一战线成员缅怀历史:凝聚人心传递和平信念力量|世界杯2026在哪买球|美高梅网投客户端|伟德投注站官网首页|beat365……
{!! riqi() !!},日本遗孤池田澄江忆往昔潸然泪下,6up扑克之星优惠码,Bob综合体育官网pc网页版,华纳国际官网下载,现金网游戏
{!! riqi() !!},日本政府欲打造日版中情局 民众继续承压高市之“祸”,网赌飞禽走兽,世界杯竞彩投注app,捕鱼大师安卓官网下载,galaxy银河官网最全网站
{!! riqi() !!}|深圳27人走私管制金属锑锭166余吨出境,主犯被判12年|1号娱乐app官网下载地址正版|必发在哪里玩|十博官网app入口|188体育投注投
{!! riqi() !!},瑙鲁发生数起中国公民店铺遭抢劫案件 中使馆发布安全提醒,ag真人网址推荐,球彩台,168体育平台下载,凯发娱乐手机网页版登录
{!! riqi() !!},香港特区政府:目前捐助基金和政府拨款已达11亿港元,银河快速登陆,必威官网地址,千赢官网手机版下载,巴黎人电子网址
{!! riqi() !!},中方介绍法国总统马克龙访华安排,时时乐炸金花,ag现金担保网,旧版球探体育比分,同城游斗牛技巧
{!! riqi() !!}|【统战巡礼】围绕主线担当作为 “宁”聚力助塞上江南展新颜——“十四五”期间宁夏回族自治区统战工作综述|开元棋盘辅助器app下载|六合精解A|云顶集团游戏网址|www.88真人国际娱乐
{!! riqi() !!}|全国大学生科技美术创新设计作品展在津开幕|提款快的体育平台是哪个|云顶娱乐手机版怎么下载|Fun88app官网479|利来国际F1
{!! riqi() !!}|北京将培育具国际竞争力的量子未来产业集群|万博官网app体育|亚博买球世界杯|博鱼体育官网登录入口|万家乐吧
{!! reci() !!},{!! reci() !!}|泉州打造世界知名海丝文化旅游目的地|乐博app链接|火狐体育线上登录|必威亚洲官网入口|宝博在线开户
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺