搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

大模型的“健忘症”有药了

2025-12-25 12:47:41
来源:

猫眼电影

作者:

陈玉英

手机查看

  猫眼电影记者 陶娜 报道首次登录送91元红包

天才得了“健忘症”

过去的一年,大模型行业陷入了一场关于数字的军备竞赛。

从最初的8k Token上下文窗口,到随后的32k、128k,乃至近期已经有人喊出百万乃至千万级窗口。业界一度相信,只要窗口足够长,模型就能记住一切。企业主们试图将整座公司的知识库,倒入深不见底的输入框,以此炼就一位全知全能的数字员工。

然而,愿望很美好,现实很骨感。

在电商客服场景中,即便接入了顶流模型,支持超长文本,一旦对话超过十几轮,博学的AI依然会展现出“健忘”的一面:用户开门见山提到海鲜过敏,第五轮咨询商品时,AI依然热情推荐了含有海鲜的商品。而用户试图追溯之前的对话细节,提醒“基于我一开始说的预算”,模型却开始顾左右而言他。

大模型落地商业场景,常常遭遇隐形的高墙:输入越长,长程记忆越模糊;轮次越多,旧信息越快消散。

技术原理决定了这种局限。Transformer架构再先进,面对超长序列时,注意力机制也容易严重衰减。在人身上,这叫做“近因效应”,即对新发生的事情印象深刻,但久远的信息则被遗忘。在大模型身上,这意味着早期的精心指令会被后续的对话稀释,直到消失。

为了维持“记忆”,开发者不得不采取笨拙且烧钱的策略:把历史对话一次次打包,再次喂给模型。这就像为了让对方记住名字,你得在每句话开头都重新自我介绍一遍。Token消耗快速增长,每一次的简单问答,都是在烧钱。

多智能体的复杂任务中,缺失记忆共享机制,AI还会出现混乱。

企业通常将销售、客服、推荐、售后拆分给不同AI智能体。用户已向咨询智能体说明送货地址,但到售后智能体时仍需重新回答;用户刚向投诉智能体抱怨产品质量,推荐智能体转头继续推送产品升级版。这些场景本质上指向同一个问题:没有共享的长期记忆,AI之间无法协同,更谈不上理解。

现有的技术框架下,智能体往往各自维护独立的上下文窗口,这种割裂感导致了严重的决策冲突。

成本高昂、容易遗忘、协作割裂。企业花了大价钱引入大模型,得到的往往不是经验老到的资深员工,而是一群如果不反复重申指令就容易搞砸事情的“实习生”。

一个更接近人类记忆的方案,势在必行。

像人类一样记忆

“健忘”已成为制约大模型进一步提升的关键瓶颈。

过去一年,OpenAI、Anthropic、Google都在给大模型加“记忆层”,只是大多停留在产品功能层面,比如保留用户偏好、常见设定、近期对话线索,他们不知道什么该记,什么不该记。

而人工智能公司“红熊AI”尝试把“记忆”做成一套可管理、可共享、可追溯的基础设施,用来支撑多智能体、企业级应用和长期任务。这家从2024年11月份开始研发,内部商业化,到2025年11月经历过1年的时间,正式对外发布“记忆熊”,试图用反直觉地解决问题:跳出上下文窗口的参数竞赛,转向记忆科学。

底层逻辑并非“记住更多”,而是“记住更有价值的信息”。

记忆发端于数据。数据是未经加工的事实,例如37.5是个数字;当被处理并赋予意义,它便成了信息,如体温37.5摄氏度;信息进一步结构化,结合专业推论,形成“体温37.5度属于低烧”的判断,这便是知识;最后,知识转化为指导行为的能力,经过长期沉淀及验证,形成记忆,就可以给医生进行治疗决策。

在人类的认知视角下,存储不等于记忆。硬盘是容器,而记忆是动态的生命过程。红熊AI试图将人类大脑的记忆机制映射到AI架构中:

短期工作记忆,用于保持任务连接。这种模拟人类“感官缓存”的记忆,利用情感倾向加权算法,识别带有强烈情绪或关键指令的数据(如愤怒的投诉、明确的截止日期),将其标记为高优先级。

长期显性记忆,对应知识库和模型参数,用于沉淀经验;以及隐性记忆,对应用户偏好、企业“暗知识”,用于形成习惯和判断。

隐形记忆存储了用户的偏好模型、任务的隐式规则以及企业的“暗知识”,这是传统数据库最难处理的部分。比如,用户提到“加班”,AI应自动联想到“咖啡”或“打车”。同时将标准工作流程内化为“程序性记忆”,使AI在面对愤怒客户时,本能地执行安抚流程。

这部分记忆不会固化在大模型参数中,而由独立的“记忆模块”来存储和管理。系统的记忆萃取引擎可以决定:哪些应该保留?哪些应该遗忘?哪些应该在下一次用户提问时主动调用?

通过这种分层映射,记忆熊在硅基芯片之上重建了一套数字化记忆系统:“数字海马体”负责将信息加工、编码,“数字皮层”则作为仓库,长期存储知识和过往经历,而“数字杏仁核”则负责绑定情绪。

事实上,大模型深度赋能垂直行业的前提,正是拥有如人类般出色的记忆机制。

没有记忆,AI只能永远停留在“即时生成”的阶段,它能回答每一次问题,却无法从交互中成长。解决了记忆问题,AI才能进化为兼具理解与推理能力的智能体。

硅脑加装记忆外挂

精妙的记忆机制对技术能力提出了更高要求。

记忆熊的做法是构建记忆图谱,将各类记忆内容用结构化方式表达出来,挖掘分析这些记忆及相互关系,进而匹配出不同业务场景下需要的记忆和结构。这种结构化能力也赋予了AI一定的联想与多跳推理的能力,使得信息更连贯、推理更准确的同时,也能联动相关场景和背景知识。

如此一来,类似于人们听到“早晨”一词联想起“旭日东升”、“豆浆油条”、“公园遛鸟”或“交通拥堵”的使用场景也就不难实现了。

同时,记忆熊打通了平台,让智能体共用同一套用户记忆,不再各自为政,确保用户意图、情绪、历史问题等多样化标签无缝传递。用户一次提供信息,智能体同步获取,智能体群控记忆共享率达到了99.99%,基本能够消除因记忆不同步导致的服务问题。

这种针对“大模型健忘症”核心症结的深层次优化,使得记忆熊做到了“省、准、快”,为大模型在垂直领域的商业落地奠定了基础。

首先,是成本断崖式下降。通过引入独特的记忆分层存储机制,不需要每一轮对话中都回传所有的历史信息,压缩短期记忆为长期记忆摘要。这一机制让多轮对话累计的Token消耗直接降低了90%,对于那些每分钟都在烧钱的大模型应用来说,无异于神助。

其次,是精准度数量级提升。使用动态语境校准和智能语义剪枝技术,记忆熊将垂直场景的幻觉率压低到了0.2%以下,端到端的回应准确率达到了99.6%,大模型不再一本正经地胡说八道。特别在代表复杂逻辑能力的多跳推理和时序记忆上,记忆熊的表现领先诸多主流框架,证明它具备了区分过去与现在的时间感。

最后,是响应时间进一步缩短。人机交互中,延迟关乎体验。记忆熊基于向量的非图谱版本,成功将搜索请求的中位响应时间(Search Latency P50),即普通用户最常见的速度体验控制在0.137秒;语音交互场景下应答延迟仅0.8秒。当你话音刚落,AI的回答已经到达耳边,对话流畅自然。

“记忆即资产”

“记忆”的突破,终将重塑商业的形态。

在商业世界里,大模型有没有记忆,差异尤为明显。

客服AI若记不得用户投诉过的细节,就只能重复问题,无法取代真人;企业知识若不能不能转化为经验沉淀在系统里,AI就只能永远充当知识库;在教育、医疗及投顾等行业,若AI无法与客户建立持续深入的联系,它就无法进入高信任度的场景。

记忆不仅仅是一个功能,更是一种身份。

当AI有了持续的记忆,它就第一次具备了回答“我是谁?”、“我在与谁沟通?”、以及“我们之前达成过什么共识”的能力。

为充分利用记忆资产,红熊AI记忆熊产品明确了三条产品主线,分别是隐性记忆的显性化、记忆的结构化处理,以及记忆的场景化应用。简而言之,就是要将把AI与用户的交互沉淀为记忆,并在不同的业务场景下发挥作用。

模型参数里只有可复述的显性知识,但要企业的护城河往往在于隐性经验:金牌销售如何破冰?资深技工如何听音辨位?这些过去依赖个人经验的“暗知识”,现在可以通过记忆熊被结构化地沉淀下来,成为组织记忆,而非单个员工的独家记忆。

大模型没法记住一切,因为内容越多、参数越大、会话越长,则成本越高、遗忘越快、幻觉越多。记忆熊能帮助大模型构建一个“语义剪枝+记忆锚定+情境校准”的机制,结构化处理记忆,只保留与用户身份、历史行为及任务目标有关的核心记忆。

在企业的真实业务场景中,往往是多个智能体协同工作。记忆熊能记忆变为组织资产,而不是单个智能体的独家记忆,提升记忆共享率,则是模型协同的关键。

这三件事,推动记忆从技术功能拓展为商业基础设施。当企业开始关注“AI是否能复用经验、是否能像老员工一样理解上下文、是否能形成组织记忆”时,AI正式从工具进入体系阶段。

参数规模的战争终将结束,但智能体的进化才刚刚开始。

参数规模不是终局,记忆才可能成为真正的操作系统级入口。AI的下一场战役,不是“谁回答得更好”,而是“谁更记得住”,这仍然是一场初创公司可以参与的竞争。

跳出具体的商业场景,记忆实际上是通往通用人工智能(AGI)的必由之路。

没有记忆,就没有推理;没有记忆,也就没有智能。人类之所以成为万物之灵,是因为我们拥有强大的记忆系统,能够跨越时空积累经验,从历史中预判未来。

当前大模型虽然在语言生成上表现惊艳,但在逻辑推理、长期规划和自我进化上,依然有着巨大的进步空间。这归根结底,是因为它们缺乏一个稳定、连续且可塑的记忆系统。

红熊AI的探索,实际上是在补全AGI拼图中最关键的一块。它不仅让AI感知到数据的模式,还能理解并记住世界的规则。

红熊AI于2025年11月30日正式将记忆熊产品完全开源,邀请全球的开发者共同参与这场关于AI记忆的重构。

也许就在不久的将来,大模型的健忘症很快被治愈,一个拥有“累积性智慧”的时代就此徐徐拉开序幕。

本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。如对本稿件有异议或投诉,请联系 tougao@huxiu.com。

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4811016.html?f=wyxwapp

 时事1:十大赌钱评测网

  12月25日,江西德兴汇聚统战力量 助推民营经济高质量发展,从行业环境看,人福医药面临的政策压力未有缓解迹象,药品集中带量采购范围不断扩大,从化学药向生物药、中成药扩展,价格降幅依然明显;医保支付方式改革(DRG/DIP)全面推行,促使医院更加关注药品的成本效益,对高价原研药和专利药形成压力。,澳门金沙城娱乐场。

  12月25日,美国宣布巨额对台军售计划 中方:美方“以武助独”只会引火烧身,体量不及西安的兰州,也拿出大手笔。T3航站楼面积40万平方米,综合交通中心27万平方米,是甘肃民航发展史上规模最大的工程。,手机真人游戏,二八杠现金开户网址,asiagaming官网。

 时事2:188体育外围在线

  12月25日,600名民建全国优秀会员等受民建中央表彰,以中信建投为例,作为国内前十大证券公司,其推出的蜻蜓点金App拥有超1000万用户量,月活超过700万,而其中使用华为设备的用户占比高达40%左右。这些用户就是鸿蒙的潜在使用者,因此中信建投在加入鸿蒙生态上没有任何犹豫,第一时间就进行了适配开发。,ag登路,博狗888平台,欧洲杯地点。

  12月25日,忘记历史就意味着背叛,否认罪责就意味着重犯,在多边层面,长期以来,中国与中亚五国的合作平台主要是上合组织。除土库曼斯坦为中立国之外,其他四个中亚国家均为上合组织创始成员国。在上合组织框架内,中国与中亚国家开展的安全合作卓有成效,在打击”三股势力”、推动阿富汗和平进程等方面取得的成就有目共睹。,nba正规篮球押注平台有哪些,天博网页多少,和记娱乐投注登录。

 时事3:多宝手机版

  12月25日,中国电子产品受到欧洲消费者喜爱,北京、上海、广州是3大全方位门户复合型功能的国际航空枢纽,成都、深圳、重庆、昆明、西安、乌鲁木齐、哈尔滨是7大区位门户复合型功能的国际航空枢纽。,真钱打牌官网app,开开棋牌,下载手机赌场。

  12月25日,【百万庄小课堂】儿童老人冬季皮肤问题高发 专家划出家庭护理与就医“红线”,2月8日晚些时候,泽连斯基还从伦敦赶赴巴黎,与法国总统马克龙以及德国总理朔尔茨举行了会晤,法德领导人重申了他们的信念,即俄罗斯绝不能赢得这场冲突,他们将继续支持乌克兰。,欧宝体育网页,凤凰体育彩票平台,篮球世界杯投注站。

 时事4:65bet体育官网

  12月25日,江西省教育厅原副巡视员王俊接受纪律审查和监察调查,从业绩来看,国任保险虽保持规模扩张且持续盈利。但2024年,该公司投资收益出现-11.67亿元的数据,拖累净利润也大幅下滑。值得关注的是,该公司二股东联美量子持股6.01亿,占比15%。,正规的炸金花app,雷竞技raybetapp官网进入,bsports登录。

  12月25日,四中全会精神解读·市场最前沿|织起全国一张网,看算力普惠按下“加速键”,在问天实验舱气闸舱里,航天员正在做出舱前的准备工作。在画面右侧航天员身后写有“飞天”字样的是舱外航天服,它相当于一个微型航天器,能够将航天员的身体与太空恶劣环境隔离开来。此次任务,航天员将从问天气闸舱出舱,画面左侧圆形的门就是出舱舱门。,体育买球,K8凯发手机版登陆,乐博娱乐官网。

责编:洁西卡·瑞

审核:孙坂

责编:奇诺·大

相关推荐 换一换