猫眼电影
猫眼电影记者 刘少培 报道首次登录送91元红包
天才得了“健忘症”
过去的一年,大模型行业陷入了一场关于数字的军备竞赛。
从最初的8k Token上下文窗口,到随后的32k、128k,乃至近期已经有人喊出百万乃至千万级窗口。业界一度相信,只要窗口足够长,模型就能记住一切。企业主们试图将整座公司的知识库,倒入深不见底的输入框,以此炼就一位全知全能的数字员工。
然而,愿望很美好,现实很骨感。
在电商客服场景中,即便接入了顶流模型,支持超长文本,一旦对话超过十几轮,博学的AI依然会展现出“健忘”的一面:用户开门见山提到海鲜过敏,第五轮咨询商品时,AI依然热情推荐了含有海鲜的商品。而用户试图追溯之前的对话细节,提醒“基于我一开始说的预算”,模型却开始顾左右而言他。
大模型落地商业场景,常常遭遇隐形的高墙:输入越长,长程记忆越模糊;轮次越多,旧信息越快消散。
技术原理决定了这种局限。Transformer架构再先进,面对超长序列时,注意力机制也容易严重衰减。在人身上,这叫做“近因效应”,即对新发生的事情印象深刻,但久远的信息则被遗忘。在大模型身上,这意味着早期的精心指令会被后续的对话稀释,直到消失。
为了维持“记忆”,开发者不得不采取笨拙且烧钱的策略:把历史对话一次次打包,再次喂给模型。这就像为了让对方记住名字,你得在每句话开头都重新自我介绍一遍。Token消耗快速增长,每一次的简单问答,都是在烧钱。
多智能体的复杂任务中,缺失记忆共享机制,AI还会出现混乱。
企业通常将销售、客服、推荐、售后拆分给不同AI智能体。用户已向咨询智能体说明送货地址,但到售后智能体时仍需重新回答;用户刚向投诉智能体抱怨产品质量,推荐智能体转头继续推送产品升级版。这些场景本质上指向同一个问题:没有共享的长期记忆,AI之间无法协同,更谈不上理解。
现有的技术框架下,智能体往往各自维护独立的上下文窗口,这种割裂感导致了严重的决策冲突。
成本高昂、容易遗忘、协作割裂。企业花了大价钱引入大模型,得到的往往不是经验老到的资深员工,而是一群如果不反复重申指令就容易搞砸事情的“实习生”。
一个更接近人类记忆的方案,势在必行。
像人类一样记忆
“健忘”已成为制约大模型进一步提升的关键瓶颈。
过去一年,OpenAI、Anthropic、Google都在给大模型加“记忆层”,只是大多停留在产品功能层面,比如保留用户偏好、常见设定、近期对话线索,他们不知道什么该记,什么不该记。
而人工智能公司“红熊AI”尝试把“记忆”做成一套可管理、可共享、可追溯的基础设施,用来支撑多智能体、企业级应用和长期任务。这家从2024年11月份开始研发,内部商业化,到2025年11月经历过1年的时间,正式对外发布“记忆熊”,试图用反直觉地解决问题:跳出上下文窗口的参数竞赛,转向记忆科学。
底层逻辑并非“记住更多”,而是“记住更有价值的信息”。
记忆发端于数据。数据是未经加工的事实,例如37.5是个数字;当被处理并赋予意义,它便成了信息,如体温37.5摄氏度;信息进一步结构化,结合专业推论,形成“体温37.5度属于低烧”的判断,这便是知识;最后,知识转化为指导行为的能力,经过长期沉淀及验证,形成记忆,就可以给医生进行治疗决策。
在人类的认知视角下,存储不等于记忆。硬盘是容器,而记忆是动态的生命过程。红熊AI试图将人类大脑的记忆机制映射到AI架构中:
短期工作记忆,用于保持任务连接。这种模拟人类“感官缓存”的记忆,利用情感倾向加权算法,识别带有强烈情绪或关键指令的数据(如愤怒的投诉、明确的截止日期),将其标记为高优先级。
长期显性记忆,对应知识库和模型参数,用于沉淀经验;以及隐性记忆,对应用户偏好、企业“暗知识”,用于形成习惯和判断。
隐形记忆存储了用户的偏好模型、任务的隐式规则以及企业的“暗知识”,这是传统数据库最难处理的部分。比如,用户提到“加班”,AI应自动联想到“咖啡”或“打车”。同时将标准工作流程内化为“程序性记忆”,使AI在面对愤怒客户时,本能地执行安抚流程。
这部分记忆不会固化在大模型参数中,而由独立的“记忆模块”来存储和管理。系统的记忆萃取引擎可以决定:哪些应该保留?哪些应该遗忘?哪些应该在下一次用户提问时主动调用?
通过这种分层映射,记忆熊在硅基芯片之上重建了一套数字化记忆系统:“数字海马体”负责将信息加工、编码,“数字皮层”则作为仓库,长期存储知识和过往经历,而“数字杏仁核”则负责绑定情绪。
事实上,大模型深度赋能垂直行业的前提,正是拥有如人类般出色的记忆机制。
没有记忆,AI只能永远停留在“即时生成”的阶段,它能回答每一次问题,却无法从交互中成长。解决了记忆问题,AI才能进化为兼具理解与推理能力的智能体。
硅脑加装记忆外挂
精妙的记忆机制对技术能力提出了更高要求。
记忆熊的做法是构建记忆图谱,将各类记忆内容用结构化方式表达出来,挖掘分析这些记忆及相互关系,进而匹配出不同业务场景下需要的记忆和结构。这种结构化能力也赋予了AI一定的联想与多跳推理的能力,使得信息更连贯、推理更准确的同时,也能联动相关场景和背景知识。
如此一来,类似于人们听到“早晨”一词联想起“旭日东升”、“豆浆油条”、“公园遛鸟”或“交通拥堵”的使用场景也就不难实现了。
同时,记忆熊打通了平台,让智能体共用同一套用户记忆,不再各自为政,确保用户意图、情绪、历史问题等多样化标签无缝传递。用户一次提供信息,智能体同步获取,智能体群控记忆共享率达到了99.99%,基本能够消除因记忆不同步导致的服务问题。
这种针对“大模型健忘症”核心症结的深层次优化,使得记忆熊做到了“省、准、快”,为大模型在垂直领域的商业落地奠定了基础。
首先,是成本断崖式下降。通过引入独特的记忆分层存储机制,不需要每一轮对话中都回传所有的历史信息,压缩短期记忆为长期记忆摘要。这一机制让多轮对话累计的Token消耗直接降低了90%,对于那些每分钟都在烧钱的大模型应用来说,无异于神助。
其次,是精准度数量级提升。使用动态语境校准和智能语义剪枝技术,记忆熊将垂直场景的幻觉率压低到了0.2%以下,端到端的回应准确率达到了99.6%,大模型不再一本正经地胡说八道。特别在代表复杂逻辑能力的多跳推理和时序记忆上,记忆熊的表现领先诸多主流框架,证明它具备了区分过去与现在的时间感。
最后,是响应时间进一步缩短。人机交互中,延迟关乎体验。记忆熊基于向量的非图谱版本,成功将搜索请求的中位响应时间(Search Latency P50),即普通用户最常见的速度体验控制在0.137秒;语音交互场景下应答延迟仅0.8秒。当你话音刚落,AI的回答已经到达耳边,对话流畅自然。
“记忆即资产”
“记忆”的突破,终将重塑商业的形态。
在商业世界里,大模型有没有记忆,差异尤为明显。
客服AI若记不得用户投诉过的细节,就只能重复问题,无法取代真人;企业知识若不能不能转化为经验沉淀在系统里,AI就只能永远充当知识库;在教育、医疗及投顾等行业,若AI无法与客户建立持续深入的联系,它就无法进入高信任度的场景。
记忆不仅仅是一个功能,更是一种身份。
当AI有了持续的记忆,它就第一次具备了回答“我是谁?”、“我在与谁沟通?”、以及“我们之前达成过什么共识”的能力。
为充分利用记忆资产,红熊AI记忆熊产品明确了三条产品主线,分别是隐性记忆的显性化、记忆的结构化处理,以及记忆的场景化应用。简而言之,就是要将把AI与用户的交互沉淀为记忆,并在不同的业务场景下发挥作用。
模型参数里只有可复述的显性知识,但要企业的护城河往往在于隐性经验:金牌销售如何破冰?资深技工如何听音辨位?这些过去依赖个人经验的“暗知识”,现在可以通过记忆熊被结构化地沉淀下来,成为组织记忆,而非单个员工的独家记忆。
大模型没法记住一切,因为内容越多、参数越大、会话越长,则成本越高、遗忘越快、幻觉越多。记忆熊能帮助大模型构建一个“语义剪枝+记忆锚定+情境校准”的机制,结构化处理记忆,只保留与用户身份、历史行为及任务目标有关的核心记忆。
在企业的真实业务场景中,往往是多个智能体协同工作。记忆熊能记忆变为组织资产,而不是单个智能体的独家记忆,提升记忆共享率,则是模型协同的关键。
这三件事,推动记忆从技术功能拓展为商业基础设施。当企业开始关注“AI是否能复用经验、是否能像老员工一样理解上下文、是否能形成组织记忆”时,AI正式从工具进入体系阶段。
参数规模的战争终将结束,但智能体的进化才刚刚开始。
参数规模不是终局,记忆才可能成为真正的操作系统级入口。AI的下一场战役,不是“谁回答得更好”,而是“谁更记得住”,这仍然是一场初创公司可以参与的竞争。
跳出具体的商业场景,记忆实际上是通往通用人工智能(AGI)的必由之路。
没有记忆,就没有推理;没有记忆,也就没有智能。人类之所以成为万物之灵,是因为我们拥有强大的记忆系统,能够跨越时空积累经验,从历史中预判未来。
当前大模型虽然在语言生成上表现惊艳,但在逻辑推理、长期规划和自我进化上,依然有着巨大的进步空间。这归根结底,是因为它们缺乏一个稳定、连续且可塑的记忆系统。
红熊AI的探索,实际上是在补全AGI拼图中最关键的一块。它不仅让AI感知到数据的模式,还能理解并记住世界的规则。
红熊AI于2025年11月30日正式将记忆熊产品完全开源,邀请全球的开发者共同参与这场关于AI记忆的重构。
也许就在不久的将来,大模型的健忘症很快被治愈,一个拥有“累积性智慧”的时代就此徐徐拉开序幕。
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
本文来自虎嗅,原文链接:https://www.huxiu.com/article/4811016.html?f=wyxwapp
时事1:美高梅快速注册
12月26日,磷虾油“零含量”,在透支同仁堂信誉,村民们普遍质疑,身份或被冒用于不良或非法用途。“这些营业执照,是不是被拿去骗取农业补贴、申请贷款,或者搞业绩报表?就算不申请大病补助什么的,也要查清楚。冒用公民身份信息,本身就是违法行为。”刘一鸣说。,澳门有滚球吗。
12月26日,12月上映电影类型丰富 带动岁末观影热潮,环证国际证券集团首席执行官方颂贤表示,投资者应选择性增持那些在中国人工智能和限止领域 “自主化” 进程中受益的企业,同时将全球龙头企业保留在投资组合中。,世界杯预测网站,稳定的网络捕鱼,pt游戏官网下载。
时事2:快盈ll下载app
12月26日,第二批“贵系列”品牌产品发布 74家企业104个产品入选,北京时间10日,沙特伊朗在中国的斡旋下,宣布达成协议,重新恢复外交关系。对此,也门政治评论人士默罕默德·沙姆桑在接受总台记者采访时表示,沙特和伊朗在也门冲突中扮演了重要角色,两国关系的改善,也让深陷冲突的也门人民看到了希望。,金沙客户端下载娱乐,巴黎人安卓应用下载,im体育官网注册。
12月26日,海内外逾400名信众福建泉州祈福共祭关帝,经济学家指出,造成这两项数据下滑的原因多样,关税政策便是其中之一。,九五至尊最新网站,yabo登录,电玩捕鱼机。
时事3:棋牌能下分的
12月26日,铁路部门在京张高铁8趟列车试点推出“雪具便利行”服务,为了适应跨境电商发展,此次关税法草案二审稿一大变化,是明确跨境电商领域的相关扣缴义务人。简言之,就是明确了跨境电商交易中究竟谁来代缴关税。,二八杠都需要什么牌,那个软件可以玩炸金花,天博app下载链接怎么用。
12月26日,AI教育走进北京市丰台区怡海中学,其中,一季度深圳进出口总额达到1.02万亿元,十年来同期首次突破万亿元大关。与此同时,规上工业增加值增速保持两位数增长,达到11.5%,同样位居全国前列。工业与外贸双双回暖,也传递出制造大市深圳经济向好的信号。,Asia Gaming,欧亚体育app官网下载,pp电子游戏平台。
时事4:华体会体育
12月26日,菲律宾央行降息至4.50% 为三年来最低水平,未来,双方将继续依托 NEXT-BIO 平台,聚焦多肽、小分子及新机制等重点方向,打造常态化的“项目遴选 + 专家评估 + 共研共投对接”机制,推动更多具有 FIC/BIC 潜力的中国创新药资产走出实验室、走向临床与全球市场,实现真正意义上的“共研、共投、共赢”。,必维体育官方入口,天博官方体育,九洲天地网。
12月26日,国家统计局:11月份国民经济保持稳中有进发展态势,马兴瑞指出,要把发展特色优势产业作为主攻方向,高质量建设“八大产业集群”,因地制宜培育新质生产力,加快产业转型升级。,伟德体育电子网投,体球网篮球比分直播,澳门捕鱼手机网址。
责编:陈庆祥
审核:迈克·特鲁德尔
责编:齐宝成












