MemoryLake发布:开启AI记忆平台的规模化应用时代

质变科技发布MemoryLake,首个大规模记忆湖,强调其在AI企业落地中的核心作用,提升隐性知识利用和生产效率。

原文标题:首个大规模记忆湖发布,AI Infra跑步进入“记忆”时代

原文作者:数据派THU

冷月清谈:

文章介绍了质变科技发布的AI记忆平台MemoryLake,强调了其作为AI“第二大脑”在企业应用中的重要性。与传统AI的“连接”和“交互”阶段不同,MemoryLake专注于萃取“隐性知识”,固化企业核心资产,提升生产效率。文章详细阐述了MemoryLake的核心能力,包括数据理解模型、记忆管理与计算以及多模态数据平台。它通过分层管理记忆、支持多模态数据以及提供精准检索和计算能力,解决了传统AI在处理海量数据和复杂业务场景中的难题。MemoryLake已在多个行业落地应用,并展现出优于传统解决方案的性能。文章最后展望了AI记忆市场的巨大潜力,并分析了质变科技的竞争优势。

怜星夜思:

1、文章中提到MemoryLake对标的是AI的“第二大脑”,负责“记住一切”,而LLM负责“思考一切”。那么,在实际应用中,如果“第二大脑”提供的“记忆”本身存在偏差或不完整,是否会影响LLM的“思考”结果?以及如何保证“第二大脑”记忆的准确性和可靠性?
2、文章提到MemoryLake在长程对话记忆基准测试LoCoMo上取得了全球第一的成绩。这个LoCoMo测试具体考察的是哪些能力?对于实际的企业应用场景,长程对话记忆能力又意味着什么?
3、文章中提到MemoryLake可以整合企业内部不同系统、不同时间的“生产记忆”或“交易记忆”,实现质量问题追溯和风险实时预警。那么,在实际操作中,如何确保不同系统之间的数据兼容性和一致性?以及如何防止敏感数据泄露?

原文内容

图片
来源:人工智能前沿讲习
本文约3200字,建议阅读6分钟
本文介绍了 AI 记忆平台 MemoryLake 的核心能力、优势及各行业落地应用与前景。


LLM是AI的“第一大脑”,记忆平台是AI的“第二大脑”。


畅销书作者Tiago Forte在《构建第二大脑》中曾分享核心观点:


“生物大脑只用于思考创造,而外部系统用于信息的可靠存储。”——这对我们理解AI的“双脑”分工极富启示。


事实上,LLM就如同AI的“第一大脑(生物脑)”,它擅长思考、推理与即时生成,而不擅长长期、精确地存储海量事实。


而记忆平台是AI的“第二大脑”,它主要按需为LLM提供准确的“记忆”支撑,让LLM从记忆负担中解放,专注于更高层次的推理与创造,从而协同产生更精准、个性化且可行动的价值。


两者结合,记忆平台负责“记住一切”,LLM负责“思考一切”。


当AI从示范应用进入企业落地深水区,记忆平台决定胜负手


过去几年,AI在企业端的应用已跨越三个阶段:


1.0 连接阶段(2023年前):解决“存”与“找”


早期AI充当智能连接器,将企业数据导入向量数据库,实现语义检索,替代传统关键词搜索增强用户输入的表达能力。


局限在于离核心生产流程遥远,更像一个“更聪明的文档管理员”,未触及业务实质。


2.0 交互阶段(2023-2024年):意图理解与“幻觉”困境


大模型突破使AI能以自然语言对话调用数据,门槛降低。


但真正瓶颈浮现:它能处理显性数据,却难以表征专家头脑中的“隐性知识”(如风投一眼看穿财报问题的直觉),导致输出流于表面,难以交付可靠决策。


3.0 生产力时代(2025年至今):萃取“隐性知识”,固化核心资产


行业焦点转向直接提升生产效率。关键一跃在于能否将员工的决策逻辑、经验权衡等隐性知识数字化、轨迹化。


这不再是简单问答,而是通过记录分析员工的日常审批、批注、沟通,构建组织“决策轨迹记忆中枢”,实现核心能力的沉淀与复用。



当前竞争已升至“隐性知识”的记忆化以及高准确性、可信可靠的记忆管理。“记忆平台”不再只是辅助工具,而是将企业最宝贵的智力资产——人脑中的判断力,转化为可迭代、可传承的记忆资产。


分析师预计,到2030年,AI智能体编排和记忆系统的市场将达到284.5亿美元。其中,128.8亿美元归因于独立的AI记忆市场。


一个好的AI记忆平台长什么样?


一个好的AI记忆平台,早已不是“能存能查”那么简单,它必须具备数据理解模型能力、记忆管理与计算和多模态数据平台能力。


质变科技近日发布了业内首个具备超大规模实践的 “MemoryLake(记忆湖)”产品,作为全球少有的兼具记忆能力、模型能力和数据平台能力于一身的全栈玩家,质变科技此次通过MemoryLake率先践行以记忆为中心的技术路线。


早在2023年,质变科技创始人离哲(本名占超群)就萌生了诸多思考,“记忆作为AI第二大脑,围绕记忆将诞生全新的AI Infra。”



他判断,未来系统核心将从“管理数据记录”转向“管理多模态的决策轨迹,构建多模态认知状态记忆”,认知状态记忆是系统在某一时刻,对“我在做什么、我知道什么、我假设什么、我不确定什么”的结构化内部表征;认知状态记忆将成为AI时代的主角。


有了这个方向,该团队先是在2024年上线了高准确性、低容忍度用于严肃场景的决策智能体Powerdrill。


通过海外超150万专业数据领域用户、1300万数据问题、5000万生成代码(每个用户的问题会动态生成一个动态决策软件)的迭代和准确性的调优积累,沉淀出一整套端到端的记忆工程技术,成就了今天产品化的MemoryLake。


MemoryLake包含核心三个技术组件:MemoryLake-D1大模型、MemoryLake记忆引擎和多模态存储与计算平台(Relyt Multi-modal Data Cloud),首次将“多模态内容深度理解、记忆计算与管理、多模态记忆存储”全栈能力融于一体。


从行业头部客户实践看,MemoryLake具备超大规模记忆场景(如在一些客户生产系统中超10万亿级记录、亿级文档)企业级实践,服务了国内超大规模的文档办公、头部的企业移动办公软件、大模型、大型国央企等企业,在与全球云大厂和AI典型厂商等竞争中,MemoryLake在成本、准确召回率和延迟等性能指标方面显示出数倍于对手的显著优势。


今年年初,MemoryLake正式上线,将前文所述的三大核心能力,落地为可直接服务企业场景的实用功能。


先说记忆管理能力

MemoryLake将记忆分为短期/中期/长期记忆,还有工作记忆、世界观记忆等,通过分层办法管理。根据记忆的访问频率、复用价值、生命周期动态存储,平衡效率与成本。


同时,它还支持记忆的同步/异步提取、动态更新、精准删除、遗忘压缩与高效召回,适配业务动态变化。政策更新时自动同步记忆,无用记忆自动释放资源,业务调用时快速精准召回,减少人工干预。


为避免出现“数据孤岛”,MemoryLake还支持跨大模型/智能体的跨端、跨域通用,有广泛的协议支持和接入能力,如兼容MCP、mem0、OpenMemory等主流协议,快速接入企业现有系统,降低部署成本。


多模态知识深度理解、提取与存储能力

随着多模态模型成为主流,企业的记忆资产已涵盖文档、表格、音视频等多种形态,传统文本型记忆工具无法应对非结构化数据,导致大量核心信息无法利用,难以适配复杂场景。


之前为提高多模态数据理解、提取能力,专门研发的MemoryLake-D1模型派上用场,能精准提取文本逻辑、表格关联,转写音视频关键信息,识别图片内容,确保多模态数据转化为可靠的结构化记忆。


此外,MemoryLake还能将所有数据整理成好懂、好用的形式(如知识图谱、Summary),以及能实现PB级精准检索,不管数据再多,都能快速找到想要的。


大模型时代Agent与记忆交互的是Code。因此,多模态知识处理能力还包含分布式Code计算能力。这样一来,AI调用记忆的时候,能及时响应、不卡顿、不报错,顺畅对接,完全适配现在大模型普及后的使用需求,不会出现“AI想调用记忆,却对接不上、用不了”的情况。



记忆检索、计算、评估能力

MemoryLake支持端到端的精炼且完整的上下文理解与组织,不管是大模型还是智能体,都能快速借助它开展企业相关的业务开发,节省时间和人力。


数据来源可精确定位,决策过程可追溯、可人工干预(human-in-loop),满足企业严谨的低容忍度业务要求。



公开信息显示,在极具挑战性的长程对话记忆基准测试LoCoMo上(需在平均300轮、跨数月、多模态内容的超长对话中进行精准信息整合与推理),MemoryLake记忆引擎以94.0%的综合得分位列全球第一。


当然,MemoryLake不光能检索记忆,还能基于组织好的记忆进行计算,能完成非常复杂的操作和代码执行,既保证准确,又灵活多变,适配企业各种复杂的计算需求。


千亿级赛道的好生意


“这只是起点。”OpenAI CEO奥特曼认为,2026年将是Agent Memory从“基础可用”向“成熟商用”突破的关键年份,目标是让AI记忆“像人类认知一样自然、持续且可靠”。


数据显示,到2028年,全球AI解决方案市场规模将突破6320亿美元,其中AI记忆相关赛道规模超280亿美元。


可见这是一条足够宽,也足够深的黄金赛道。离哲也说“AI的未来是靠记忆驱动的”。


近年来,头部大模型厂商和传统数据平台、云厂商也注意到AI记忆已从概念性基建,变为企业AI落地的核心刚需,纷纷入局。但一些先天短板让这些企业难以占据绝对优势。


传统云厂商与数据平台深耕存储与计算领域多年,缺乏针对多模态记忆的深度理解引擎与动态管理能力,面对复杂的企业级记忆需求容易力不从心。



头部大模型厂商虽拥有强大的生成能力,却受困于数据碎片化,难以在复杂业务场景中给出准确、持续且可解释的决策。这些行业痛点,恰恰为具备全栈能力的创新企业提供了弯道超车的机会。


这也让质变科技看到了机会。其记忆管理与计算、数据大模型、AI数据平台三位一体的完整技术栈,在创业初期便收获了资本的高度青睐,天使轮融资达数千万美金,估值超2亿美金。


据悉,新的一轮融资已经在路上了。


目前,MemoryLake已经服务了全球150多万专业用户和15000家企业,覆盖金融、工业制造、游戏、教育、法律、电商等多个行业。



比如企业老板要做决策,想分析某个项目以前的风险和现在的市场趋势,它能自动把项目文档、沟通记录、行业报告这些分散的信息整合起来,推理分析后给出带证据的建议,以前要花几周的人工分析,现在几小时就搞定了。



在沉浸式游戏里,它能给NPC建立 “世界观记忆” 和 “玩家记忆”,NPC会记住玩家以前的每一个关键选择和成就,还能根据这些记忆跟玩家互动、推进剧情,真正实现 “一千个玩家有一千种体验”。


在制造业和金融业,它能整合不同系统、不同时间的 “生产记忆” 或 “交易记忆”,工厂出现质量问题,能瞬间找到根本原因,金融交易里有风险,能实时预警,以前要大量人工排查的活儿,现在AI一瞬间就完成了,帮企业抢回宝贵时间。


据官方透露,在记忆取用时,MemoryLake引擎返回的是Context友好、精炼且完整的记忆,而非多、杂且不完整、逻辑冲突的原始知识,可以让模型结合MemoryLake PB级别的数据记忆组织能力,平均降低90%以上的Token消耗和计算成本。


正如云时代催生了Snowflake与Databricks,AI时代将重新定义以“记忆”为核心的新一代基础设施。


一个全新的、AI“会可信记事儿、会思考”的时代,已经来了。


官网地址:https://memorylake.ai/


编辑:于腾凯
校对李享沣



关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。




新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU


分层记忆管理就像人脑一样,对于常用的、重要的信息优先存储和快速访问,不常用的则放在“长期记忆”里。这样AI在做决策时,就能更快地找到相关的“记忆”,提高效率。同时,不同类型的“记忆”可能采用不同的存储和索引方式,也能提升检索的准确性。

长程对话记忆在客服机器人中太重要了!想想看,如果你每次和客服机器人对话,都要从头开始解释你的问题,是不是很崩溃?

有了长程记忆,客服机器人就能记住你之前说过的话,了解你的需求和偏好,从而提供更高效、更个性化的服务。比如,它可以记住你的地址、订单号等等,省去你重复输入的麻烦。

此外,长程记忆还有助于客服机器人更好地理解上下文,从而更准确地回答你的问题。总之,长程记忆是提升客服机器人用户体验的关键因素。

让我想到了电影《西部世界》!如果AI记忆平台足够强大,说不定真能创造出一个高度真实的虚拟世界。到时候,游戏就不再只是娱乐,而是一种全新的社交和生活方式。不过,伦理问题也需要好好考虑。

我觉着哈,以后在医疗领域,AI记忆平台能帮大忙。医生可以利用它快速查阅病历、医学文献,甚至可以模拟不同的治疗方案,找到最佳的治疗方法。尤其是在面对罕见病或者复杂病例的时候,AI的记忆能力和推理能力就能发挥更大的作用。

提取隐性知识确实是个难题。我觉得可以尝试建立一个鼓励知识分享的企业文化,鼓励员工分享自己的经验和见解。同时,可以利用AI技术对员工的日常工作进行分析,比如分析他们的邮件、文档、沟通记录等,从中发现有价值的隐性知识。

从技术角度来说,长程对话记忆的实现也面临着很多挑战。比如,如何有效地存储和管理大量的对话信息?如何快速地检索和利用这些信息?如何避免信息过载和干扰?这些都是需要解决的问题。但是解决这些问题后,AI在很多场景下的表现都会有质的提升。

我觉得可以借鉴一下游戏设计中的“行为复现”机制。记录专家在解决问题时的操作步骤、思考路径和反馈结果,然后利用 AI 模型对这些行为进行学习和模仿。这样就可以将专家的经验转化为可执行的 AI 智能体,实现隐性知识的自动化应用。

我认为传统云厂商和数据平台可以从以下几个方面入手:一是加强与AI算法团队的合作,共同研发针对多模态数据的深度理解引擎;二是积极引入AI人才,提升自身在AI领域的研发能力;三是开放平台接口,吸引第三方开发者参与AI记忆生态建设;四是与行业客户深度合作,了解其在AI记忆方面的实际需求,并根据需求定制解决方案。

嘶…个人用户细思极恐啊!以后会不会出现一个无所不知的AI管家,把你所有的秘密都掌握在手中?一方面,它可以帮你处理各种琐事,让你生活更加方便;另一方面,如果它被滥用,后果不堪设想。希望AI记忆的发展能够充分考虑伦理和隐私问题,避免出现《黑镜》里的情节。

LoCoMo测试第一确实厉害!但要说实际应用,我觉着这种长程记忆真正能发挥作用的,可能是一些需要高度定制化和情境理解的领域。比如,高端旅游定制,AI可以记住客户的历史偏好、过敏史、特殊需求等等,打造真正独一无二的行程。还有就是智能家居,AI能够学习用户的日常习惯,自动调节灯光、温度、音乐等等,营造最舒适的生活环境。当然,前提是用户愿意分享足够多的个人数据啦!

我觉得与其自己闭门造车,不如积极拥抱开源!可以考虑收购或投资一些在AI记忆领域有技术积累的初创公司,快速补齐短板。另外,还可以尝试与大模型厂商合作,将自己的存储和计算能力与大模型的生成能力结合起来,打造更具竞争力的AI记忆解决方案。

从技术角度来看,分布式Code计算能力意味着更高的并发处理能力和更低的延迟。AI Agent可以同时处理多个记忆请求,并更快地给出响应。这对于需要实时决策的场景,比如金融交易或者智能制造,至关重要。而且,这种能力也为AI Agent的自动化程度提供了更高的想象空间。