five

ZH-4O

收藏
arXiv2025-09-15 更新2025-09-17 收录
下载链接:
https://github.com/mem0ai/mem0
下载链接
链接失效反馈
官方服务:
资源简介:
ZH-4O数据集是一个针对角色扮演场景设计的超长对话数据集,每个对话平均长度为600轮,包含手动标注的记忆信息。该数据集旨在为评估记忆提取方法的性能提供一个基准。ZH-4O数据集的创建过程包括对话收集、记忆标注和探索表设计。对话收集过程中,设计了多种聊天机器人角色以增强对话多样性和泛化能力。记忆标注则由独立的标注员完成,他们负责标注对话中的关键信息和相应位置。探索表设计则用于评估不同记忆框架对LLM响应的影响。

The ZH-4O dataset is an ultra-long dialogue dataset designed for role-playing scenarios, with each dialogue averaging 600 turns and containing manually annotated memory information. This dataset aims to provide a benchmark for evaluating the performance of memory extraction methods. The creation process of the ZH-4O dataset includes dialogue collection, memory annotation, and exploration sheet design. During dialogue collection, multiple chatbot roles were designed to enhance dialogue diversity and generalization capability. Memory annotation was completed by independent annotators, who were responsible for annotating key information and their corresponding positions in the dialogue. The exploration sheet design is used to evaluate the impact of different memory frameworks on LLM responses.
提供机构:
北京邮电大学,商汤科技,网络系统与网络文化北京市重点实验室
创建时间:
2025-09-15
原始信息汇总

Mem0 数据集概述

基本介绍

Mem0("mem-zero")是一个智能记忆层,用于增强AI助手和代理的能力,实现个性化AI交互。该数据集能够记住用户偏好、适应个体需求并随时间持续学习,适用于客户支持聊天机器人、AI助手和自主系统。

核心特性

  • 多级记忆:无缝保留用户、会话和代理状态,具有自适应个性化功能
  • 开发者友好:提供直观的API、跨平台SDK和完全托管的服务选项

性能优势

  • 准确率提升:在LOCOMO基准测试中比OpenAI Memory准确率高26%
  • 响应速度:比全上下文方法快91%,确保低延迟扩展
  • 令牌使用量:比全上下文方法减少90%,在不影响效果的前提下降低成本

应用场景

  • AI助手:保持连贯且内容丰富的对话
  • 客户支持:回忆过去的工单和用户历史以提供定制化帮助
  • 医疗保健:跟踪患者偏好和历史以提供个性化护理
  • 生产力和游戏:根据用户行为调整工作流程和环境

快速开始

托管平台

  1. 在Mem0平台(https://app.mem0.ai)注册
  2. 通过SDK或API密钥嵌入记忆层

自托管(开源)

  • 通过pip安装:pip install mem0ai
  • 通过npm安装:npm install mem0ai

集成与演示

  • 带记忆的ChatGPT:由Mem0驱动的个性化聊天(在线演示:https://mem0.dev/demo)
  • 浏览器扩展:在ChatGPT、Perplexity和Claude中存储记忆(Chrome扩展:https://chromewebstore.google.com/detail/onihkkbipkfeijkadecaafbgagkhglop?utm_source=item-share-cb)
  • Langgraph支持:使用Langgraph + Mem0构建客户机器人(指南:https://docs.mem0.ai/integrations/langgraph)
  • CrewAI集成:使用Mem0定制CrewAI输出(示例:https://docs.mem0.ai/integrations/crewai)

文档与支持

  • 完整文档:https://docs.mem0.ai
  • 社区支持:Discord(https://mem0.dev/DiG)、Twitter(https://x.com/mem0ai)
  • 联系方式:founders@mem0.ai

引用

bibtex @article{mem0, title={Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory}, author={Chhikara, Prateek and Khant, Dev and Aryan, Saket and Singh, Taranjeet and Yadav, Deshraj}, journal={arXiv preprint arXiv:2504.19413}, year={2025} }

许可证

Apache 2.0许可证

搜集汇总
数据集介绍
main_image_url
构建方式
ZH-4O数据集的构建过程体现了对超长对话中记忆管理研究的深度需求。首先通过设计多样化聊天机器人角色,邀请标注者进行自由对话生成,平均每段对话达600轮,确保内容的自然性与多样性;随后由独立标注团队手动提取关键记忆信息并标注其出现位置,最终获得28段对话和1115条高质量记忆标注,形成兼具真实性与丰富上下文的中文角色扮演对话资源。
特点
该数据集的核心特点在于其超长对话规模与精细的记忆标注体系。平均600轮对话长度显著超越现有数据集,覆盖丰富的中文文化元素如川菜、名人等,增强了语料的现实代表性;记忆标注不仅包含事件摘要,还涉及用户角色画像的多维度属性,支持对叙事发展与人物塑造的双重分析,为记忆提取模型提供结构化的评估基准。
使用方法
ZH-4O适用于评估对话系统中的长期记忆提取与管理能力。研究者可通过其附带的探测问题表(含1068道多选题)验证模型记忆召回准确性,或利用标注的记忆点训练与测试记忆压缩、遗忘机制等算法;数据集支持多尺度时间序列分析,既可研究局部对话冲突,也能追踪全局叙事演进,为超长对话建模提供全面实验基础。
背景与挑战
背景概述
ZH-4O数据集由北京邮电大学与商汤科技于2025年联合构建,专为超长角色扮演对话场景设计,平均对话轮次达600轮,包含28段真实人机交互对话及1,115条人工标注记忆信息。该数据集聚焦于解决大语言模型在长程对话中的记忆提取与一致性维护问题,通过融合文学理论中的情节发展与角色塑造双要素,为对话系统的长期记忆管理研究提供了重要基准。其创新性在于首次将人类记忆抑制竞争理论应用于对话记忆控制,推动了角色扮演对话模型在长程上下文理解方面的研究进展。
当前挑战
该数据集核心挑战在于解决超长对话中记忆信息的结构化提取与容量控制问题。具体包括:1) 领域问题层面,需克服传统方法因记忆无限增长导致的上下文冗余和关键信息丢失,实现多时间尺度的情节冲突摘要与用户角色画像动态更新;2) 构建过程中需处理真实人机对话的语义复杂性,通过双重标注与第三方校验确保记忆标注的准确性与一致性,同时设计涵盖文化特定元素(如中国饮食与名人)的探测问题以评估记忆提取效果。
常用场景
经典使用场景
在超长角色扮演对话系统中,ZH-4O数据集被广泛用于评估和优化记忆提取框架的性能。该数据集通过平均600轮次的高质量人工标注对话,为研究社区提供了真实的交互场景,支持模型在长程对话中维持叙事连贯性和角色一致性。其典型应用包括测试双分支记忆插件对情节冲突归纳和角色画像构建的有效性,成为超长对话记忆管理研究的基准工具。
解决学术问题
ZH-4O数据集解决了超长对话中记忆无序增长和关键信息丢失的核心学术问题。通过提供手动标注的记忆点及其位置信息,它支持开发可控容量的记忆机制,如基于竞争抑制理论的遗忘算法。该数据集显著提升了对话模型在长上下文中的一致性表现,并为叙事理论与计算语言学的交叉研究提供了实证基础,推动了人机交互中记忆建模的理论创新。
衍生相关工作
ZH-4O数据集催生了多项经典研究工作,包括双分支记忆框架MOOM及其变体,这些工作融合文学理论中的情节与角色元素。基于该数据集衍生的竞争抑制遗忘算法被扩展至多语言对话系统,如跨语言评估框架LoCoMo的适配。此外,其标注范式启发了后续数据集的构建,如多模态角色扮演数据集和动态记忆更新机制的研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作