five

DuLeMon (Baidu Long-term Memory Conversation)

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/DuLeMon
下载链接
链接失效反馈
官方服务:
资源简介:
DuLeMon 是一个大规模的中文长期记忆对话数据集,它模拟长期记忆对话,专注于在长期交互中主动构建和利用用户和机器人角色的能力。 DuLeMon 包含大约 27.5k 人与人对话、449k 话语和 12k 角色基础句子。该语料库可用于探索长期记忆对话、个性化对话和角色提取/匹配/检索。

DuLeMon is a large-scale Chinese long-term memory dialogue dataset. It simulates long-term memory dialogues, focusing on the capability of actively constructing and leveraging the personas of both users and robots during long-term interactions. DuLeMon contains approximately 27.5k human-to-human dialogues, 449k utterances, and 12k persona base sentences. This corpus can be used to explore long-term memory dialogue, personalized dialogue, as well as persona extraction/matching/retrieval.
提供机构:
OpenDataLab
创建时间:
2022-09-01
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
DuLeMon是一个大规模中文长期记忆对话数据集,包含27.5k对话和449k话语,专注于长期交互中的用户和机器人角色能力构建,适用于长期记忆对话和个性化对话研究。由北京邮电大学、哥伦比亚大学和百度于2022年联合发布。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作