E-commerce
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/E-commerce
下载链接
链接失效反馈官方服务:
资源简介:
我们发布了电子商务对话语料库,包括一个训练数据集、一个开发集和一个基于检索的聊天机器人的测试集。电子商务对话语料库的统计数据如下表所示。训练 Val 测试会话-响应对 1m 10k 10k Avg。每个会话的积极响应 1 1 1 每个会话的最小转数 3 3 3 每个会话的最大转数 10 10 10 每个会话的平均转数 5.51 5.48 5.64 每个话语的平均字数 7.02 6.99 7.11 完整的语料库可以从 https://drive.google 下载。 com/file/d/154J-neBo20ABtSmJDvm7DK0eTuieAuvw/view?usp=sharing。
We have released an e-commerce dialogue corpus, which includes a training dataset, a development set, and a test set for retrieval-based chatbots. The statistical metrics of the corpus are presented in the table below:
| Split | Training | Validation | Test |
|:------------------- |:------------- |:------------- |:------------- |
| Session-response pairs | 1,000,000 (1M) | 10,000 (10K) | 10,000 (10K) |
| Average positive responses per session | 1 | 1 | 1 |
| Minimum turns per session | 3 | 3 | 3 |
| Maximum turns per session | 10 | 10 | 10 |
| Average turns per session | 5.51 | 5.48 | 5.64 |
| Average word count per utterance | 7.02 | 6.99 | 7.11 |
The complete corpus can be downloaded from https://drive.google.com/file/d/154J-neBo20ABtSmJDvm7DK0eTuieAuvw/view?usp=sharing.
提供机构:
OpenDataLab
创建时间:
2022-08-19
搜集汇总
数据集介绍

背景与挑战
背景概述
E-commerce数据集是一个用于聊天机器人研究的电子商务对话语料库,包含1百万训练会话-响应对和1万开发集/测试集对,每个会话平均5.5轮对话,每句话平均7字。数据集由上海交通大学和华东师范大学发布,适用于自然语言处理和对话式响应选择任务。
以上内容由遇见数据集搜集并总结生成



