five

E-commerce

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/E-commerce
下载链接
链接失效反馈
官方服务:
资源简介:
我们发布了电子商务对话语料库,包括一个训练数据集、一个开发集和一个基于检索的聊天机器人的测试集。电子商务对话语料库的统计数据如下表所示。训练 Val 测试会话-响应对 1m 10k 10k Avg。每个会话的积极响应 1 1 1 每个会话的最小转数 3 3 3 每个会话的最大转数 10 10 10 每个会话的平均转数 5.51 5.48 5.64 每个话语的平均字数 7.02 6.99 7.11 完整的语料库可以从 https://drive.google 下载。 com/file/d/154J-neBo20ABtSmJDvm7DK0eTuieAuvw/view?usp=sharing。

We have released an e-commerce dialogue corpus, which includes a training dataset, a development set, and a test set for retrieval-based chatbots. The statistical metrics of the corpus are presented in the table below: | Split | Training | Validation | Test | |:------------------- |:------------- |:------------- |:------------- | | Session-response pairs | 1,000,000 (1M) | 10,000 (10K) | 10,000 (10K) | | Average positive responses per session | 1 | 1 | 1 | | Minimum turns per session | 3 | 3 | 3 | | Maximum turns per session | 10 | 10 | 10 | | Average turns per session | 5.51 | 5.48 | 5.64 | | Average word count per utterance | 7.02 | 6.99 | 7.11 | The complete corpus can be downloaded from https://drive.google.com/file/d/154J-neBo20ABtSmJDvm7DK0eTuieAuvw/view?usp=sharing.
提供机构:
OpenDataLab
创建时间:
2022-08-19
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
E-commerce数据集是一个用于聊天机器人研究的电子商务对话语料库,包含1百万训练会话-响应对和1万开发集/测试集对,每个会话平均5.5轮对话,每句话平均7字。数据集由上海交通大学和华东师范大学发布,适用于自然语言处理和对话式响应选择任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作