BELLE-2/train_3.5M_CN_With_Category
收藏Hugging Face2023-10-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BELLE-2/train_3.5M_CN_With_Category
下载链接
链接失效反馈官方服务:
资源简介:
本数据集是一个中文文本生成任务数据集,大小在1M到10M之间,基于原有的train_3.5M_CN数据集扩展,新增了13个指令类别字段。数据集仅限于研究使用,不得用于商业或其他有害社会用途。
本数据集是一个中文文本生成任务数据集,大小在1M到10M之间,基于原有的train_3.5M_CN数据集扩展,新增了13个指令类别字段。数据集仅限于研究使用,不得用于商业或其他有害社会用途。
提供机构:
BELLE-2
原始信息汇总
数据集概述
基本信息
- 许可证:gpl-3.0
- 任务类别:text2text-generation
- 语言:zh
- 数据规模:1M<n<10M
内容描述
该数据集基于原有的train_3.5M_CN数据集,新增了指令类别字段,共包括13个类别。
数据样例
json { "id": "66182880", "category": "generation" }
字段说明
- id:数据id
- category:该条指令数据对应的类别
使用限制
- 仅允许用于研究目的
- 不得用于商业用途
- 不得用于会对社会带来危害的用途
- 数据集不代表任何一方的立场、利益或想法
- 因使用本数据集带来的任何损害、纠纷,本项目不承担任何责任



