five

BELLE-2/train_3.5M_CN_With_Category

收藏
Hugging Face2023-10-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BELLE-2/train_3.5M_CN_With_Category
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集是一个中文文本生成任务数据集,大小在1M到10M之间,基于原有的train_3.5M_CN数据集扩展,新增了13个指令类别字段。数据集仅限于研究使用,不得用于商业或其他有害社会用途。

本数据集是一个中文文本生成任务数据集,大小在1M到10M之间,基于原有的train_3.5M_CN数据集扩展,新增了13个指令类别字段。数据集仅限于研究使用,不得用于商业或其他有害社会用途。
提供机构:
BELLE-2
原始信息汇总

数据集概述

基本信息

  • 许可证:gpl-3.0
  • 任务类别:text2text-generation
  • 语言:zh
  • 数据规模:1M<n<10M

内容描述

该数据集基于原有的train_3.5M_CN数据集,新增了指令类别字段,共包括13个类别。

数据样例

json { "id": "66182880", "category": "generation" }

字段说明

  • id:数据id
  • category:该条指令数据对应的类别

使用限制

  • 仅允许用于研究目的
  • 不得用于商业用途
  • 不得用于会对社会带来危害的用途
  • 数据集不代表任何一方的立场、利益或想法
  • 因使用本数据集带来的任何损害、纠纷,本项目不承担任何责任
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作