DavidLanz/chinese-dolly-15k
收藏Hugging Face2023-09-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DavidLanz/chinese-dolly-15k
下载链接
链接失效反馈官方服务:
资源简介:
Chinese-Dolly-15k 是繁体中文翻译的Dolly instruction(Databricks)数据集。原来的数据集databricks/databricks-dolly-15k是由数千名Databricks员工根据InstructGPT论文中概述的几种行为类别生成的遵循指示记录的开源数据集。这几个行为类别包括头脑风暴、分类、封闭型问答、生成、信息撷取、开放类型的问答和摘要。在知识共享署名-相同方式共享3.0(CC BY-SA 3.0)许可下,此数据集可用于任何学术或商业用途。
Chinese-Dolly-15k is a Traditional Chinese translated variant of the Dolly instruction (Databricks) dataset. The original dataset, databricks/databricks-dolly-15k, is an open-source collection of instruction-following records generated by thousands of Databricks employees based on several behavioral categories outlined in the InstructGPT paper. These behavioral categories include brainstorming, classification, closed-domain question answering, generation, information extraction, open-domain question answering, and summarization. Licensed under the Creative Commons Attribution-ShareAlike 3.0 (CC BY-SA 3.0) license, this dataset can be used for any academic or commercial purposes.
提供机构:
DavidLanz
原始信息汇总
Chinese-Dolly-15k 数据集概述
基本信息
- 许可证: CC BY-SA 3.0
- 任务类别:
- 问答
- 摘要
- 文本生成
- 语言:
- 中文
- 英文
- 数据规模: 10K<n<100K
数据集描述
- 名称: Chinese-Dolly-15k
- 来源: 繁體中文翻譯的Dolly instruction(Databricks)資料集
- 原始数据集:
databricks/databricks-dolly-15k - 生成方式: 由数千名Databricks员工根据InstructGPT论文中概述的几种行为类别生成
- 行为类别:
- 头脑风暴
- 分类
- 封闭型问答
- 生成
- 信息擷取
- 开放型问答
- 摘要
使用许可
- 该数据集可在知识共用署名-相同方式共用3.0(CC BY-SA 3.0)许可下用于任何学术或商业用途。



