five

DavidLanz/chinese-dolly-15k

收藏
Hugging Face2023-09-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DavidLanz/chinese-dolly-15k
下载链接
链接失效反馈
官方服务:
资源简介:
Chinese-Dolly-15k 是繁体中文翻译的Dolly instruction(Databricks)数据集。原来的数据集databricks/databricks-dolly-15k是由数千名Databricks员工根据InstructGPT论文中概述的几种行为类别生成的遵循指示记录的开源数据集。这几个行为类别包括头脑风暴、分类、封闭型问答、生成、信息撷取、开放类型的问答和摘要。在知识共享署名-相同方式共享3.0(CC BY-SA 3.0)许可下,此数据集可用于任何学术或商业用途。

Chinese-Dolly-15k is a Traditional Chinese translated variant of the Dolly instruction (Databricks) dataset. The original dataset, databricks/databricks-dolly-15k, is an open-source collection of instruction-following records generated by thousands of Databricks employees based on several behavioral categories outlined in the InstructGPT paper. These behavioral categories include brainstorming, classification, closed-domain question answering, generation, information extraction, open-domain question answering, and summarization. Licensed under the Creative Commons Attribution-ShareAlike 3.0 (CC BY-SA 3.0) license, this dataset can be used for any academic or commercial purposes.
提供机构:
DavidLanz
原始信息汇总

Chinese-Dolly-15k 数据集概述

基本信息

  • 许可证: CC BY-SA 3.0
  • 任务类别:
    • 问答
    • 摘要
    • 文本生成
  • 语言:
    • 中文
    • 英文
  • 数据规模: 10K<n<100K

数据集描述

  • 名称: Chinese-Dolly-15k
  • 来源: 繁體中文翻譯的Dolly instruction(Databricks)資料集
  • 原始数据集: databricks/databricks-dolly-15k
  • 生成方式: 由数千名Databricks员工根据InstructGPT论文中概述的几种行为类别生成
  • 行为类别:
    • 头脑风暴
    • 分类
    • 封闭型问答
    • 生成
    • 信息擷取
    • 开放型问答
    • 摘要

使用许可

  • 该数据集可在知识共用署名-相同方式共用3.0(CC BY-SA 3.0)许可下用于任何学术或商业用途。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作