five

argilla/databricks-dolly-15k-curated-en

收藏
Hugging Face2023-10-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/argilla/databricks-dolly-15k-curated-en
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个记录,每个记录包括类别、指令、上下文和对指令的响应。项目的目标是修正这些指令、输入和响应,以确保它们具有最高质量,并且与它们所属的任务类别相匹配。所有文本都应清晰且包含真实信息,响应应尽可能完整但简洁。

该数据集包含多个记录,每个记录包括类别、指令、上下文和对指令的响应。项目的目标是修正这些指令、输入和响应,以确保它们具有最高质量,并且与它们所属的任务类别相匹配。所有文本都应清晰且包含真实信息,响应应尽可能完整但简洁。
提供机构:
argilla
原始信息汇总

数据集概述

数据集目标

该数据集包含一系列记录,每个记录包括一个类别、一个指令、一个上下文和一个对指令的响应。项目的目标是修正这些指令、输入和响应,确保它们的质量最高,并且与所属的任务类别相匹配。所有三个文本都应清晰并包含真实信息,响应应尽可能完整但简洁。

数据集字段

  • id: 类型为字符串
  • category: 类型为字符串
  • original-instruction: 类型为字符串
  • original-context: 类型为字符串
  • original-response: 类型为字符串

修正字段

  • new-instruction: 编写指令的最终版本,确保它与任务类别匹配。如果原始指令没问题,直接复制粘贴。
  • new-context: 编写上下文的最终版本,确保它与任务类别匹配。如果原始上下文没问题,直接复制粘贴。如果不需要上下文,留空。
  • new-response: 编写响应的最终版本,确保它与任务类别和提供的指令(及上下文)匹配。如果原始响应没问题,直接复制粘贴。

数据集使用

  • 使用Argilla加载数据集: python import argilla as rg ds = rg.FeedbackDataset.from_huggingface(argilla/databricks-dolly-15k-curated-en)

  • 使用Datasets加载数据集: python from datasets import load_dataset ds = load_dataset(argilla/databricks-dolly-15k-curated-en)

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作