argilla/databricks-dolly-15k-curated-en
收藏Hugging Face2023-10-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/argilla/databricks-dolly-15k-curated-en
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个记录,每个记录包括类别、指令、上下文和对指令的响应。项目的目标是修正这些指令、输入和响应,以确保它们具有最高质量,并且与它们所属的任务类别相匹配。所有文本都应清晰且包含真实信息,响应应尽可能完整但简洁。
该数据集包含多个记录,每个记录包括类别、指令、上下文和对指令的响应。项目的目标是修正这些指令、输入和响应,以确保它们具有最高质量,并且与它们所属的任务类别相匹配。所有文本都应清晰且包含真实信息,响应应尽可能完整但简洁。
提供机构:
argilla
原始信息汇总
数据集概述
数据集目标
该数据集包含一系列记录,每个记录包括一个类别、一个指令、一个上下文和一个对指令的响应。项目的目标是修正这些指令、输入和响应,确保它们的质量最高,并且与所属的任务类别相匹配。所有三个文本都应清晰并包含真实信息,响应应尽可能完整但简洁。
数据集字段
id: 类型为字符串category: 类型为字符串original-instruction: 类型为字符串original-context: 类型为字符串original-response: 类型为字符串
修正字段
new-instruction: 编写指令的最终版本,确保它与任务类别匹配。如果原始指令没问题,直接复制粘贴。new-context: 编写上下文的最终版本,确保它与任务类别匹配。如果原始上下文没问题,直接复制粘贴。如果不需要上下文,留空。new-response: 编写响应的最终版本,确保它与任务类别和提供的指令(及上下文)匹配。如果原始响应没问题,直接复制粘贴。
数据集使用
-
使用Argilla加载数据集: python import argilla as rg ds = rg.FeedbackDataset.from_huggingface(argilla/databricks-dolly-15k-curated-en)
-
使用Datasets加载数据集: python from datasets import load_dataset ds = load_dataset(argilla/databricks-dolly-15k-curated-en)



