NghiemAbe/argilla-private-test
收藏Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/NghiemAbe/argilla-private-test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含一个符合Argilla数据集格式的配置文件`argilla.yaml`,以及兼容HuggingFace `datasets`库的数据记录。这些记录可以通过`FeedbackDataset.from_huggingface`方法自动加载,也可以使用`datasets`库通过`load_dataset`独立加载。数据集结构包括字段、问题、建议、元数据、向量和注释指南。字段主要是文本类型,问题用于向注释者提问。该数据集适用于多种NLP任务,具体取决于其配置。
该数据集包含一个符合Argilla数据集格式的配置文件`argilla.yaml`,以及兼容HuggingFace `datasets`库的数据记录。这些记录可以通过`FeedbackDataset.from_huggingface`方法自动加载,也可以使用`datasets`库通过`load_dataset`独立加载。数据集结构包括字段、问题、建议、元数据、向量和注释指南。字段主要是文本类型,问题用于向注释者提问。该数据集适用于多种NLP任务,具体取决于其配置。
提供机构:
NghiemAbe
原始信息汇总
数据集概述
基本信息
- 名称: argilla-private-test
- 大小: 小于1000条记录
- 标签: rlfh, argilla, human-feedback
数据集内容
- 配置文件:
argilla.yaml,符合Argilla数据集格式。 - 数据记录: 兼容HuggingFace
datasets的格式。 - 标注指南: 若在Argilla中定义,将提供详细的标注指南。
加载方式
- 使用Argilla: 通过
pip install argilla --upgrade安装后,使用rg.FeedbackDataset.from_huggingface("NghiemAbe/argilla-private-test")加载数据集。 - 使用
datasets库: 通过pip install datasets --upgrade安装后,使用load_dataset("NghiemAbe/argilla-private-test")加载数据集。
数据集结构
- 字段: 目前仅支持文本字段,如
document_1,document_2等,用于提供问题答案。 - 问题: 包括评分、文本、标签选择等多种类型,如
rank,rank_text。 - 建议: 与问题关联,提供标注过程中的辅助信息。
- 元数据: 提供额外信息,如数据来源、作者等。
- 指南: 提供标注指导,详细内容需查看标注指南部分。
数据实例
- 数据实例包含多个字段,如
document_1至document_20,每个字段包含详细的文本信息。
支持任务
- 数据集结构支持多种NLP任务,具体任务取决于配置。
语言
- 语言信息待补充。
注意事项
- 数据集不包含任何关联的排行榜信息。



