davanstrien/haiku-preferences-test
收藏Hugging Face2024-03-13 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/davanstrien/haiku-preferences-test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含一个配置文件`argilla.yaml`,用于在Argilla中配置数据集,并且数据集记录与HuggingFace的`datasets`库兼容。数据集的结构包括字段、问题、建议、元数据和指南。数据集的一个实例展示了如何在Argilla和HuggingFace `datasets`中表示数据。数据集的字段包括文本字段和问题字段,问题字段的类型为标签选择,允许的值为[Yes, No]。数据集还包含可选的元数据和外部ID字段。数据集的创建过程、注释过程、数据来源等信息尚未提供。
该数据集包含一个配置文件`argilla.yaml`,用于在Argilla中配置数据集,并且数据集记录与HuggingFace的`datasets`库兼容。数据集的结构包括字段、问题、建议、元数据和指南。数据集的一个实例展示了如何在Argilla和HuggingFace `datasets`中表示数据。数据集的字段包括文本字段和问题字段,问题字段的类型为标签选择,允许的值为[Yes, No]。数据集还包含可选的元数据和外部ID字段。数据集的创建过程、注释过程、数据来源等信息尚未提供。
提供机构:
davanstrien
原始信息汇总
数据集概述
数据集基本信息
- 名称: haiku-preferences-test
- 大小: 1K<n<10K
- 标签: rlfh, argilla, human-feedback
数据集内容
数据集配置
- 配置文件:
argilla.yaml,用于配置数据集。
数据集记录
- 格式: 兼容HuggingFace
datasets。 - 加载方式: 可通过
FeedbackDataset.from_huggingface方法或datasets库的load_dataset函数加载。
注释指南
- 问题: "Do you like this haiku?"
- 答案选项: [Yes, No]
数据集结构
数据字段
- 文本字段 (text): 类型为
text。 - 问题字段 (label): 类型为
label_selection,选项为[Yes, No]。 - 建议字段 (label-suggestion): 可选,类型为
label_selection,选项为[Yes, No]。 - 元数据字段 (metadata): 可选,提供额外信息。
- 外部ID字段 (external_id): 可选,用于外部资源链接。
数据实例
- Argilla格式: 包含文本、元数据、建议等字段。
- HuggingFace
datasets格式: 包含标签、建议、元数据等字段。
数据集使用
加载方式
- 使用Argilla: 通过
pip install argilla --upgrade安装后,使用rg.FeedbackDataset.from_huggingface方法加载。 - 使用
datasets库: 通过pip install datasets --upgrade安装后,使用load_dataset函数加载。
支持的任务
- 任务类型: 根据配置可用于不同的NLP任务。
数据集语言
- 语言信息: 待补充。
数据集创建
注释过程
- 注释指南: 提供简单的喜好评估指南。
数据集分割
- 分割类型: 仅包含
train分割。



