five

davanstrien/haiku-preferences-test

收藏
Hugging Face2024-03-13 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/davanstrien/haiku-preferences-test
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含一个配置文件`argilla.yaml`,用于在Argilla中配置数据集,并且数据集记录与HuggingFace的`datasets`库兼容。数据集的结构包括字段、问题、建议、元数据和指南。数据集的一个实例展示了如何在Argilla和HuggingFace `datasets`中表示数据。数据集的字段包括文本字段和问题字段,问题字段的类型为标签选择,允许的值为[Yes, No]。数据集还包含可选的元数据和外部ID字段。数据集的创建过程、注释过程、数据来源等信息尚未提供。

该数据集包含一个配置文件`argilla.yaml`,用于在Argilla中配置数据集,并且数据集记录与HuggingFace的`datasets`库兼容。数据集的结构包括字段、问题、建议、元数据和指南。数据集的一个实例展示了如何在Argilla和HuggingFace `datasets`中表示数据。数据集的字段包括文本字段和问题字段,问题字段的类型为标签选择,允许的值为[Yes, No]。数据集还包含可选的元数据和外部ID字段。数据集的创建过程、注释过程、数据来源等信息尚未提供。
提供机构:
davanstrien
原始信息汇总

数据集概述

数据集基本信息

  • 名称: haiku-preferences-test
  • 大小: 1K<n<10K
  • 标签: rlfh, argilla, human-feedback

数据集内容

数据集配置

  • 配置文件: argilla.yaml,用于配置数据集。

数据集记录

  • 格式: 兼容HuggingFace datasets
  • 加载方式: 可通过FeedbackDataset.from_huggingface方法或datasets库的load_dataset函数加载。

注释指南

  • 问题: "Do you like this haiku?"
  • 答案选项: [Yes, No]

数据集结构

数据字段

  • 文本字段 (text): 类型为text
  • 问题字段 (label): 类型为label_selection,选项为[Yes, No]。
  • 建议字段 (label-suggestion): 可选,类型为label_selection,选项为[Yes, No]。
  • 元数据字段 (metadata): 可选,提供额外信息。
  • 外部ID字段 (external_id): 可选,用于外部资源链接。

数据实例

  • Argilla格式: 包含文本、元数据、建议等字段。
  • HuggingFace datasets格式: 包含标签、建议、元数据等字段。

数据集使用

加载方式

  • 使用Argilla: 通过pip install argilla --upgrade安装后,使用rg.FeedbackDataset.from_huggingface方法加载。
  • 使用datasets库: 通过pip install datasets --upgrade安装后,使用load_dataset函数加载。

支持的任务

  • 任务类型: 根据配置可用于不同的NLP任务。

数据集语言

  • 语言信息: 待补充。

数据集创建

注释过程

  • 注释指南: 提供简单的喜好评估指南。

数据集分割

  • 分割类型: 仅包含train分割。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作