five

achinthani/argilla-test

收藏
Hugging Face2024-03-13 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/achinthani/argilla-test
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过Argilla工具创建的,主要用于自然语言处理任务。数据集包含一个配置文件`argilla.yaml`,用于在Argilla中配置数据集。数据集记录格式与HuggingFace的`datasets`库兼容,可以通过`FeedbackDataset.from_huggingface`方法加载。数据集结构包括字段、问题、建议、元数据和注释指南。字段主要是文本字段,问题包括情感分析和混合情感分析,建议是为注释者提供的辅助信息。数据集包含一个训练集分割。

该数据集是通过Argilla工具创建的,主要用于自然语言处理任务。数据集包含一个配置文件`argilla.yaml`,用于在Argilla中配置数据集。数据集记录格式与HuggingFace的`datasets`库兼容,可以通过`FeedbackDataset.from_huggingface`方法加载。数据集结构包括字段、问题、建议、元数据和注释指南。字段主要是文本字段,问题包括情感分析和混合情感分析,建议是为注释者提供的辅助信息。数据集包含一个训练集分割。
提供机构:
achinthani
原始信息汇总

数据集概述

数据集名称

  • 名称: argilla-test

数据集大小

  • 大小分类: n<1K

标签

  • 标签:
    • rlfh
    • argilla
    • human-feedback

数据集描述

  • 配置文件: 包含一个名为argilla.yaml的配置文件,符合Argilla数据集格式。
  • 数据记录: 数据记录格式兼容HuggingFace datasets,可通过FeedbackDataset.from_huggingface方法自动加载。
  • 标注指南: 提供标注指南,用于构建和整理数据集。

加载方式

  • 使用Argilla加载: python import argilla as rg ds = rg.FeedbackDataset.from_huggingface("achinthani/argilla-test")

  • 使用datasets加载: python from datasets import load_dataset ds = load_dataset("achinthani/argilla-test")

支持的任务

  • 任务: 数据集可用于多种NLP任务,具体取决于配置。

数据集结构

  • 数据在Argilla中的组成:
    • 字段: 目前仅支持文本字段。
    • 问题: 包括多种类型,如评分、文本、标签选择、多标签选择和排序。
    • 建议: 与现有问题关联,提供标注过程中的建议。
    • 元数据: 提供额外信息,如数据来源或作者信息。
    • 指南: 提供标注指导。

数据实例

  • 示例: 提供了一个JSON格式的数据实例,展示了字段、元数据、响应和建议的结构。

数据字段

  • 字段类型:
    • 文本字段: 仅支持文本类型。
    • 问题类型:
      • sentiment: 标签选择类型,允许值为[positive, neutral, negative]。
      • mixed-emotion: 多标签选择类型,允许值为[joy, anger, sadness, fear, surprise, love]。
    • 建议类型:
      • sentiment-suggestion: 标签选择类型,允许值同上。
      • mixed-emotion-suggestion: 多标签选择类型,允许值同上。
    • 元数据: 可选,提供额外信息。
    • external_id: 可选,提供外部ID。

数据分割

  • 分割: 数据集包含一个分割,即train
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作