five

khalilayeb/khalil-argilla

收藏
Hugging Face2024-03-13 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/khalilayeb/khalil-argilla
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含一个符合Argilla数据集格式的配置文件`argilla.yaml`,以及兼容HuggingFace `datasets`库的记录。数据集记录包含文本字段、问题、建议、元数据、向量和指南等元素,主要用于情感分析任务。数据集可以通过Argilla或HuggingFace的`datasets`库加载。数据集的字段包括文本、情感标签等,问题类型包括标签选择等,建议用于辅助注释过程。数据集的创建背景、来源、注释者信息、社会影响等方面的详细信息缺失。

该数据集包含一个符合Argilla数据集格式的配置文件`argilla.yaml`,以及兼容HuggingFace `datasets`库的记录。数据集记录包含文本字段、问题、建议、元数据、向量和指南等元素,主要用于情感分析任务。数据集可以通过Argilla或HuggingFace的`datasets`库加载。数据集的字段包括文本、情感标签等,问题类型包括标签选择等,建议用于辅助注释过程。数据集的创建背景、来源、注释者信息、社会影响等方面的详细信息缺失。
提供机构:
khalilayeb
原始信息汇总

数据集概述

数据集基本信息

  • 大小分类: n<1K
  • 标签:
    • rlfh
    • argilla
    • human-feedback
  • 配置:
    • 配置名称: default
    • 数据文件:
      • 分割: train
      • 路径: data/train-*

数据集特征

  • 文本字段:
    • 名称: text
    • 数据类型: string
  • 标记字段:
    • 名称: tokens
    • 数据类型: sequence of string
  • 预测字段:
    • 名称: prediction
    • 数据类型:
      • end: int64
      • label: string
      • score: float64
      • start: int64
  • 预测代理字段:
    • 名称: prediction_agent
    • 数据类型: string
  • 注释字段:
    • 名称: annotation
    • 数据类型:
      • end: int64
      • label: string
      • start: int64
  • 注释代理字段:
    • 名称: annotation_agent
    • 数据类型: string
  • 向量字段:
    • 名称: vectors
    • 数据类型: null
  • ID字段:
    • 名称: id
    • 数据类型: string
  • 元数据字段:
    • 名称: metadata
    • 数据类型: null
  • 状态字段:
    • 名称: status
    • 数据类型: string
  • 事件时间戳字段:
    • 名称: event_timestamp
    • 数据类型: timestamp[us]
  • 指标字段:
    • 名称: metrics
    • 数据类型:
      • annotated:
        • mentions:
          • label: string
          • score: float64
          • value: string
      • predicted:
        • mentions:
          • label: string
          • score: float64
          • value: string
      • text_length: int64
      • tokens:
        • value: string

数据分割

  • 名称: train
  • 字节数: 7925
  • 示例数: 2

下载大小与数据集大小

  • 下载大小: 23242
  • 数据集大小: 7925

数据集结构

  • 字段:
    • 名称: text
    • 标题: Text
    • 类型: text
    • 必需: True
  • 问题:
    • 名称: sentiment
    • 标题: Sentiment
    • 类型: label_selection
    • 必需: True
    • 允许值: [positive, neutral, negative]

数据实例

  • Argilla格式: json { "external_id": null, "fields": { "text": "This is a positive text." }, "metadata": {}, "responses": [], "suggestions": [], "vectors": {} }

  • HuggingFace datasets格式: json { "external_id": null, "metadata": "{}", "sentiment": [], "sentiment-suggestion": null, "sentiment-suggestion-metadata": { "agent": null, "score": null, "type": null }, "text": "This is a positive text." }

数据分割

  • 名称: train
  • 字节数: 7925
  • 示例数: 2
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作