khalilayeb/khalil-argilla
收藏Hugging Face2024-03-13 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/khalilayeb/khalil-argilla
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含一个符合Argilla数据集格式的配置文件`argilla.yaml`,以及兼容HuggingFace `datasets`库的记录。数据集记录包含文本字段、问题、建议、元数据、向量和指南等元素,主要用于情感分析任务。数据集可以通过Argilla或HuggingFace的`datasets`库加载。数据集的字段包括文本、情感标签等,问题类型包括标签选择等,建议用于辅助注释过程。数据集的创建背景、来源、注释者信息、社会影响等方面的详细信息缺失。
该数据集包含一个符合Argilla数据集格式的配置文件`argilla.yaml`,以及兼容HuggingFace `datasets`库的记录。数据集记录包含文本字段、问题、建议、元数据、向量和指南等元素,主要用于情感分析任务。数据集可以通过Argilla或HuggingFace的`datasets`库加载。数据集的字段包括文本、情感标签等,问题类型包括标签选择等,建议用于辅助注释过程。数据集的创建背景、来源、注释者信息、社会影响等方面的详细信息缺失。
提供机构:
khalilayeb
原始信息汇总
数据集概述
数据集基本信息
- 大小分类: n<1K
- 标签:
- rlfh
- argilla
- human-feedback
- 配置:
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
数据集特征
- 文本字段:
- 名称: text
- 数据类型: string
- 标记字段:
- 名称: tokens
- 数据类型: sequence of string
- 预测字段:
- 名称: prediction
- 数据类型:
- end: int64
- label: string
- score: float64
- start: int64
- 预测代理字段:
- 名称: prediction_agent
- 数据类型: string
- 注释字段:
- 名称: annotation
- 数据类型:
- end: int64
- label: string
- start: int64
- 注释代理字段:
- 名称: annotation_agent
- 数据类型: string
- 向量字段:
- 名称: vectors
- 数据类型: null
- ID字段:
- 名称: id
- 数据类型: string
- 元数据字段:
- 名称: metadata
- 数据类型: null
- 状态字段:
- 名称: status
- 数据类型: string
- 事件时间戳字段:
- 名称: event_timestamp
- 数据类型: timestamp[us]
- 指标字段:
- 名称: metrics
- 数据类型:
- annotated:
- mentions:
- label: string
- score: float64
- value: string
- mentions:
- predicted:
- mentions:
- label: string
- score: float64
- value: string
- mentions:
- text_length: int64
- tokens:
- value: string
- annotated:
数据分割
- 名称: train
- 字节数: 7925
- 示例数: 2
下载大小与数据集大小
- 下载大小: 23242
- 数据集大小: 7925
数据集结构
- 字段:
- 名称: text
- 标题: Text
- 类型: text
- 必需: True
- 问题:
- 名称: sentiment
- 标题: Sentiment
- 类型: label_selection
- 必需: True
- 允许值: [positive, neutral, negative]
数据实例
-
Argilla格式: json { "external_id": null, "fields": { "text": "This is a positive text." }, "metadata": {}, "responses": [], "suggestions": [], "vectors": {} }
-
HuggingFace
datasets格式: json { "external_id": null, "metadata": "{}", "sentiment": [], "sentiment-suggestion": null, "sentiment-suggestion-metadata": { "agent": null, "score": null, "type": null }, "text": "This is a positive text." }
数据分割
- 名称: train
- 字节数: 7925
- 示例数: 2



