nataliaElv/test_spans_dataset

Name: nataliaElv/test_spans_dataset
Creator: nataliaElv
Published: 2024-03-22 15:42:22
License: 暂无描述

Hugging Face2024-03-22 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/nataliaElv/test_spans_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是通过Argilla创建的，包含一个配置文件`argilla.yaml`和与HuggingFace `datasets`库兼容的记录。数据集的结构包括字段、问题、建议、元数据和注释指南。数据集可以用于不同的NLP任务，具体取决于配置。数据集的加载方式包括通过Argilla和`datasets`库加载。数据集的字段包括`prompt`、`input`和`input2`，问题类型包括`span`和`text`。数据集还包含建议和元数据字段，用于辅助注释过程。

提供机构：

nataliaElv

原始信息汇总

数据集概述

名称: test_spans_dataset

创建工具: Argilla

数据集大小: 小于1000条记录

标签:

rlfh
argilla
human-feedback

数据集描述

配置文件: 包含一个名为argilla.yaml的配置文件，符合Argilla数据集格式。
数据记录: 数据记录格式与HuggingFace datasets兼容，可通过FeedbackDataset.from_huggingface方法自动加载。
注释指南: 如果已在Argilla中定义，将提供用于构建和整理数据集的注释指南。

加载方式

使用Argilla: 通过安装Argilla (pip install argilla --upgrade) 并使用提供的Python代码加载数据集。
使用datasets: 通过安装datasets (pip install datasets --upgrade) 并使用提供的Python代码加载数据集。

数据集结构

字段: 支持文本字段，如prompt, input, input2。
问题: 包括多种类型的问题，如prompt-ents, input-ents, info-extraction, final-response。
建议: 提供与问题关联的建议，如prompt-ents-suggestion, input-ents-suggestion, info-extraction-suggestion, final-response-suggestion。
元数据: 可选，提供额外信息，如链接、作者、日期等。
外部ID: 可选，用于关联外部资源。

数据实例

数据实例包括外部ID、字段（如输入、提示）、元数据、响应、建议和向量。示例展示了如何在Argilla和HuggingFace datasets中表示数据。

数据字段

字段: 仅支持文本字段。
问题: 包括不同类型的问题，如span和text。
建议: 与问题关联的建议，类型与问题相同。
元数据: 可选，提供额外信息。
外部ID: 可选，用于外部资源关联。

数据分割

数据集包含单一分割，即train。

5,000+

优质数据集

54 个

任务类型

进入经典数据集