nataliaElv/test_spans_dataset
收藏Hugging Face2024-03-22 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/nataliaElv/test_spans_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过Argilla创建的,包含一个配置文件`argilla.yaml`和与HuggingFace `datasets`库兼容的记录。数据集的结构包括字段、问题、建议、元数据和注释指南。数据集可以用于不同的NLP任务,具体取决于配置。数据集的加载方式包括通过Argilla和`datasets`库加载。数据集的字段包括`prompt`、`input`和`input2`,问题类型包括`span`和`text`。数据集还包含建议和元数据字段,用于辅助注释过程。
该数据集是通过Argilla创建的,包含一个配置文件`argilla.yaml`和与HuggingFace `datasets`库兼容的记录。数据集的结构包括字段、问题、建议、元数据和注释指南。数据集可以用于不同的NLP任务,具体取决于配置。数据集的加载方式包括通过Argilla和`datasets`库加载。数据集的字段包括`prompt`、`input`和`input2`,问题类型包括`span`和`text`。数据集还包含建议和元数据字段,用于辅助注释过程。
提供机构:
nataliaElv
原始信息汇总
数据集概述
名称: test_spans_dataset
创建工具: Argilla
数据集大小: 小于1000条记录
标签:
- rlfh
- argilla
- human-feedback
数据集描述
- 配置文件: 包含一个名为
argilla.yaml的配置文件,符合Argilla数据集格式。 - 数据记录: 数据记录格式与HuggingFace
datasets兼容,可通过FeedbackDataset.from_huggingface方法自动加载。 - 注释指南: 如果已在Argilla中定义,将提供用于构建和整理数据集的注释指南。
加载方式
- 使用Argilla: 通过安装Argilla (
pip install argilla --upgrade) 并使用提供的Python代码加载数据集。 - 使用
datasets: 通过安装datasets(pip install datasets --upgrade) 并使用提供的Python代码加载数据集。
数据集结构
- 字段: 支持文本字段,如
prompt,input,input2。 - 问题: 包括多种类型的问题,如
prompt-ents,input-ents,info-extraction,final-response。 - 建议: 提供与问题关联的建议,如
prompt-ents-suggestion,input-ents-suggestion,info-extraction-suggestion,final-response-suggestion。 - 元数据: 可选,提供额外信息,如链接、作者、日期等。
- 外部ID: 可选,用于关联外部资源。
数据实例
数据实例包括外部ID、字段(如输入、提示)、元数据、响应、建议和向量。示例展示了如何在Argilla和HuggingFace datasets中表示数据。
数据字段
- 字段: 仅支持文本字段。
- 问题: 包括不同类型的问题,如
span和text。 - 建议: 与问题关联的建议,类型与问题相同。
- 元数据: 可选,提供额外信息。
- 外部ID: 可选,用于外部资源关联。
数据分割
数据集包含单一分割,即train。



