five

DIBT/MPEP_SPANISH

收藏
Hugging Face2024-05-06 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/DIBT/MPEP_SPANISH
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过Argilla创建的,包含一个符合Argilla数据集格式的配置文件`argilla.yaml`,以及兼容HuggingFace `datasets`库的记录。数据集可以用于不同的NLP任务,具体取决于配置。数据集结构包括字段、问题、建议、元数据和指南。数据集的一个实例展示了如何在Argilla和HuggingFace `datasets`中加载数据。数据字段包括源文本、目标翻译文本、建议和元数据。数据集仅包含一个训练集分割。

该数据集是通过Argilla创建的,包含一个符合Argilla数据集格式的配置文件`argilla.yaml`,以及兼容HuggingFace `datasets`库的记录。数据集可以用于不同的NLP任务,具体取决于配置。数据集结构包括字段、问题、建议、元数据和指南。数据集的一个实例展示了如何在Argilla和HuggingFace `datasets`中加载数据。数据字段包括源文本、目标翻译文本、建议和元数据。数据集仅包含一个训练集分割。
提供机构:
DIBT
原始信息汇总

数据集概述

数据集基本信息

  • 名称: MPEP_SPANISH
  • 大小: 小于1000条记录
  • 标签: rlfh, argilla, human-feedback
  • 创建工具: Argilla

数据集内容

数据集配置

  • 配置文件: argilla.yaml,符合Argilla数据集格式。
  • 数据格式: 兼容HuggingFace datasets库。

数据加载

  • 使用Argilla加载: 通过pip install argilla --upgrade安装Argilla后,使用rg.FeedbackDataset.from_huggingface("DIBT/MPEP_SPANISH")加载数据。
  • 使用datasets库加载: 通过pip install datasets --upgrade安装datasets后,使用load_dataset("DIBT/MPEP_SPANISH")加载数据。

数据结构

  • 字段: 目前仅支持文本字段,如source字段。
  • 问题: 提供给标注者的问題,如target字段,类型为文本,描述为“Translate the text.”。
  • 建议: 与问题关联的建议,如target-suggestion,类型为文本。
  • 元数据: 提供额外信息,如metadata,类型为字典。
  • 外部ID: 提供外部ID,如external_id

数据实例

  • 示例: 包含external_id, fields, metadata, responses, suggestions, vectors等字段。

数据分割

  • 分割: 单一分割,即train

数据集使用

支持的任务

  • 任务: 根据配置可用于不同的NLP任务。
  • 无排行榜: 该数据集没有关联的排行榜。

语言

  • 信息待补充: 具体语言信息尚未提供。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作