five

DIBT/MPEP_GERMAN

收藏
Hugging Face2024-05-07 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/DIBT/MPEP_GERMAN
下载链接
链接失效反馈
官方服务:
资源简介:
MPEP_GERMAN数据集是通过Argilla工具创建的,主要用于自然语言处理任务。数据集包含一个配置文件`argilla.yaml`,用于在Argilla中配置数据集,以及符合HuggingFace `datasets`格式的记录。数据集的结构包括字段、问题、建议、元数据和向量等。字段主要是文本类型,问题用于向标注者提问,建议则是为标注者提供的辅助信息。数据集可以用于多种NLP任务,具体取决于配置。数据集的语言信息未明确说明。

MPEP_GERMAN数据集是通过Argilla工具创建的,主要用于自然语言处理任务。数据集包含一个配置文件`argilla.yaml`,用于在Argilla中配置数据集,以及符合HuggingFace `datasets`格式的记录。数据集的结构包括字段、问题、建议、元数据和向量等。字段主要是文本类型,问题用于向标注者提问,建议则是为标注者提供的辅助信息。数据集可以用于多种NLP任务,具体取决于配置。数据集的语言信息未明确说明。
提供机构:
DIBT
原始信息汇总

数据集概述

数据集名称

  • 名称: MPEP_GERMAN

数据集大小

  • 大小类别: n<1K

数据集标签

  • 标签:
    • rlfh
    • argilla
    • human-feedback

数据集描述

  • 配置文件: 包含一个名为argilla.yaml的配置文件,符合Argilla数据集格式。
  • 数据记录: 数据记录格式与HuggingFace datasets兼容,可通过FeedbackDataset.from_huggingfacedatasets库的load_dataset方法加载。
  • 注释指南: 如果已在Argilla中定义,将包含注释指南。

数据集加载

  • 使用Argilla加载: python import argilla as rg ds = rg.FeedbackDataset.from_huggingface("DIBT/MPEP_GERMAN")

  • 使用datasets加载: python from datasets import load_dataset ds = load_dataset("DIBT/MPEP_GERMAN")

数据集结构

  • 字段: 目前仅支持文本字段,用于提供对问题的响应。
    • source (文本类型)
  • 问题: 向标注者提出的问题,类型包括评分、文本、标签选择等。
    • target (文本类型),描述为“检查翻译并根据需要进行调整。更多说明见注释指南。”
  • 建议: 提供给标注者的建议,与现有问题关联。
    • target-suggestion (文本类型)
  • 元数据: 提供关于数据集记录的额外信息,如来源、作者、日期等。
  • 外部ID: 提供数据集记录的外部ID,用于链接外部资源。

数据集使用

  • 支持任务: 可用于不同的NLP任务,具体取决于配置。
  • 语言: 信息待补充。

数据集创建

  • 注释指南: 包含详细的翻译和调整指南。
  • 数据分割: 包含单一分割,即train
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作