five

DIBT-Bengali/Bengali-Prompt-Evaluation-Data

收藏
Hugging Face2024-04-14 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/DIBT-Bengali/Bengali-Prompt-Evaluation-Data
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含一个配置文件`argilla.yaml`和与HuggingFace `datasets`库兼容的记录,主要用于NLP任务,特别是文本翻译任务。数据集的字段包括文本字段、问题、建议、元数据等。数据集的结构和内容在README中有详细描述,但关于数据集的创建、注释过程、来源等信息尚未提供。

该数据集包含一个配置文件`argilla.yaml`和与HuggingFace `datasets`库兼容的记录,主要用于NLP任务,特别是文本翻译任务。数据集的字段包括文本字段、问题、建议、元数据等。数据集的结构和内容在README中有详细描述,但关于数据集的创建、注释过程、来源等信息尚未提供。
提供机构:
DIBT-Bengali
原始信息汇总

数据集概述

数据集基本信息

  • 数据集名称: Bengali-Prompt-Evaluation-Data
  • 数据集大小: n<1K
  • 标签:
    • rlfh
    • argilla
    • human-feedback

数据集描述

数据集概要

  • 配置文件: 包含一个名为argilla.yaml的配置文件,符合Argilla数据集格式。
  • 数据记录: 数据记录格式与HuggingFace datasets兼容。
  • 标注指南: 包含用于构建和整理数据的标注指南。

加载方式

  • 使用Argilla加载: python import argilla as rg ds = rg.FeedbackDataset.from_huggingface("DIBT-Bengali/Bengali-Prompt-Evaluation-Data")

  • 使用datasets加载: python from datasets import load_dataset ds = load_dataset("DIBT-Bengali/Bengali-Prompt-Evaluation-Data")

支持的任务和排行榜

  • 任务: 支持多种NLP任务,具体取决于配置。
  • 排行榜: 无。

语言

  • 信息: 待补充。

数据集结构

数据在Argilla中

  • 字段: 当前仅支持文本字段。
    • source (文本类型)
  • 问题: 用于向标注者提问,类型包括评分、文本、标签选择、多标签选择和排名。
    • target (文本类型,描述为“Translate the text.”)
  • 建议: 提供给标注者的建议,与现有问题关联。
    • target-suggestion (文本类型)
  • 元数据: 提供关于数据集记录的额外信息。
  • 外部ID: 提供数据集记录的外部ID。

数据实例

  • 示例: 包含外部ID、字段、元数据、响应、建议和向量。

数据字段

  • 字段:
    • source (文本类型)
  • 问题:
    • target (文本类型,描述为“Translate the text.”)
  • 建议:
    • target-suggestion (文本类型)
  • 元数据: 可选,提供额外信息。
  • 外部ID: 可选,用于链接外部资源。

数据分割

  • 分割: 仅包含train分割。

数据集创建

标注指南

  • 指南: 翻译文本字段中的文本。

注释

  • 注释过程: 待补充。
  • 注释者: 待补充。

个人和敏感信息

  • 信息: 待补充。
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作