five

ryota39/Aya_ja

收藏
Hugging Face2024-02-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ryota39/Aya_ja
下载链接
链接失效反馈
官方服务:
资源简介:
Aya_ja数据集是从CohereForAI/aya_dataset中提取的日语指令数据子集,包含6,259个人工标注的指令-响应对。该数据集适用于问题回答和文本生成任务,数据量在1K到10K之间,语言为日语。数据集中的每个条目包括输入问题、对应答案、语言、语言代码、标注类型和用户ID。

Aya_ja数据集是从CohereForAI/aya_dataset中提取的日语指令数据子集,包含6,259个人工标注的指令-响应对。该数据集适用于问题回答和文本生成任务,数据量在1K到10K之间,语言为日语。数据集中的每个条目包括输入问题、对应答案、语言、语言代码、标注类型和用户ID。
提供机构:
ryota39
原始信息汇总

数据集概述

数据集名称

  • Aya_ja

数据集来源

  • 该数据集是从CohereForAI/aya_dataset中提取的日语指令数据。

数据集内容

  • 包含6,259对人手标注的指令-响应对。

数据集结构

  • 每个数据点包含以下字段:
    • inputs: 问题或指令
    • targets: 对应的回答或响应
    • language: 数据语言(日语)
    • language_code: 语言代码(jpn)
    • annotation_type: 标注类型(original-annotations)
    • user_id: 用户ID

数据集规模

  • 数据量级:1K<n<10K

数据集语言

  • 日语(ja)

数据集任务类别

  • 问答
  • 文本生成

许可证

  • Apache-2.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作