ryota39/Aya_ja
收藏Hugging Face2024-02-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ryota39/Aya_ja
下载链接
链接失效反馈官方服务:
资源简介:
Aya_ja数据集是从CohereForAI/aya_dataset中提取的日语指令数据子集,包含6,259个人工标注的指令-响应对。该数据集适用于问题回答和文本生成任务,数据量在1K到10K之间,语言为日语。数据集中的每个条目包括输入问题、对应答案、语言、语言代码、标注类型和用户ID。
Aya_ja数据集是从CohereForAI/aya_dataset中提取的日语指令数据子集,包含6,259个人工标注的指令-响应对。该数据集适用于问题回答和文本生成任务,数据量在1K到10K之间,语言为日语。数据集中的每个条目包括输入问题、对应答案、语言、语言代码、标注类型和用户ID。
提供机构:
ryota39
原始信息汇总
数据集概述
数据集名称
- Aya_ja
数据集来源
- 该数据集是从
CohereForAI/aya_dataset中提取的日语指令数据。
数据集内容
- 包含6,259对人手标注的指令-响应对。
数据集结构
- 每个数据点包含以下字段:
- inputs: 问题或指令
- targets: 对应的回答或响应
- language: 数据语言(日语)
- language_code: 语言代码(jpn)
- annotation_type: 标注类型(original-annotations)
- user_id: 用户ID
数据集规模
- 数据量级:1K<n<10K
数据集语言
- 日语(ja)
数据集任务类别
- 问答
- 文本生成
许可证
- Apache-2.0



