0x22almostEvil/multilingual-wikihow-qa-16k
收藏Hugging Face2023-05-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/0x22almostEvil/multilingual-wikihow-qa-16k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含约16.8K条多语言WikiHow问答条目,每种语言大约有2-2.2K条目。数据集的主要用途是问答任务,支持多种语言包括英语、俄语、葡萄牙语、意大利语、西班牙语、法语、德语和荷兰语。每个条目包含指令(INSTRUCTION)、响应(RESPONSE)、来源(SOURCE)和元数据(METADATA)。WikiHow团队禁止将其数据用于机器学习目的,但法律咨询表明,如果项目具有研究目的,则可以使用该数据集。数据集的许可证为cc-by-nc-3.0。
该数据集包含约16.8K条多语言WikiHow问答条目,每种语言大约有2-2.2K条目。数据集的主要用途是问答任务,支持多种语言包括英语、俄语、葡萄牙语、意大利语、西班牙语、法语、德语和荷兰语。每个条目包含指令(INSTRUCTION)、响应(RESPONSE)、来源(SOURCE)和元数据(METADATA)。WikiHow团队禁止将其数据用于机器学习目的,但法律咨询表明,如果项目具有研究目的,则可以使用该数据集。数据集的许可证为cc-by-nc-3.0。
提供机构:
0x22almostEvil
原始信息汇总
数据集概述
数据集名称
multilingual-wikihow-qa-16k
许可信息
cc-by-nc-3.0
任务类别
question-answering
语言
- en
- ru
- pt
- it
- es
- fr
- de
- nl
数据集大小类别
10K<n<100K
标签
- wikihow
- QnA
数据集信息
特征
- INSTRUCTION: string
- RESPONSE: string
- SOURCE: string
- METADATA: string
数据分割
- train
- num_bytes: 144407512
- num_examples: 16822
下载大小
76391535
数据集大小
144407512
数据集摘要
包含不同语言的WikiHow文章和指令的Parquet文件。每行数据包括:
- INSTRUCTION
- RESPONSE
- SOURCE (*.wikihow.com)
- METADATA (包含url和语言的json)
许可信息
数据来自WikiHow,内容许可信息位于: https://www.wikihow.com/wikiHow:Creative-Commons



