five

0x22almostEvil/multilingual-wikihow-qa-16k

收藏
Hugging Face2023-05-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/0x22almostEvil/multilingual-wikihow-qa-16k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含约16.8K条多语言WikiHow问答条目,每种语言大约有2-2.2K条目。数据集的主要用途是问答任务,支持多种语言包括英语、俄语、葡萄牙语、意大利语、西班牙语、法语、德语和荷兰语。每个条目包含指令(INSTRUCTION)、响应(RESPONSE)、来源(SOURCE)和元数据(METADATA)。WikiHow团队禁止将其数据用于机器学习目的,但法律咨询表明,如果项目具有研究目的,则可以使用该数据集。数据集的许可证为cc-by-nc-3.0。

该数据集包含约16.8K条多语言WikiHow问答条目,每种语言大约有2-2.2K条目。数据集的主要用途是问答任务,支持多种语言包括英语、俄语、葡萄牙语、意大利语、西班牙语、法语、德语和荷兰语。每个条目包含指令(INSTRUCTION)、响应(RESPONSE)、来源(SOURCE)和元数据(METADATA)。WikiHow团队禁止将其数据用于机器学习目的,但法律咨询表明,如果项目具有研究目的,则可以使用该数据集。数据集的许可证为cc-by-nc-3.0。
提供机构:
0x22almostEvil
原始信息汇总

数据集概述

数据集名称

multilingual-wikihow-qa-16k

许可信息

cc-by-nc-3.0

任务类别

question-answering

语言

  • en
  • ru
  • pt
  • it
  • es
  • fr
  • de
  • nl

数据集大小类别

10K<n<100K

标签

  • wikihow
  • QnA

数据集信息

特征

  • INSTRUCTION: string
  • RESPONSE: string
  • SOURCE: string
  • METADATA: string

数据分割

  • train
    • num_bytes: 144407512
    • num_examples: 16822

下载大小

76391535

数据集大小

144407512

数据集摘要

包含不同语言的WikiHow文章和指令的Parquet文件。每行数据包括:

  • INSTRUCTION
  • RESPONSE
  • SOURCE (*.wikihow.com)
  • METADATA (包含url和语言的json)

许可信息

数据来自WikiHow,内容许可信息位于: https://www.wikihow.com/wikiHow:Creative-Commons

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作