five

theblackcat102/alexa-qa

收藏
Hugging Face2023-02-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/theblackcat102/alexa-qa
下载链接
链接失效反馈
官方服务:
资源简介:
Alexa Answers数据集来源于alexaanswers.amazon.com,旨在通过社区的力量提升Alexa的知识库并回答用户提出的问题。该数据集包含了一些非常奇特和难以回答的问题及其答案。数据集总共有136039条数据,按照7:2:1的比例划分为训练集、测试集和验证集。数据集的分割方式与alexa-qa-with-rank数据集相同,确保训练集中的问题不会出现在验证集和测试集中。需要注意的是,不同分割之间可能存在类似但重新表述的问题。

Alexa Answers数据集来源于alexaanswers.amazon.com,旨在通过社区的力量提升Alexa的知识库并回答用户提出的问题。该数据集包含了一些非常奇特和难以回答的问题及其答案。数据集总共有136039条数据,按照7:2:1的比例划分为训练集、测试集和验证集。数据集的分割方式与alexa-qa-with-rank数据集相同,确保训练集中的问题不会出现在验证集和测试集中。需要注意的是,不同分割之间可能存在类似但重新表述的问题。
提供机构:
theblackcat102
原始信息汇总

Alexa Question Answering 数据集

概述

  • 许可证: MIT
  • 任务类别: 问答
  • 语言: 英语
  • 数据集名称: Alexa Question Answering dataset
  • 标签: alexa
  • 数据规模: 10K<n<100K

数据集描述

Alexa Answers 社区旨在提升 Alexa 的知识库,回答 Alexa 用户提出的问题。数据集中包含一些非常独特和困难的问题,例如:

  • Q: what percent of the population has black hair

  • A: 世界上最多见的头发颜色是黑色,广泛存在于不同的背景和族群中。大约75%到85%的全球人口拥有黑色或最深的棕色头发。

  • Q: what was the world population during world war two

  • A: 23亿

  • Q: what is nascar poem

  • A: Roses are red; Violets are blue; For Blaneys new ride; Switch the 1 and the 2.

数据集统计

  • 总数据量: 136,039
  • 分割比例: 训练集-测试集-验证集为7:2:1
  • 训练集: 95,227
  • 测试集: 27,208
  • 验证集: 13,604

注意:不同分割之间可能存在问题的相似重述。

最后更新

  • 日期: 19/02/2023
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作