five

SimpleQuestions

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/SimpleQuestions
下载链接
链接失效反馈
官方服务:
资源简介:
SimpleQuestions 是用于简单 QA 的数据集,包括 人类用自然语言编写的总共 108,442 个问题 讲英语的注释器每个都与相应的事实配对, 格式化为(主题,关系,对象),提供答案 也是一个完整的解释。快速已从 知识库 Freebase (freebase.com)。我们随机打乱这些 问题并使用其中的 70\% (75910) 作为训练集,10\% 作为 验证集(10845),剩下的 20% 作为测试集。

SimpleQuestions is a dataset for simple question answering (QA), which contains a total of 108,442 questions written by humans in natural language. English-speaking annotators paired each question with its corresponding fact, which is formatted as (topic, relation, object) and accompanied by a complete explanatory answer. All these question-fact pairs were sourced from the knowledge base Freebase (freebase.com). We randomly shuffled these questions, and used 70% (75,910) of them as the training set, 10% (10,845) as the validation set, and the remaining 20% as the test set.
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
SimpleQuestions是一个用于简单问答任务的数据集,包含108,442个自然语言问题,每个问题都与Freebase知识库中的事实配对,格式为(主题,关系,对象),并提供答案和解释。该数据集由Facebook于2015年发布,主要用于训练和评估问答模型,已划分为训练集、验证集和测试集,适用于文本和多模态研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作