SimpleQuestions
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/SimpleQuestions
下载链接
链接失效反馈官方服务:
资源简介:
SimpleQuestions 是用于简单 QA 的数据集,包括
人类用自然语言编写的总共 108,442 个问题
讲英语的注释器每个都与相应的事实配对,
格式化为(主题,关系,对象),提供答案
也是一个完整的解释。快速已从
知识库 Freebase (freebase.com)。我们随机打乱这些
问题并使用其中的 70\% (75910) 作为训练集,10\% 作为
验证集(10845),剩下的 20% 作为测试集。
SimpleQuestions is a dataset for simple question answering (QA), which contains a total of 108,442 questions written by humans in natural language. English-speaking annotators paired each question with its corresponding fact, which is formatted as (topic, relation, object) and accompanied by a complete explanatory answer. All these question-fact pairs were sourced from the knowledge base Freebase (freebase.com). We randomly shuffled these questions, and used 70% (75,910) of them as the training set, 10% (10,845) as the validation set, and the remaining 20% as the test set.
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍

背景与挑战
背景概述
SimpleQuestions是一个用于简单问答任务的数据集,包含108,442个自然语言问题,每个问题都与Freebase知识库中的事实配对,格式为(主题,关系,对象),并提供答案和解释。该数据集由Facebook于2015年发布,主要用于训练和评估问答模型,已划分为训练集、验证集和测试集,适用于文本和多模态研究。
以上内容由遇见数据集搜集并总结生成



