Stanford/web_questions
收藏数据集概述
数据集描述
数据集摘要
该数据集包含6,642个问题/答案对。问题可通过Freebase知识图谱回答,主要围绕单个命名实体,是网络上常见的问题。
支持的任务和排行榜
语言
数据集结构
数据实例
默认配置
- 下载数据集文件大小: 1.27 MB
- 生成数据集大小: 0.83 MB
- 总磁盘使用量: 2.10 MB
训练集示例: json { "answers": ["Jamaican Creole English Language", "Jamaican English"], "question": "what does jamaican people speak?", "url": "http://www.freebase.com/view/en/jamaica" }
数据字段
所有拆分中的数据字段相同。
默认配置
url: 字符串特征。question: 字符串特征。answers: 字符串列表特征。
数据拆分
| 名称 | 训练集 | 测试集 |
|---|---|---|
| 默认配置 | 3778 | 2032 |
数据集创建
策划理由
源数据
初始数据收集和规范化
源语言生产者
注释
注释过程
注释者
个人和敏感信息
使用数据的注意事项
数据集的社会影响
偏见的讨论
其他已知限制
附加信息
数据集策展人
许可信息
引用信息
bibtex @inproceedings{berant-etal-2013-semantic, title = "Semantic Parsing on {F}reebase from Question-Answer Pairs", author = "Berant, Jonathan and Chou, Andrew and Frostig, Roy and Liang, Percy", booktitle = "Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing", month = oct, year = "2013", address = "Seattle, Washington, USA", publisher = "Association for Computational Linguistics", url = "https://www.aclweb.org/anthology/D13-1160", pages = "1533--1544", }
贡献
感谢@thomwolf、@mariamabarham、@lewtun添加此数据集。




