斯坦福问答数据集
收藏魔搭社区2026-05-22 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/modelscope/squad
下载链接
链接失效反馈官方服务:
资源简介:
斯坦福问答回答数据集(SQuAD)是一个新的阅读理解数据集
# SQuAD 数据集卡片
本数据集为SQuAD数据集的问答对集合,更多详细信息可参阅[SQuAD](https://huggingface.co/datasets/rajpurkar/squad)。
本数据集可直接配合Sentence Transformers(句子Transformer)用于嵌入模型的训练。
## 数据集子集
### `pair` 子集
* 列名:"question"、"answer"
* 列类型:字符串(str)、字符串(str)
* 示例:
python
{
'question': '据称1858年在法国卢尔德,圣母玛利亚向何人显灵?',
'answer': '从建筑风格来看,该校具有天主教特色。主楼的金色穹顶顶端矗立着一尊金色的圣母玛利亚雕像。紧邻主楼前方、正对主楼的是一尊基督铜雕像,其双臂张开,配有铭文"Venite Ad Me Omnes"。主楼旁便是圣心圣殿。圣殿后方紧邻的是石窟(Grotto),这是一处供信徒祈祷冥想的玛利亚朝圣地。该石窟是仿照法国卢尔德的同名石窟复刻而成,1858年圣母玛利亚据称正是在此向圣伯纳德特·苏比鲁(Saint Bernadette Soubirous)显灵。在主车道的尽头(且与三座雕像和金色穹顶在一条直线上),是一尊简洁的现代风格石质玛利亚雕像。',
}
* 采集策略:从[embedding-training-data](https://huggingface.co/datasets/sentence-transformers/embedding-training-data)中读取SQuAD数据集。
* 去重:否
提供机构:
maas
创建时间:
2022-10-13
搜集汇总
数据集介绍

背景与挑战
背景概述
SQuAD(斯坦福问答数据集)是一个英语问答数据集,规模在1万到100万之间,适用于问答和对话场景。该数据集采用Apache 2.0许可证,由斯坦福大学发布。
以上内容由遇见数据集搜集并总结生成



