five

SQAC

收藏
huggingface.co2025-03-25 收录
下载链接:
https://huggingface.co/datasets/PlanTL-GOB-ES/SQAC
下载链接
链接失效反馈
官方服务:
资源简介:
This dataset contains 6,247 contexts and 18,817 questions with their answers, 1 to 5 for each fragment. The sources of the contexts are: * Encyclopedic articles from [Wikipedia in Spanish](https://es.wikipedia.org/), used under [CC-by-sa licence](https://creativecommons.org/licenses/by-sa/3.0/legalcode). * News from [Wikinews in Spanish](https://es.wikinews.org/), used under [CC-by licence](https://creativecommons.org/licenses/by/2.5/). * Text from the Spanish corpus [AnCora](http://clic.ub.edu/corpus/en), which is a mix from diferent newswire and literature sources, used under [CC-by licence] (https://creativecommons.org/licenses/by/4.0/legalcode). This dataset can be used to build extractive-QA.

本数据集包含6,247个上下文和18,817个问题及其答案,每个片段包含1至5个答案。上下文的来源包括:来自[西班牙语维基百科](https://es.wikipedia.org/)的百科文章,在[CC-by-sa许可协议](https://creativecommons.org/licenses/by-sa/3.0/legalcode)下使用;来自[西班牙语维基新闻](https://es.wikinews.org/)的新闻报道,在[CC-by许可协议](https://creativecommons.org/licenses/by/2.5/)下使用;以及来自西班牙语语料库[AnCora](http://clic.ub.edu/corpus/en),该语料库汇集了不同新闻通讯和文学来源的文本,在[CC-by许可协议](https://creativecommons.org/licenses/by/4.0/legalcode)下使用。此数据集可用于构建提取式问答系统。
提供机构:
huggingface.co
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作