UIT-ViWikiQA
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/UIT-ViWikiQA
下载链接
链接失效反馈官方服务:
资源简介:
越南语处理的总体发展,尤其是机器阅读理解,引起了研究界的极大关注。近年来,有一些大型越南语的机器阅读理解任务的数据集,例如UIT-vipad和UIT-ViNewsQA。但是,数据集的答案并不多样化,无法为研究服务。在本文中,我们介绍了UIT-ViWikiQA,这是第一个用于评估越南语中基于句子提取的机器阅读理解的数据集。UIT-ViWikiQA数据集是从UIT-vipquad数据集转换而来的,包括基于维基百科174越南文章的5.109段落的23.074个问题答案。我们提出了一种转换算法来创建基于句子提取的机器阅读理解数据集,以及越南语基于句子提取的机器阅读理解的三种方法。我们的实验表明,最好的机器模型是xlm-r$ _ Large,它在我们的数据集上实现了85.97% 的精确匹配 (EM) 得分和88.77% 的F1-score。此外,我们根据越南语的问题类型和上下文对MRC模型性能的影响来分析实验结果,从而显示了我们向自然语言处理社区提出的UIT-ViWikiQA数据集的挑战。
提供机构:
OpenDataLab
创建时间:
2022-06-23



