基于超链接构造的大规模机器阅读理解数据
收藏魔搭社区2026-01-08 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/modelscope/HyperlinkMRC
下载链接
链接失效反馈官方服务:
资源简介:
HyperlinkMRC数据提供了千万级别由超链接构造的英语/多语机器阅读理解数据,该数据用以预训练机器阅读理解模型
The HyperlinkMRC dataset provides tens of millions of English and multilingual machine reading comprehension (MRC) samples constructed via hyperlinks, and it is tailored for pre-training machine reading comprehension models.
提供机构:
maas
创建时间:
2023-07-04
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个基于网页超链接和锚文本构建的大规模多语言机器阅读理解数据集,旨在预训练MRC模型以更好地适应下游任务。它包含英文和多语言版本,覆盖24种语言,相关研究已发表于ACL 2023,可用于增强现有预训练模型在抽取式问答、命名实体识别等任务中的性能。
以上内容由遇见数据集搜集并总结生成



