基于超链接构造的大规模多语言机器阅读理解数据
收藏魔搭社区2025-11-04 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/seadamo/mHyperlinkMRC
下载链接
链接失效反馈官方服务:
资源简介:
mHyperlinkMRC通过多语言超链接信息构造多语言机器阅读理解数据,该数据可用于训练多语机器阅读理解模型。具体构造方法请参考以下两篇文章:[1] From Clozing to Comprehending: Retrofitting Pre-trained Masked Language Model to Pre-trained Machine Reader by Weiwen Xu, Xin Li, Wenxuan Zhang, Meng Zhou, Wai Lam, Luo Si, Lidong Bing. [2] mPMR: A Multilingual Pre-trained Machine Reader at Scale by Weiwen Xu, Xin Li, Wai Lam, Lidong Bing
mHyperlinkMRC依托多语言超链接信息构建多语言机器阅读理解(Multilingual Machine Reading Comprehension)数据集,该数据集可用于训练多语言机器阅读理解模型。其具体构建方法可参考以下两篇学术论文:
[1] 《From Clozing to Comprehending: 将预训练掩码语言模型(Pre-trained Masked Language Model)改造为预训练机器阅读器(Pre-trained Machine Reader)》,作者:Weiwen Xu、Xin Li、Wenxuan Zhang、Meng Zhou、Wai Lam、Luo Si、Lidong Bing
[2] 《mPMR:大规模多语言预训练机器阅读器(Pre-trained Machine Reader)》,作者:Weiwen Xu、Xin Li、Wai Lam、Lidong Bing
提供机构:
maas
创建时间:
2023-06-29
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集名为'基于超链接构造的大规模多语言机器阅读理解数据',采用MIT许可证,但内容尚未更新。用户需等待后续发布。
以上内容由遇见数据集搜集并总结生成



