Math Formula Question Answering Dataset (MFQuAD)
收藏arXiv2023-04-17 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2304.08352v1
下载链接
链接失效反馈官方服务:
资源简介:
MFQuAD是由IBM研究院欧洲分部创建的数据集,专注于数学标识符描述阅读任务。该数据集包含7508个标注的标识符出现,源自100篇维基百科文章,旨在通过提取或生成公式标识符的描述来理解文档内容。MFQuAD支持现代机器学习和自然语言处理技术,适用于数学信息检索、数学内容的无障碍访问、自动化特征工程和文档理解等领域。数据集的创建过程中,采用了保守的上下文选择策略,确保描述的完整性和准确性。
提供机构:
IBM研究院欧洲分部
创建时间:
2023-04-17



