five

Math Formula Question Answering Dataset (MFQuAD)

收藏
arXiv2023-04-17 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2304.08352v1
下载链接
链接失效反馈
官方服务:
资源简介:
MFQuAD是由IBM研究院欧洲分部创建的数据集,专注于数学标识符描述阅读任务。该数据集包含7508个标注的标识符出现,源自100篇维基百科文章,旨在通过提取或生成公式标识符的描述来理解文档内容。MFQuAD支持现代机器学习和自然语言处理技术,适用于数学信息检索、数学内容的无障碍访问、自动化特征工程和文档理解等领域。数据集的创建过程中,采用了保守的上下文选择策略,确保描述的完整性和准确性。
提供机构:
IBM研究院欧洲分部
创建时间:
2023-04-17
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作