five

MATINF

收藏
arXiv2020-05-23 更新2024-06-21 收录
下载链接:
https://github.com/WHUIR/MATINF
下载链接
链接失效反馈
官方服务:
资源简介:
MATINF是由武汉大学计算机科学与技术学院创建的大规模数据集,包含1.07百万个问题-答案对,用于分类、问答和摘要任务。该数据集从大型中文母婴护理问答网站爬取,用户可以在此网站上提问与母婴护理相关的问题,并由其他用户提供答案。MATINF适用于三大自然语言处理任务,包括分类、问答和摘要,旨在通过丰富的信息促进多任务学习方法的发展。

MATINF is a large-scale dataset developed by the School of Computer Science and Technology, Wuhan University. It comprises 1.07 million question-answer pairs tailored for classification, question answering and summarization tasks. This dataset was crawled from a large-scale Chinese maternal and infant care Q&A platform, where users can post questions related to maternal and infant care and obtain answers from other community users. MATINF supports three core natural language processing tasks including classification, question answering and summarization, aiming to facilitate the development of multi-task learning methods with its abundant information.
提供机构:
武汉大学计算机科学与技术学院
创建时间:
2020-04-26
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作