MATINF (Maternal and Infant Dataset)
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/MATINF
下载链接
链接失效反馈官方服务:
资源简介:
Maternal and Infant (MATINF) Dataset 是一个联合标注的大规模数据集,用于中文母婴护理领域的分类、问答和总结。数据集中的一个条目包括四个字段:问题(Q)、描述(D)、类别(C)和答案(A)。从中国大型母婴护理 QA 网站收集了近 200 万对问答对,其中包含细粒度的人工标记类。作者进行自动和手动数据清洗并删除:(1)样本不足的类; (2) 描述字段长度小于问题字段长度的条目; (3) 任何字段长度超过 256 个字符的数据; (4) 人为发现的格式错误的数据。数据清洗后,用剩余的 107 万个条目构建 MATINF
提供机构:
OpenDataLab
创建时间:
2022-08-16



