five

Dataset of Type-Controllable Question Generation Model Based on Deep Learning and Knowledge Graph

收藏
科学数据银行2023-02-13 更新2026-04-23 收录
下载链接:
https://www.scidb.cn/detail?dataSetId=4247c5dd186a4598a53230313b361f5c
下载链接
链接失效反馈
官方服务:
资源简介:
在题型构建过程中采用4MAT问题标注方法对题型进行分类,针对不同类型的知识图谱设计不同的题集方案。1)收集CMeKG医学知识图谱相应问题,通过进一步人工检查和修改获得71095数据。2)收集知识图谱问题,通过进一步人工检查和修改获得100293数据。3)NLPCC-MH知识谱问题集合,NLPCC-MH自带14,609个问题对训练集和9870个问题对测试集。这些问题被收集为与NLPCC-MH知识图谱相对应的问题集。经过数据处理,专家们对数据进行梳理过滤,得到本文所需的数据集,即最终得到知识图谱问题数据集218680个,其中单跳数据集75398个,两跳数据集34410个,三跳数据集1088772个。在4MAT题型体系下,四个题类下也有子类型,以适应汉语表达的丰富性。该数据集收集了与子类相对应的问题,例如“谁”、“在哪里”、“何时”、“多大”、“多少”和“哪个”,形成一个涵盖子类的多层次和全面的数据集。
提供机构:
华侨大学; 王; 汪
创建时间:
2023-01-11
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作