概念挖掘数据集
收藏国家基础学科公共科学数据中心2024-03-05 收录
下载链接:
https://www.nbsdc.cn/general/dataDetail?id=64edc835bb16e07753c3518f&type=1
下载链接
链接失效反馈官方服务:
资源简介:
概念挖掘数据集面向课题一“自动化知识发现与图谱构建”的概念自动挖掘技术研究,并提供验证数据集。数据集包含780个抽样实体,5670个概念组成的测试集。实体采集于通用领域的常见实体,且覆盖军事、社交、新闻、医学等多个领域,实体对应的概念先由机器自动生成,然后由人工评价,只保留真实的概念,对于无法确定的概念,由多名标注人员背靠背打分,最终根据投票确定。
提供机构:
哈尔滨工业大学
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集旨在支持概念自动挖掘技术研究,包含由780个抽样实体和5670个概念构成的测试集。实体来源于通用领域并涵盖军事、社交等多个领域,其概念通过机器生成与人工评价相结合的方式验证。
以上内容由遇见数据集搜集并总结生成



