five

中文通用概念知识图谱(CN-Probase)|知识图谱数据集|中文处理数据集

收藏
中文开放知识图谱2024-03-11 收录
知识图谱
中文处理
下载链接:
http://data.openkg.cn/dataset/cnprobase
下载链接
链接失效反馈
资源简介:
CN-Probase是由复旦大学知识工场实验室研发并维护的大规模中文概念图谱,包含约1700万实体、27万概念和3300万isa关系。 isa关系的准确率在95%以上,是目前规模最大的开放领域中文概念图谱和概念分类体系。 相比较于其他概念图谱,CN-Probase具有两个显著优点: 一、规模巨大,基本涵盖常见实体;...
提供机构:
中文开放知识图谱
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

PROSLU

PROSLU数据集是由哈尔滨工业大学社会计算与信息检索研究中心和华为技术有限公司共同创建的,包含超过5000条中文语句,每条语句都配有详细的个人资料信息,如知识图谱、用户资料和上下文感知信息。数据集通过人工标注确保高质量,旨在解决在语义模糊的实际场景中,传统基于文本的口语理解模型可能无法准确识别意图和槽位的问题。该数据集的应用领域主要集中在提高对话系统在复杂环境下的理解和响应能力,特别是在用户意图不明确或语句具有多重含义的情况下。

arXiv 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录

Student Score Dataset

这是一个关于不同族裔学生成绩的数据集,涵盖了多个学科的成绩分析。

github 收录

LSUI (Large Scale Underwater Image Dataset)

We released a large-scale underwater image (LSUI) dataset including 5004 image pairs, which involve richer underwater scenes (lighting conditions, water types and target categories) and better visual quality reference images than the existing ones.

Papers with Code 收录

ISIC 2019

ISIC 2019数据集包含25,331张皮肤病变图像,用于皮肤癌检测挑战。这些图像分为三个类别:良性、恶性黑色素瘤和基底细胞癌。数据集还包括每张图像的元数据,如病变类型、患者年龄和性别等。

challenge2019.isic-archive.com 收录