司法案例知识图谱数据集
收藏贵州省数据知识产权登记平台2026-05-06 更新2026-05-07 收录
下载链接:
https://gzdipp.gzsis.cn:12020/noticeDetail?id=2867&type=1
下载链接
链接失效反馈官方服务:
资源简介:
以“去重后的单个案件”为基本单元,先对原始数据按 text 进行规范化去重(统一全半角、空白符、换行、无效噪声后计算文本指纹,保留同一案件唯一记录),再将每个案件对应的 14 个 qa_pair 按预设问题映射规则转换为固定结构化槽位,如案由/罪名、程序类型、裁判结果、争议焦点、适用法条、关键数额、核心说理、判决主文、是否终审等;对 answer 字段采用分层解析算法,兼容普通文本、JSON 字符串、数组、嵌套对象等多种格式,并进一步做实体标准化与值归一化,例如法条名称统一、金额转数值、布尔项转“是/否”、列表去重等;在此基础上生成“案件节点—要素节点—关系边”的图谱骨架,其中案件与案由、法条、焦点、金额、程序、结果等建立显式关系,同时依据案由一致、法条重合、焦点相近、程序相同、结果一致等规则计算案件间关联强度,补充“类案关联边”;所有节点与边均保留来源案件 ID、原始问题、原始答案及必要的原文证据片段,实现图谱数据的结构化、可扩展与可追溯。
提供机构:
贵州中汇科技发展有限公司
创建时间:
2026-05-01
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个规模为2GB、年更新的司法案例知识图谱数据集,以去重后的单个案件为基本单元,通过规范化处理、结构化槽位映射和关系计算,构建包含案件、案由、法条等要素节点及关联边的知识图谱。它适用于司法案例知识图谱构建、关联案件深度分析、类案推荐和法律知识问答等场景,旨在推动司法知识的结构化与可追溯应用。
以上内容由遇见数据集搜集并总结生成



