案情判决训练数据集
收藏贵州省数据知识产权登记平台2026-05-06 更新2026-05-07 收录
下载链接:
https://gzdipp.gzsis.cn:12020/noticeDetail?id=2865&type=1
下载链接
链接失效反馈官方服务:
资源简介:
构建“案情—判决”微调数据集时,以去重后的单篇裁判文书为最小样本单元,先通过文本指纹、案号校验、版面噪声清洗、隐私脱敏和文书类型识别完成数据底座治理,再基于“事实描述—争议焦点—法律适用—裁判理由—判决结果”的司法逻辑链进行分层抽取,将案件事实、主体关系、时间地点、行为过程、证据要点、争议焦点、适用法条、裁判观点、判决主文、刑期/赔偿/责任承担等要素映射为统一字段,并按“输入案情、输出判决结论及理由”的指令模板生成约2000万条结构化微调样本,同时保留原文证据片段、字段来源位置和人工/规则校验结果,形成可训练、可追溯、可评测的监督学习数据。
提供机构:
贵州中汇科技发展有限公司
创建时间:
2026-05-01
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集由贵州中汇科技发展有限公司构建,规模达180GB,每年更新一次,专为智慧司法领域的AI模型训练设计。它基于裁判文书,按司法逻辑链将案情要素与判决结果映射为结构化微调样本,支持裁判预测、争议焦点识别等任务,助力法院智能辅助办案和法律文书分析。
以上内容由遇见数据集搜集并总结生成



