five

大模型法律知识能力测试数据|法律知识评测数据集|大模型能力测试数据集

收藏
浙江省数据知识产权登记平台2025-03-11 更新2025-03-12 收录
法律知识评测
大模型能力测试
下载链接:
https://www.zjip.org.cn/home/announce/trends/116744
下载链接
链接失效反馈
资源简介:
通过严谨的设计与多层次的数据处理步骤,打造出了大模型法律知识理解能力测试数据集这一高质量且标准化的评估工具。此数据集广泛覆盖刑法、民法、合同法、知识产权法、国际法、行政法等众多法律领域,为大语言模型提供了全方位的法律知识评测素材,使其能够在解读法律条文、推理判例、剖析法律问题以及给出法律建议等方面展现出逻辑思维与实际能力,进而对大模型在法律语言理解、快速提炼法律要点以及推导法律结论等能力上进行精准测试,以满足法律咨询、合规审查、合同管理、案件解析等多种应用场景的需求。1. 数据采集渠道:我们从多个权威途径获取原始数据,如公开的法律案例资源库、学术论文里阐述的法律问题、在线法律学习平台所汇集的案例资料,同时融入人工精心创设的新颖法律问题,并为每条数据精确附上详细的来源出处说明。 2. 数据规范化流程:针对收集而来的各类法律问题实施标准化作业,具体涵盖统一问题呈现格式、将法律专业语言进行规范整理、使法律条文引用方式达到标准一致,同时消除具有歧义性的描述内容,力求每个问题的表达精准清晰,便于模型进行高效解读。 3. 关键信息精细标注:为每一个法律问题添加上详尽的标注信息,其中涉及问题的所属类别、预期达成的结论、所依据的法律条文、具有关键意义的判例参考、法律推理的具体步骤、标准正确答案以及可能出现的理解误区等。这些标注内容为模型在法律知识的理解与推理过程中构建起多层次的验证支撑体系。 问题衍生与拓展:以基础的法律问题集为蓝本,运用先进的数据改编技术手段生成一系列同类型但表达方式各异的问题变体,例如对问题的描述语句进行灵活变换、更替所涉及的法律条文、对问题条件进行适度扩展延伸等操作。 5. 测试指标体系构建:精心策划设计出用于衡量法律知识理解能力的多维度评估指标,具体涵盖问题理解的精准度、法律推理过程的准确程度、法律条文的实际应用能力、法律语言运用的规范程度,以及针对复杂法律问题所给出响应的质量水准等方面。 6. 模型效能评测与验证分析:运用本数据集对各类大模型展开全方位的综合评估,深入探究其在理解法律问题内涵、推导法律结论以及提供专业法律建议等方面所具备的实际能力表现。并且通过对不同大模型的评估结果进行横向对比分析,从而构建起对模型法律知识理解能力的全面且系统的评价架构。
提供机构:
杭州君同未来科技有限责任公司
创建时间:
2024-12-23
AI搜集汇总
数据集介绍
main_image_url
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

FSDD

FSDD(Free Spoken Digit Dataset)是一个开源的语音数据集,包含由不同说话者朗读的数字0到9的音频文件。该数据集旨在用于语音识别和机器学习算法的训练和测试。

github.com 收录

光伏电站发电量预估数据

1、准确预测一个地区分布式光伏场站的整体输出功率,可以提高电网的稳定性,增加电网消纳光电能量的能力,在降低能源消耗成本的同时促进低碳能源发展,实现动态供需状态预测的方法,为绿色电力源网荷储的应用落地提供支持。 2、准确预估光伏电站发电量,可以自动发现一些有故障的设备或者低效电站,提升发电效能。1、逆变器及电站数据采集,将逆变器中计算累计发电量数据,告警数据同步到Maxcompute大数据平台 2、天气数据采集, 通过API获取ERA5气象数据包括光照辐射、云量、温度、湿度等 3、数据特征构建, 在大数据处理平台进行数据预处理,用累计发电量矫正小时平均发电功率,剔除异常数据、归一化。告警次数等指标计算 4、异常数据处理, 天气、设备数据根据经纬度信息进行融合, 并对融合后的数据进行二次预处理操作,剔除辐照度和发电异常的一些数据 5、算法模型训练,基于XGBoost算法模型对历史数据进行训练, 生成训练集并保存至OSS 6、算法模型预测,基于XGBoost算法模型接入OSS训练集对增量数据进行预测, 并评估预测准确率等效果数据,其中误差率=(发电量-预估发电量)/发电量,当误差率低于一定阈值时,该数据预测为准确。预测准确率=预测准确数量/预测数据总量。

浙江省数据知识产权登记平台 收录

FROM-GLC全球30米地表覆盖数据集(2017)

该数据集中的数据获取自清华大学宫鹏团队。全球土地覆盖数据是了解人类活动与全球变化之间复杂互动关系的关键信息来源。FROM-GLC(更精细的全球土地覆盖观测和监测)是利用大地卫星专题成像仪(TM)和增强型专题成像仪(ETM+)数据制作的第一个30米分辨率的全球土地覆盖图。

国家对地观测科学数据中心 收录

ISIC 2019

ISIC 2019数据集包含25,331张皮肤病变图像,用于皮肤癌检测挑战。这些图像分为三个类别:良性、恶性黑色素瘤和基底细胞癌。数据集还包括每张图像的元数据,如病变类型、患者年龄和性别等。

challenge2019.isic-archive.com 收录