five

LeKUBE

收藏
arXiv2024-07-19 更新2024-07-23 收录
下载链接:
https://anonymous.4open.science/r/LeKUBE-2808/
下载链接
链接失效反馈
官方服务:
资源简介:
LeKUBE数据集由清华大学法律专业人士和法学院的注释者共同创建,专注于中国法律领域的知识更新评估。该数据集包含中国刑法和民法的合成更新以及相关问题,旨在评估法律LLMs在知识更新方面的性能。数据集的创建过程结合了法律专业知识和技术注释,确保了数据的质量和实用性。LeKUBE数据集主要应用于法律领域的知识更新研究,旨在解决法律LLMs在动态法律环境中的知识更新效率和准确性问题。

The LeKUBE dataset was co-created by legal professionals and law annotators from Tsinghua University, focusing on knowledge update evaluation in the Chinese legal domain. This dataset contains synthetic updates and related questions regarding China's Criminal Law and Civil Law, aiming to evaluate the performance of legal LLMs in terms of knowledge update. The dataset construction process integrates legal professional knowledge and technical annotation, ensuring the quality and practicality of the data. The LeKUBE dataset is primarily applied to knowledge update research in the legal domain, aiming to address the issues of knowledge update efficiency and accuracy of legal LLMs in dynamic legal environments.
提供机构:
清华大学
创建时间:
2024-07-19
搜集汇总
数据集介绍
main_image_url
构建方式
LeKUBE数据集的构建方式独具匠心,通过与法律专业人士的紧密合作,将法律领域的知识更新需求细分为五个维度。随后,聘请法学院的注释者创建了中国刑法和民法典的合成更新,并生成了一系列问题,这些问题在更新后答案会发生变化。这一过程确保了数据集的多样性和法律准确性,为评估法律大语言模型(LLMs)的知识更新方法提供了全面的基础。
特点
LeKUBE数据集的显著特点在于其高度专业化和针对性。该数据集不仅涵盖了中国刑法和民法典的广泛内容,还通过合成更新和相关问题的创建,模拟了法律知识动态变化的复杂性。此外,数据集的五个评估维度确保了知识更新方法在法律领域的全面评估,填补了现有通用领域基准的空白。
使用方法
LeKUBE数据集的使用方法多样且灵活,适用于评估和优化法律大语言模型的知识更新能力。研究者可以通过该数据集对不同知识更新方法进行系统性评估,包括非参数策略和参数策略。具体任务包括法律条文的背诵、条文项目的回忆、真假问题的判断以及法律场景的多选题回答。这些任务不仅测试模型的知识更新准确性,还评估其在实际法律应用中的泛化能力和推理能力。
背景与挑战
背景概述
近年来,大型语言模型(LLMs)在多个领域,包括法律智能研究中,展现了显著的应用潜力。由清华大学计算机科学与技术系和法学院的研究人员共同开发的LeKUBE数据集,专注于法律知识更新,旨在评估法律领域中LLMs的知识更新方法。该数据集由Changyue Wang、Weihang Su、Yiran Hu等研究人员于2024年创建,通过结合法律专业人士的意见,对中国的刑法和民法进行了合成更新,并设计了相应的评估任务。LeKUBE的推出填补了现有通用领域知识更新基准在法律领域应用的空白,强调了法律领域知识更新的独特需求和复杂性。
当前挑战
LeKUBE数据集面临的挑战主要源于法律知识的动态性和复杂性。首先,法律知识的更新需要高度的准确性和精细的应用,这与通用领域的知识更新有显著差异。其次,法律文本的复杂性和长度对LLMs的更新方法提出了更高的要求,尤其是在涉及长篇法律条文的改写时。此外,法律知识更新对法律推理的影响深远,现有的通用领域基准难以捕捉到这种深层次的影响。这些挑战凸显了开发专门针对法律领域知识更新机制的必要性。
常用场景
经典使用场景
LeKUBE 数据集的经典使用场景主要集中在法律领域的大型语言模型(LLMs)的知识更新评估。通过模拟中国刑法和民法典的更新,LeKUBE 提供了一系列合成更新和相关问题,用于评估知识更新方法在法律领域的有效性和精确性。这些任务包括法律条文的准确复述、条文项目的回忆、以及更新前后法律条文变化的判断,从而全面评估LLMs在法律知识更新中的表现。
解决学术问题
LeKUBE 数据集解决了法律领域中大型语言模型知识更新的关键学术问题。传统的知识更新方法在开放领域表现良好,但在法律领域由于法律条文的复杂性和长篇性,以及法律推理的独特性,这些方法往往难以胜任。LeKUBE 通过专门设计的五维度评估体系,揭示了现有知识更新方法在法律领域的不足,强调了开发适用于法律LLMs的知识更新机制的必要性。
衍生相关工作
LeKUBE 数据集的推出催生了多项相关研究工作,特别是在法律领域的知识更新和评估方法上。例如,基于LeKUBE的研究揭示了非参数策略(如RAG)和参数策略(如模型微调和编辑)在法律知识更新中的不同表现和挑战。此外,LeKUBE 还促进了针对法律领域特定需求的进一步研究和开发,推动了法律智能领域的技术进步和应用深化。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作