nor-casehold
收藏Hugging Face2026-03-23 更新2026-03-24 收录
下载链接:
https://huggingface.co/datasets/bendik-eeg-henriksen/nor-casehold
下载链接
链接失效反馈官方服务:
资源简介:
Nor-CaseHOLD 是一个用于挪威法律人工智能的提取式法律检索基准数据集,包含 1,244 份挪威法律文件,其中 627 份来自最高法院(Høyesterett)的判决,617 份来自 Skatteetaten 的 bindende forhåndsuttalelser (BFU),每份文件均配有官方摘要。该数据集旨在提供一个开放源代码的挪威法律文本检索基准,任务是给定一份完整的法律文件,选择与官方摘要最匹配的 5 个句子,并使用 ROUGE-1、ROUGE-2 和 ROUGE-L 进行评分。数据集分为训练集(869 份)、验证集(142 份)和测试集(233 份),并按来源进行了分层以保证平衡。基准测试结果显示,不同方法(如 TF-IDF、BM25、Norwegian Legal BERT 等)在 ROUGE-1 指标上的表现差异显著。数据集的使用示例和加载方式也在 README 中提供。
创建时间:
2026-03-14



