Swiss Leading Decision Summarization (SLDS)
收藏数据集卡片:Leading Decision Summarization
数据集描述
数据集摘要
该数据集包含瑞士主要决策的文本和摘要。
支持的任务和排行榜
语言
瑞士有四种官方语言,其中三种语言(德语、法语和意大利语)被代表。决策由法官和书记员在诉讼语言中书写。
| 语言 | 子集 | 文档数量 |
|---|---|---|
| 德语 | de | 12K |
| 法语 | fr | 5K |
| 意大利语 | it | 835 |
数据集结构
- decision_id: 决策的唯一标识符
- header: 决策的简短标题
- regeste: 主要决策的摘要
- text: 主要决策的正文
- law_area: 决策的法律领域
- law_sub_area: 决策的法律子领域
- language: 决策的语言
- year: 决策的年份
- court: 决策的法院
- chamber: 决策的法庭
- canton: 决策的州
- region: 决策的地区
数据字段
[更多信息需要]
数据实例
[更多信息需要]
数据分割
[更多信息需要]
数据集创建
数据收集和规范化
原始数据由瑞士联邦最高法院(https://www.bger.ch)发布,格式为未处理的HTML。文档从Entscheidsuche门户(https://entscheidsuche.ch)下载为HTML格式。
源语言生产者
决策由法官和书记员在诉讼语言中书写。
个人和敏感信息
数据集包含瑞士联邦最高法院的公开法庭决策。个人或敏感信息在发布前已由法院根据以下指南进行匿名化:https://www.bger.ch/home/juridiction/anonymisierungsregeln.html。
使用数据的注意事项
数据集的社会影响
[更多信息需要]
偏见的讨论
[更多信息需要]
其他已知限制
[更多信息需要]
附加信息
数据集策展人
[更多信息需要]
许可信息
数据在CC-BY-4.0下发布,符合法院许可(https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf) © Swiss Federal Supreme Court, 2002-2022
引用信息
请引用我们的ArXiv预印本:https://arxiv.org/abs/2306.09237
@misc{rasiah2023scale, title={SCALE: Scaling up the Complexity for Advanced Language Model Evaluation}, author={Vishvaksenan Rasiah and Ronja Stern and Veton Matoshi and Matthias Stürmer and Ilias Chalkidis and Daniel E. Ho and Joel Niklaus}, year={2023}, eprint={2306.09237}, archivePrefix={arXiv}, primaryClass={cs.CL} }
贡献
感谢Joel Niklaus添加此数据集。

- 1Unlocking Legal Knowledge: A Multilingual Dataset for Judicial Summarization in Switzerland伯尔尼大学、伯尔尼应用科学大学、斯坦福大学、弗里堡大学 · 2024年



