AptusAI/chat-eur-lex
收藏Hugging Face2024-07-09 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/AptusAI/chat-eur-lex
下载链接
链接失效反馈官方服务:
资源简介:
Chat-EUR-Lex数据集包含从EUR-Lex获取的英语和意大利语法律文本,涵盖了2014年1月1日至2023年12月31日期间的法律文件。数据集特别包括了Celex 3中未随时间变化的历史文本,以及Celex 0中经过修订的最新合并版本。数据集不包括勘误表,并且排除了没有提供XML或HTML数据的EUR-Lex条目。数据集的结构包括文本、语言和CELEX编号三个字段。数据集的创建目的是为了提高欧盟法律的可访问性,使公司、律师、研究人员和公民更容易获取法律信息。
Chat-EUR-Lex数据集包含从EUR-Lex获取的英语和意大利语法律文本,涵盖了2014年1月1日至2023年12月31日期间的法律文件。数据集特别包括了Celex 3中未随时间变化的历史文本,以及Celex 0中经过修订的最新合并版本。数据集不包括勘误表,并且排除了没有提供XML或HTML数据的EUR-Lex条目。数据集的结构包括文本、语言和CELEX编号三个字段。数据集的创建目的是为了提高欧盟法律的可访问性,使公司、律师、研究人员和公民更容易获取法律信息。
提供机构:
AptusAI
原始信息汇总
数据集概述
数据集名称
Chat-EUR-Lex 数据集
数据集描述
Chat-EUR-Lex 数据集包含从2014年1月1日至2023年12月31日期间,从EUR-Lex获取的英语和意大利语的法律文件。该数据集包括所有未更改的历史文本(Celex 3)和最新整合版本(Celex 0),排除了修正案和无XML或HTML数据的条目。
数据集结构
数据字段
- text: 文档的完整内容(字符串类型)
- language: 文档文本的语言(字符串类型)
- celex: 文档的官方ID(字符串类型)
数据实例
| text | language | celex |
|---|---|---|
| 02018R0338 — IT — 21.08.2019 — 001.001 Il presente testo è un semplice strumento di documentazione e non produce alcun effetto giuridico... | ITA | 02018R0338-20190821 |
数据集大小
- 训练集:37226个实例,总大小为2170096432字节
- 下载大小:489777195字节
语言
- 英语
- 意大利语
许可信息
数据集根据Creative Commons Attribution 4.0 International (CC-BY-4.0)许可发布。
数据集创建
数据集由Aptus.AI和Institute of Legal Informatics and Judicial Systems (IGSG-CNR)创建,旨在提高欧盟法律的可访问性。
贡献者
- Aptus.AI
- Institute of Legal Informatics and Judicial Systems (IGSG-CNR)



