five

AptusAI/chat-eur-lex

收藏
Hugging Face2024-07-09 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/AptusAI/chat-eur-lex
下载链接
链接失效反馈
官方服务:
资源简介:
Chat-EUR-Lex数据集包含从EUR-Lex获取的英语和意大利语法律文本,涵盖了2014年1月1日至2023年12月31日期间的法律文件。数据集特别包括了Celex 3中未随时间变化的历史文本,以及Celex 0中经过修订的最新合并版本。数据集不包括勘误表,并且排除了没有提供XML或HTML数据的EUR-Lex条目。数据集的结构包括文本、语言和CELEX编号三个字段。数据集的创建目的是为了提高欧盟法律的可访问性,使公司、律师、研究人员和公民更容易获取法律信息。

Chat-EUR-Lex数据集包含从EUR-Lex获取的英语和意大利语法律文本,涵盖了2014年1月1日至2023年12月31日期间的法律文件。数据集特别包括了Celex 3中未随时间变化的历史文本,以及Celex 0中经过修订的最新合并版本。数据集不包括勘误表,并且排除了没有提供XML或HTML数据的EUR-Lex条目。数据集的结构包括文本、语言和CELEX编号三个字段。数据集的创建目的是为了提高欧盟法律的可访问性,使公司、律师、研究人员和公民更容易获取法律信息。
提供机构:
AptusAI
原始信息汇总

数据集概述

数据集名称

Chat-EUR-Lex 数据集

数据集描述

Chat-EUR-Lex 数据集包含从2014年1月1日至2023年12月31日期间,从EUR-Lex获取的英语和意大利语的法律文件。该数据集包括所有未更改的历史文本(Celex 3)和最新整合版本(Celex 0),排除了修正案和无XML或HTML数据的条目。

数据集结构

数据字段
  • text: 文档的完整内容(字符串类型)
  • language: 文档文本的语言(字符串类型)
  • celex: 文档的官方ID(字符串类型)
数据实例
text language celex
02018R0338 — IT — 21.08.2019 — 001.001 Il presente testo è un semplice strumento di documentazione e non produce alcun effetto giuridico... ITA 02018R0338-20190821

数据集大小

  • 训练集:37226个实例,总大小为2170096432字节
  • 下载大小:489777195字节

语言

  • 英语
  • 意大利语

许可信息

数据集根据Creative Commons Attribution 4.0 International (CC-BY-4.0)许可发布。

数据集创建

数据集由Aptus.AI和Institute of Legal Informatics and Judicial Systems (IGSG-CNR)创建,旨在提高欧盟法律的可访问性。

贡献者

  • Aptus.AI
  • Institute of Legal Informatics and Judicial Systems (IGSG-CNR)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作