code-pensions-civiles-militaires-retraite
收藏魔搭社区2025-12-05 更新2025-12-06 收录
下载链接:
https://modelscope.cn/datasets/louisbrulenaudet/code-pensions-civiles-militaires-retraite
下载链接
链接失效反馈官方服务:
资源简介:
# Code des pensions civiles et militaires de retraite, non-instruct (2025-03-10)
The objective of this project is to provide researchers, professionals and law students with simplified, up-to-date access to all French legal texts, enriched with a wealth of data to facilitate their integration into Community and European projects.
Normally, the data is refreshed daily on all legal codes, and aims to simplify the production of training sets and labeling pipelines for the development of free, open-source language models based on open data accessible to all.
## Concurrent reading of the LegalKit
[<img src="https://raw.githubusercontent.com/louisbrulenaudet/ragoon/main/assets/badge.svg" alt="Built with RAGoon" width="200" height="32"/>](https://github.com/louisbrulenaudet/ragoon)
To use all the legal data published on LegalKit, you can use RAGoon:
```bash
pip3 install ragoon
```
Then, you can load multiple datasets using this code snippet:
```python
# -*- coding: utf-8 -*-
from ragoon import load_datasets
req = [
"louisbrulenaudet/code-artisanat",
"louisbrulenaudet/code-action-sociale-familles",
# ...
]
datasets_list = load_datasets(
req=req,
streaming=False
)
dataset = datasets.concatenate_datasets(
datasets_list
)
```
### Data Structure for Article Information
This section provides a detailed overview of the elements contained within the `item` dictionary. Each key represents a specific attribute of the legal article, with its associated value providing detailed information.
1. **Basic Information**
- `ref` (string): **Reference** - A reference to the article, combining the title_main and the article `number` (e.g., "Code Général des Impôts, art. 123").
- `texte` (string): **Text Content** - The textual content of the article.
- `dateDebut` (string): **Start Date** - The date when the article came into effect.
- `dateFin` (string): **End Date** - The date when the article was terminated or superseded.
- `num` (string): **Article Number** - The number assigned to the article.
- `id` (string): **Article ID** - Unique identifier for the article.
- `cid` (string): **Chronical ID** - Chronical identifier for the article.
- `type` (string): **Type** - The type or classification of the document (e.g., "AUTONOME").
- `etat` (string): **Legal Status** - The current legal status of the article (e.g., "MODIFIE_MORT_NE").
2. **Content and Notes**
- `nota` (string): **Notes** - Additional notes or remarks associated with the article.
- `version_article` (string): **Article Version** - The version number of the article.
- `ordre` (integer): **Order Number** - A numerical value used to sort articles within their parent section.
3. **Additional Metadata**
- `conditionDiffere` (string): **Deferred Condition** - Specific conditions related to collective agreements.
- `infosComplementaires` (string): **Additional Information** - Extra information pertinent to the article.
- `surtitre` (string): **Subtitle** - A subtitle or additional title information related to collective agreements.
- `nature` (string): **Nature** - The nature or category of the document (e.g., "Article").
- `texteHtml` (string): **HTML Content** - The article's content in HTML format.
4. **Versioning and Extensions**
- `dateFinExtension` (string): **End Date of Extension** - The end date if the article has an extension.
- `versionPrecedente` (string): **Previous Version** - Identifier for the previous version of the article.
- `refInjection` (string): **Injection Reference** - Technical reference to identify the date of injection.
- `idTexte` (string): **Text ID** - Identifier for the legal text to which the article belongs.
- `idTechInjection` (string): **Technical Injection ID** - Technical identifier for the injected element.
5. **Origin and Relationships**
- `origine` (string): **Origin** - The origin of the document (e.g., "LEGI").
- `dateDebutExtension` (string): **Start Date of Extension** - The start date if the article has an extension.
- `idEliAlias` (string): **ELI Alias** - Alias for the European Legislation Identifier (ELI).
- `cidTexte` (string): **Text Chronical ID** - Chronical identifier of the text.
6. **Hierarchical Relationships**
- `sectionParentId` (string): **Parent Section ID** - Technical identifier of the parent section.
- `multipleVersions` (boolean): **Multiple Versions** - Indicates if the article has multiple versions.
- `comporteLiensSP` (boolean): **Contains Public Service Links** - Indicates if the article contains links to public services.
- `sectionParentTitre` (string): **Parent Section Title** - Title of the parent section (e.g., "I : Revenu imposable").
- `infosRestructurationBranche` (string): **Branch Restructuring Information** - Information about branch restructuring.
- `idEli` (string): **ELI ID** - European Legislation Identifier (ELI) for the article.
- `sectionParentCid` (string): **Parent Section Chronical ID** - Chronical identifier of the parent section.
7. **Additional Content and History**
- `numeroBo` (string): **Official Bulletin Number** - Number of the official bulletin where the article was published.
- `infosRestructurationBrancheHtml` (string): **Branch Restructuring Information (HTML)** - Branch restructuring information in HTML format.
- `historique` (string): **History** - Historical context or changes specific to collective agreements.
- `infosComplementairesHtml` (string): **Additional Information (HTML)** - Additional information in HTML format.
- `renvoi` (string): **Reference** - References to content within the article (e.g., "(1)").
- `fullSectionsTitre` (string): **Full Section Titles** - Concatenation of all titles in the parent chain.
- `notaHtml` (string): **Notes (HTML)** - Additional notes or remarks in HTML format.
- `inap` (string): **INAP** - A placeholder for INAP-specific information.
## Feedback
If you have any feedback, please reach out at [louisbrulenaudet@icloud.com](mailto:louisbrulenaudet@icloud.com).
# 法国民事与军事退休养老金法典,非指令型数据集(2025-03-10)
本项目旨在为研究人员、法务从业者及法学专业学生提供简化且实时更新的全量法国法律文本获取渠道,并通过丰富的数据增强功能,助力其将文本融入欧盟及欧洲合作项目中。
通常而言,本数据集每日针对所有法律法典进行更新,旨在简化开源语言模型开发过程中的训练集构建与标注流程,所有数据均为开放可及的开源数据,可供全社会免费使用。
## LegalKit 协同使用说明
[](https://github.com/louisbrulenaudet/ragoon)
如需使用 LegalKit 发布的全部法律数据,可借助 RAGoon 工具:
bash
pip3 install ragoon
随后可通过以下代码片段加载多个数据集:
python
# -*- coding: utf-8 -*-
from ragoon import load_datasets
req = [
"louisbrulenaudet/code-artisanat",
"louisbrulenaudet/code-action-sociale-familles",
# ...
]
datasets_list = load_datasets(
req=req,
streaming=False
)
dataset = datasets.concatenate_datasets(
datasets_list
)
### 法条信息数据结构
本节详细说明`item`字典中包含的各项元素,每个键对应法条的一项专属属性,其关联值则提供该属性的详细说明。
1. **基础信息**
- `ref`(字符串):**法条编号**——法条的唯一标识,由主法典名称与法条`number`组合而成(例如:《法国通用税法》第123条)。
- `texte`(字符串):**文本内容**——法条的完整文本内容。
- `dateDebut`(字符串):**生效日期**——该法条正式施行的日期。
- `dateFin`(字符串):**失效日期**——该法条被废止或替代的日期。
- `num`(字符串):**法条序号**——分配给该法条的编号。
- `id`(字符串):**法条ID**——该法条的唯一标识符。
- `cid`(字符串):**时序ID**——该法条的时序类唯一标识符。
- `type`(字符串):**文档类型**——文档的类别或分类(例如:"AUTONOME")。
- `etat`(字符串):**法律状态**——该法条当前的法律状态(例如:"MODIFIE_MORT_NE")。
2. **内容与注释**
- `nota`(字符串):**注释内容**——与该法条相关的附加说明或备注。
- `version_article`(字符串):**法条版本**——该法条的版本号。
- `ordre`(整数):**排序序号**——用于对所属章节内的法条进行排序的数值。
3. **附加元数据**
- `conditionDiffere`(字符串):**延迟生效条件**——与集体协议相关的特定生效条件。
- `infosComplementaires`(字符串):**补充信息**——与该法条相关的额外信息。
- `surtitre`(字符串):**副标题**——与集体协议相关的副标题或附加标题信息。
- `nature`(字符串):**文档属性**——文档的性质或类别(例如:"Article")。
- `texteHtml`(字符串):**HTML格式内容**——以HTML格式呈现的法条内容。
4. **版本控制与扩展**
- `dateFinExtension`(字符串):**扩展终止日期**——若该法条存在延期,则为延期的终止日期。
- `versionPrecedente`(字符串):**上一版本ID**——该法条上一版本的标识符。
- `refInjection`(字符串):**注入参考**——用于标识注入日期的技术参考编号。
- `idTexte`(字符串):**文本ID**——该法条所属法律文本的标识符。
- `idTechInjection`(字符串):**技术注入ID**——用于标识注入元素的技术标识符。
5. **来源与关联关系**
- `origine`(字符串):**文档来源**——该文档的出处(例如:"LEGI")。
- `dateDebutExtension`(字符串):**扩展起始日期**——若该法条存在延期,则为延期的起始日期。
- `idEliAlias`(字符串):**欧洲立法标识符(European Legislation Identifier,ELI)别名**——ELI的别名。
- `cidTexte`(字符串):**文本时序ID**——该法条所属法律文本的时序类唯一标识符。
6. **层级关联关系**
- `sectionParentId`(字符串):**父章节ID**——父章节的技术标识符。
- `multipleVersions`(布尔值):**多版本标识**——标识该法条是否存在多个版本。
- `comporteLiensSP`(布尔值):**包含公共服务链接标识**——标识该法条是否包含公共服务相关链接。
- `sectionParentTitre`(字符串):**父章节标题**——父章节的标题(例如:"I:应纳税所得额")。
- `infosRestructurationBranche`(字符串):**行业重组信息**——与行业重组相关的信息。
- `idEli`(字符串):**欧洲立法标识符(ELI)ID**——该法条的ELI。
- `sectionParentCid`(字符串):**父章节时序ID**——父章节的时序类唯一标识符。
7. **附加内容与历史记录**
- `numeroBo`(字符串):**官方公报编号**——该法条发布所在的官方公报编号。
- `infosRestructurationBrancheHtml`(字符串):**行业重组信息(HTML格式)**——以HTML格式呈现的行业重组信息。
- `historique`(字符串):**历史记录**——与集体协议相关的历史背景或变更记录。
- `infosComplementairesHtml`(字符串):**补充信息(HTML格式)**——以HTML格式呈现的补充信息。
- `renvoi`(字符串):**交叉引用**——法条内部的内容引用(例如:"(1)")。
- `fullSectionsTitre`(字符串):**完整章节标题链**——父层级所有标题的拼接结果。
- `notaHtml`(字符串):**注释内容(HTML格式)**——以HTML格式呈现的注释内容。
- `inap`(字符串):**INAP专用占位符**——用于存放INAP相关专属信息的占位符。
## 反馈与建议
如有任何反馈或建议,请通过[louisbrulenaudet@icloud.com](mailto:louisbrulenaudet@icloud.com)联系我们。
提供机构:
maas
创建时间:
2025-10-13



