five

cn-laws

收藏
魔搭社区2025-09-28 更新2025-09-13 收录
下载链接:
https://modelscope.cn/datasets/qazwsxplkj/cn-laws
下载链接
链接失效反馈
官方服务:
资源简介:
# 中华人民共和国法律法规数据集 数据集基于 [RanKKI/LawRefBook](https://github.com/RanKKI/LawRefBook) 项目的数据文件构建,其源头为 [国家法律法规数据库](https://flk.npc.gov.cn/)。 ## 构建过程 1. 克隆 [RanKKI/LawRefBook](https://github.com/RanKKI/LawRefBook) 项目,移动其中的法律数据文件到当前目录并解压: ```bash git clone https://github.com/RanKKI/LawRefBook.git mv LawRefBook/laws.zip . unzip laws.zip ``` 2. 删除不需要的目录和文件: ```bash rm -rf LawRefBook __cache__ db.sqlite3 laws.zip requirements.txt 法律法规模版.md rm -rf 案例 其他 ``` 3. 对所有数据文件进行预处理: ```bash python preprocess.py ``` 4. 对民法典数据进行额外的预处理: 1. 对于 `附则.md`,移除下列行: ``` ## ``` 2. 修改文件名:`总则.md` => `1总则.md`,`物权编.md` => `2物权.md`,以此类推。 3. 对民法典的数据文件进行预处理: ``` python civil_code_preprocess.py ./民法典 ``` ## 结构 数据文件为 Markdown 格式。如果存在编,则一、二、三、四级标题对应法律、编、章、节;否则一、二、三级标题对应法律、章、节。

# 中华人民共和国法律法规数据集 本数据集基于 RanKKI/LawRefBook 项目的数据文件构建,其数据源为国家法律法规数据库(https://flk.npc.gov.cn/)。 ## 构建过程 1. 克隆 RanKKI/LawRefBook 项目,将其中的法律数据文件迁移至当前目录并解压: bash git clone https://github.com/RanKKI/LawRefBook.git mv LawRefBook/laws.zip . unzip laws.zip 2. 删除冗余目录与文件: bash rm -rf LawRefBook __cache__ db.sqlite3 laws.zip requirements.txt 法律法规模版.md rm -rf 案例 其他 3. 对全量数据文件执行预处理操作: bash python preprocess.py 4. 针对民法典数据开展额外预处理操作: 1. 针对 `附则.md` 文件,移除如下行:`##` 2. 重命名文件:将`总则.md`重命名为`1总则.md`,`物权编.md`重命名为`2物权编.md`,依此类推。 3. 对民法典数据文件执行预处理: bash python civil_code_preprocess.py ./民法典 ## 结构 数据文件采用Markdown格式。若法规包含编,则一级、二级、三级、四级标题分别对应法律、编、章、节;若不包含编,则一级、二级、三级标题分别对应法律、章、节。
提供机构:
maas
创建时间:
2025-09-09
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个中国法律法规数据集,基于国家法律法规数据库构建,包含以Markdown格式存储的法律文件,并经过详细的预处理流程。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作