twang2218/chinese-law-and-regulations
收藏Hugging Face2023-09-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/twang2218/chinese-law-and-regulations
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
dataset_info:
- config_name: default
features:
- name: publish_date
dtype: timestamp[ns]
- name: effective_date
dtype: timestamp[ns]
- name: type
dtype: string
- name: status
dtype: string
- name: title
dtype: string
- name: office
dtype: string
- name: office_level
dtype: string
- name: office_category
dtype: string
- name: effective_period
dtype: string
- name: content
dtype: string
splits:
- name: train
num_bytes: 363619544
num_examples: 22552
download_size: 159516785
dataset_size: 363619544
- config_name: metadata
features:
- name: publish_date
dtype: timestamp[ns]
- name: effective_date
dtype: timestamp[ns]
- name: type
dtype: string
- name: status
dtype: string
- name: title
dtype: string
- name: office
dtype: string
- name: office_level
dtype: string
- name: office_category
dtype: string
- name: effective_period
dtype: string
splits:
- name: train
num_bytes: 4529871
num_examples: 22552
download_size: 740438
dataset_size: 4529871
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- config_name: metadata
data_files:
- split: train
path: metadata/train-*
---
提供机构:
twang2218
原始信息汇总
数据集概述
许可证
- Apache 2.0
数据集配置
-
default
- 特征
- publish_date: 时间戳
- effective_date: 时间戳
- type: 字符串
- status: 字符串
- title: 字符串
- office: 字符串
- office_level: 字符串
- office_category: 字符串
- effective_period: 字符串
- content: 字符串
- 分割
- train
- 字节数: 363619544
- 样本数: 22552
- train
- 下载大小: 159516785
- 数据集大小: 363619544
- 特征
-
metadata
- 特征
- publish_date: 时间戳
- effective_date: 时间戳
- type: 字符串
- status: 字符串
- title: 字符串
- office: 字符串
- office_level: 字符串
- office_category: 字符串
- effective_period: 字符串
- 分割
- train
- 字节数: 4529871
- 样本数: 22552
- train
- 下载大小: 740438
- 数据集大小: 4529871
- 特征
数据文件配置
-
default
- 分割: train
- 路径: data/train-*
-
metadata
- 分割: train
- 路径: metadata/train-*
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含中国法律法规的文本数据,总计45,104行,覆盖宪法、法律等多种类型,时间跨度从1980年代到2023年。数据集提供结构化元数据,如发布日期、生效日期、发布机构等,适用于法律文本分析、自然语言处理等任务。
以上内容由遇见数据集搜集并总结生成



