five

twang2218/chinese-law-and-regulations

收藏
Hugging Face2023-09-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/twang2218/chinese-law-and-regulations
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 dataset_info: - config_name: default features: - name: publish_date dtype: timestamp[ns] - name: effective_date dtype: timestamp[ns] - name: type dtype: string - name: status dtype: string - name: title dtype: string - name: office dtype: string - name: office_level dtype: string - name: office_category dtype: string - name: effective_period dtype: string - name: content dtype: string splits: - name: train num_bytes: 363619544 num_examples: 22552 download_size: 159516785 dataset_size: 363619544 - config_name: metadata features: - name: publish_date dtype: timestamp[ns] - name: effective_date dtype: timestamp[ns] - name: type dtype: string - name: status dtype: string - name: title dtype: string - name: office dtype: string - name: office_level dtype: string - name: office_category dtype: string - name: effective_period dtype: string splits: - name: train num_bytes: 4529871 num_examples: 22552 download_size: 740438 dataset_size: 4529871 configs: - config_name: default data_files: - split: train path: data/train-* - config_name: metadata data_files: - split: train path: metadata/train-* ---
提供机构:
twang2218
原始信息汇总

数据集概述

许可证

  • Apache 2.0

数据集配置

  • default

    • 特征
      • publish_date: 时间戳
      • effective_date: 时间戳
      • type: 字符串
      • status: 字符串
      • title: 字符串
      • office: 字符串
      • office_level: 字符串
      • office_category: 字符串
      • effective_period: 字符串
      • content: 字符串
    • 分割
      • train
        • 字节数: 363619544
        • 样本数: 22552
    • 下载大小: 159516785
    • 数据集大小: 363619544
  • metadata

    • 特征
      • publish_date: 时间戳
      • effective_date: 时间戳
      • type: 字符串
      • status: 字符串
      • title: 字符串
      • office: 字符串
      • office_level: 字符串
      • office_category: 字符串
      • effective_period: 字符串
    • 分割
      • train
        • 字节数: 4529871
        • 样本数: 22552
    • 下载大小: 740438
    • 数据集大小: 4529871

数据文件配置

  • default

    • 分割: train
    • 路径: data/train-*
  • metadata

    • 分割: train
    • 路径: metadata/train-*
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含中国法律法规的文本数据,总计45,104行,覆盖宪法、法律等多种类型,时间跨度从1980年代到2023年。数据集提供结构化元数据,如发布日期、生效日期、发布机构等,适用于法律文本分析、自然语言处理等任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作