five

dreamproit/bill_labels_us

收藏
Hugging Face2024-05-07 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/dreamproit/bill_labels_us
下载链接
链接失效反馈
官方服务:
资源简介:
数据集bill_labels_us包含美国国会法案的文本及其政策领域和立法主题信息,涵盖了从第108届到第118届国会的约119,000份文件。数据集的结构包括法案的ID、国会届数、法案类型、法案编号、法案版本、标题、章节列表、文本、政策领域和立法主题等字段。数据集的创建目的是为了收集法案文本及其元数据,以便训练模型自动分类法案。数据来源于govinfo.gov,由美国国会图书馆的国会研究服务专家进行注释。

数据集bill_labels_us包含美国国会法案的文本及其政策领域和立法主题信息,涵盖了从第108届到第118届国会的约119,000份文件。数据集的结构包括法案的ID、国会届数、法案类型、法案编号、法案版本、标题、章节列表、文本、政策领域和立法主题等字段。数据集的创建目的是为了收集法案文本及其元数据,以便训练模型自动分类法案。数据来源于govinfo.gov,由美国国会图书馆的国会研究服务专家进行注释。
提供机构:
dreamproit
原始信息汇总

数据集概述

数据集名称

  • 名称: bill_labels_us

数据集摘要

  • 摘要: 该数据集包含美国国会从第108届至第118届的约119,000份法案文件,提供政策领域和立法主题信息。

支持的任务和排行榜

  • 任务: 文本生成、文本分类
  • 排行榜: 信息待补充

语言

  • 语言: 英语

数据集结构

  • 数据实例: 包含约119,000份文档
  • 数据字段:
    • id: 法案ID(国会编号+法案类型+法案编号+法案版本)
    • congress: 国会编号
    • bill_type: 法案类型
    • bill_number: 法案编号
    • bill_version: 法案版本
    • title: 法案官方标题
    • sections: 法案章节列表,包含章节ID、文本和标题
    • sections_length: 章节列表长度
    • text: 法案文本
    • text_length: 文本字符数
    • policy_area: 相关政策领域
    • legislative_subjects: 相关立法主题列表

数据集创建

  • 来源数据: 数据来源于govinfo.gov,由美国政府出版局提供,遵循CC0-1.0许可
  • 注释: 政策领域和立法主题等注释由国会研究服务部的专家研究人员提供

使用数据注意事项

  • 社会影响: 包含美国国会的立法提案
  • 许可证信息: 法案和元数据信息为公共无版权信息,数据集的收集和增强工作遵循CC0许可

数据集维护者

贡献者

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作