dreamproit/bill_labels_us
收藏Hugging Face2024-05-07 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/dreamproit/bill_labels_us
下载链接
链接失效反馈官方服务:
资源简介:
数据集bill_labels_us包含美国国会法案的文本及其政策领域和立法主题信息,涵盖了从第108届到第118届国会的约119,000份文件。数据集的结构包括法案的ID、国会届数、法案类型、法案编号、法案版本、标题、章节列表、文本、政策领域和立法主题等字段。数据集的创建目的是为了收集法案文本及其元数据,以便训练模型自动分类法案。数据来源于govinfo.gov,由美国国会图书馆的国会研究服务专家进行注释。
数据集bill_labels_us包含美国国会法案的文本及其政策领域和立法主题信息,涵盖了从第108届到第118届国会的约119,000份文件。数据集的结构包括法案的ID、国会届数、法案类型、法案编号、法案版本、标题、章节列表、文本、政策领域和立法主题等字段。数据集的创建目的是为了收集法案文本及其元数据,以便训练模型自动分类法案。数据来源于govinfo.gov,由美国国会图书馆的国会研究服务专家进行注释。
提供机构:
dreamproit
原始信息汇总
数据集概述
数据集名称
- 名称: bill_labels_us
数据集摘要
- 摘要: 该数据集包含美国国会从第108届至第118届的约119,000份法案文件,提供政策领域和立法主题信息。
支持的任务和排行榜
- 任务: 文本生成、文本分类
- 排行榜: 信息待补充
语言
- 语言: 英语
数据集结构
- 数据实例: 包含约119,000份文档
- 数据字段:
- id: 法案ID(国会编号+法案类型+法案编号+法案版本)
- congress: 国会编号
- bill_type: 法案类型
- bill_number: 法案编号
- bill_version: 法案版本
- title: 法案官方标题
- sections: 法案章节列表,包含章节ID、文本和标题
- sections_length: 章节列表长度
- text: 法案文本
- text_length: 文本字符数
- policy_area: 相关政策领域
- legislative_subjects: 相关立法主题列表
数据集创建
- 来源数据: 数据来源于govinfo.gov,由美国政府出版局提供,遵循CC0-1.0许可
- 注释: 政策领域和立法主题等注释由国会研究服务部的专家研究人员提供
使用数据注意事项
- 社会影响: 包含美国国会的立法提案
- 许可证信息: 法案和元数据信息为公共无版权信息,数据集的收集和增强工作遵循CC0许可
数据集维护者
- 维护者: dreamproit.com
贡献者
- 贡献者: @aih, @BorodaUA, @alexbojko



