dreamproit/bill_summary_us
收藏Hugging Face2023-10-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dreamproit/bill_summary_us
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于美国国会法案的摘要任务,包含法案文本、元数据以及国会研究服务(CRS)提供的摘要。数据集的目的是为了提供更准确的机器学习模型来进行法案摘要。数据集的结构包括数据实例、数据字段和数据分割。数据集的源数据来自govinfo.gov,由美国政府出版办公室(GPO)提供,使用CC0-1.0许可证。数据集的维护者是dreamproit.com,数据集的使用和增强工作在可能受版权保护的范围内,使用CC0许可证发布。
This dataset is designed for the summarization task of United States congressional bills. It includes bill texts, metadata, and summaries provided by the Congressional Research Service (CRS). The goal of this dataset is to support the development of more accurate machine learning models for bill summarization. The dataset's structure encompasses data instances, data fields, and data splits. The source data of the dataset originates from govinfo.gov, provided by the United States Government Publishing Office (GPO), and is licensed under CC0-1.0. The dataset is maintained by dreamproit.com, and its usage and enhancement work are released under the CC0 license within the scope of potentially copyrighted materials.
提供机构:
dreamproit
原始信息汇总
数据集概述
数据集名称
- 名称: bill_summary_us
数据集摘要
- 摘要: 该数据集用于美国国会法案的摘要生成。
支持的任务
- 任务: 摘要生成
语言
- 语言: 英语
数据集结构
数据实例
- 实例: 默认配置下的数据实例。
数据字段
- id: 法案的唯一标识符,格式为(国会编号 + 法案类型 + 法案编号 + 法案版本)。
- congress: 国会编号。
- bill_type: 法案类型。
- bill_number: 法案编号。
- bill_version: 法案版本。
- sections: 法案章节列表,包含章节ID、文本和标题。
- sections_length: 章节列表的长度。
- text: 法案文本。
- text_length: 文本的字符数。
- summary: 法案摘要。
- summary_length: 摘要的字符数。
- title: 法案的官方标题。
数据分割
- 分割: 训练集
数据集创建
来源数据
- 来源: govinfo.gov
初始数据收集和标准化
- 收集: 数据来源于美国政府出版局提供的govinfo.gov服务,使用CC0-1.0许可。
许可证信息
- 许可证: 法案和摘要信息为公共领域,无版权限制。数据集的收集和增强工作,若涉及版权,则基于CC0许可发布。
贡献者
- 贡献者: @aih, @BorodaUA, @alexbojko



