BillSum
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/BillSum
下载链接
链接失效反馈官方服务:
资源简介:
BillSum 是第一个汇总美国国会和加利福尼亚州法案的数据集。 BillSum 数据集由三部分组成:美国培训账单、美国测试账单和加州测试账单。美国账单是从美国政府出版局 (GPO) 提供的 Govinfo 服务收集的。该语料库由国会第 103-115 届(1993-2018 年)会议的法案组成。数据分为 18,949 个火车账单和 3,269 个测试账单。对于加利福尼亚州,2015-2016 年会议的法案是直接从立法机构的网站上抓取的;这些摘要是由他们的立法顾问撰写的。 BillSum 语料库侧重于长度为 5,000 到 20,000 个字符的中型立法。作者选择以字符而不是单词或句子来测量文本长度,因为文本结构复杂,难以一致地测量单词。选择该范围是因为一方面,短期票据引入了微小的变化并且不需要摘要。虽然 CRS 为他们生成摘要,但它们通常包含法案的大部分文本。另一方面,很长的立法通常由几个大的部分组成。
提供机构:
OpenDataLab
创建时间:
2022-06-07



