United States Congressional Bills|立法数据集|法律文本数据集
收藏
- United States Congressional Bills数据集首次发布,包含了自1993年以来美国国会通过的法案文本。
- 数据集扩展至包含1993年至1998年间的所有法案文本,为研究者提供了更丰富的历史数据。
- 数据集进一步更新,涵盖了1993年至2004年的法案文本,并开始提供XML格式的数据,便于更深入的文本分析。
- 数据集的覆盖范围扩展至1993年至2010年,同时增加了对法案状态和历史记录的详细描述,提升了数据集的实用性和研究价值。
- 数据集再次更新,包含了1993年至2016年的法案文本,并引入了更多的元数据,如法案的提交者、委员会信息等,进一步丰富了数据集的内容。
- 1United States Congressional Bills ProjectUnited States Government Publishing Office · 2009年
- 2Analyzing Legislative Texts: A Case Study on United States Congressional BillsAssociation for Computational Linguistics · 2018年
- 3Predicting Legislative Outcomes Using Textual Analysis: A Case Study on United States Congressional BillsSAGE Publications · 2020年
- 4The Impact of Legislative Text on Public Policy: Evidence from United States Congressional BillsCambridge University Press · 2019年
- 5Textual Analysis of Legislative Intent: A Study of United States Congressional BillsTaylor & Francis Online · 2021年
Matchesfashion, Ltd. eCommerce insights
The eCommerce activity of Matchesfashion, Ltd. amounted to US$410m in 2023. Learn more about their online business including detailed eCommerce revenue analytics.
ecommercedb.com 收录
AerialMegaDepth
AerialMegaDepth数据集是由卡内基梅隆大学研究者创建的,该数据集结合了伪合成渲染和真实地面图像,旨在推进从地面和空中视角的图像中学习几何重建和视图合成任务。数据集通过将3D城市级网格的伪合成渲染与来自MegaDepth的真实地面级图像在统一坐标系中注册,包含了137个地标和132,137个地理注册图像。该数据集在具有挑战性的地面-空中场景中,显著提高了基于学习的方法在多视图几何预测和新型视图合成任务上的性能。
arXiv 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
CodeGen
CodeGen数据集是一个用于代码生成和理解的大型数据集,包含了多种编程语言的代码片段和相应的自然语言描述。该数据集旨在帮助研究人员和开发者训练和评估代码生成模型,提高代码生成的准确性和效率。
github.com 收录
OMIM (Online Mendelian Inheritance in Man)
OMIM是一个包含人类基因和遗传疾病信息的在线数据库。它提供了详细的遗传疾病描述、基因定位、相关文献和临床信息。数据集内容包括疾病名称、基因名称、基因定位、遗传模式、临床特征、相关文献引用等。
www.omim.org 收录