United States Code (USC) Corpus|法律数据集|法律研究数据集
收藏
- 美国国会首次正式发布《美国法典》(United States Code),标志着该法典的正式诞生。
- 美国国会图书馆开始负责《美国法典》的编纂和维护工作,确保其内容的准确性和及时更新。
- 《美国法典》首次被数字化,为后续的电子化版本和数据集的创建奠定了基础。
- 美国政府正式发布《美国法典》数据集(USC Corpus),供公众和研究机构使用,推动了法律文本的广泛应用和研究。
- 随着技术的发展,《美国法典》数据集不断更新和扩展,增加了更多的法律条文和注释,提高了数据集的完整性和可用性。
- 1The United States Code Corpus: A New Resource for Legal Language UnderstandingUniversity of Washington · 2020年
- 2Legal Language Models: A Comparative Study of BERT and GPT-2 on the United States Code CorpusStanford University · 2021年
- 3Exploring the Use of Legal Text Corpora for Predictive Modeling in Legal AnalyticsHarvard Law School · 2022年
mstz/speeddating
Speed dating数据集来自OpenML,主要用于二分类任务,即判断两个人是否会约会。数据集的规模在1K到10K之间,包含多个特征,如性别、年龄、种族、兴趣等。
hugging_face 收录
波士顿房价数据集
波士顿房价数据集是一个经典的机器学习数据集,通常用于回归任务,尤其是房价预测。下方文档中有所有字段顺序的描述。
阿里云天池 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
ShapeNet
ShapeNet 是由斯坦福大学、普林斯顿大学和美国芝加哥丰田技术研究所的研究人员开发的大型 3D CAD 模型存储库。该存储库包含超过 3 亿个模型,其中 220,000 个模型被分类为使用 WordNet 上位词-下位词关系排列的 3,135 个类。 ShapeNet Parts 子集包含 31,693 个网格,分为 16 个常见对象类(即桌子、椅子、平面等)。每个形状基本事实包含 2-5 个部分(总共 50 个部分类)。
OpenDataLab 收录