3D Match Dataset|3D技术数据集|场景匹配数据集
收藏
- 3D Match Dataset首次发表,由Yulan Guo等人提出,旨在为三维点云配准任务提供一个标准化的评估平台。
- 该数据集首次应用于三维点云配准算法的研究和评估,推动了相关领域的技术进步。
- 随着深度学习技术的发展,3D Match Dataset开始被用于训练和测试基于深度学习的点云配准模型。
- 该数据集在多个国际会议和期刊上被广泛引用,成为三维点云配准领域的重要基准数据集之一。
- 研究人员开始基于3D Match Dataset进行扩展和改进,以适应更复杂和多样化的应用场景。
hoskinson-center/proof-pile
`proof-pile`是一个13GB的数学文本预训练数据集,包含83亿个标记(使用`gpt-neox`分词器)。该数据集由多种非正式和正式数学文本来源组成,包括ArXiv.math(10GB)、开源数学教科书(50MB)、形式数学库(500MB)、Math Overflow和Math Stack Exchange(2.5GB)、Wiki风格来源(50MB)以及MATH数据集(6MB)。数据集构建过程可复现,并提供了详细的预处理步骤和过滤条件。
hugging_face 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
Maddison Project Database
The Maddison Project Database was started in March 2010. The project builds on the original dataset created by economist Agnus Maddison to revise or adjust the historical economic data based on new information. Data for population, GDP, and per capita GDP are presented by countries, small country groups, regions, and the world, dating back to Roman times. In the January 2013 update many of the pre-1820 and all of the pre-1600 numbers for GDP per capita were modified. GDP per capita data for 2009 and 2010 were also added.
Global Health Data Exchange () 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
中国知识产权局专利数据库
该数据集包含了中国知识产权局发布的专利信息,涵盖了专利的申请、授权、转让等详细记录。数据内容包括专利号、申请人、发明人、申请日期、授权日期、专利摘要等。
www.cnipa.gov.cn 收录