Data from: Contrasting patterns of population connectivity between regions in a commercially important mollusc Haliotis rubra: integrating population genetics, genomics and marine LIDAR data.
收藏Asteroids by the Minor Planet Center
包含所有已知小行星的轨道数据和观测数据。数据来源于Minor Planet Center,格式包括Fortran (.DAT)和JSON,数据集大小为81MB(压缩)和450MB(未压缩),记录数约750,000条,每日更新。
github 收录
cricket_data
该数据集包含了多种板球比赛的数据,包括每场比赛的详细信息,如比赛日期、地点、参赛队伍、比赛结果等。数据以文件形式存储,每个文件对应不同的比赛信息,如投球数据、比赛日期、比赛信息、比赛详情、元数据、比赛结果、最有价值球员、超级替补、参赛队伍、抛硬币结果和裁判员信息等。
github 收录
MultiTalk
MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。
arXiv 收录
SARDet-100K
SARDet-100K数据集是由南开大学计算机科学与技术学院的研究团队开发的,旨在解决SAR目标检测领域数据集有限和代码不可访问的问题。该数据集通过整合和标准化10个公开的SAR检测数据集,提供了约116,598张图像和245,653个目标实例,覆盖了飞机、船只、汽车、桥梁、坦克和港口等6个类别。SARDet-100K不仅是首个COCO级别的大规模多类别SAR目标检测数据集,而且通过其大规模和多样性,为SAR目标检测算法的研究和评估提供了强有力的支持。数据集的标准化处理确保了图像分辨率和标注格式的统一,便于与流行的开源检测代码框架兼容,极大地促进了SAR目标检测技术的发展和创新。
arXiv 收录
poi
本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。
github 收录