Safety - Collisions (SWITRS) 2023|交通安全数据集|交通记录系统数据集
收藏SARDet-100K
SARDet-100K数据集是由南开大学计算机科学与技术学院的研究团队开发的,旨在解决SAR目标检测领域数据集有限和代码不可访问的问题。该数据集通过整合和标准化10个公开的SAR检测数据集,提供了约116,598张图像和245,653个目标实例,覆盖了飞机、船只、汽车、桥梁、坦克和港口等6个类别。SARDet-100K不仅是首个COCO级别的大规模多类别SAR目标检测数据集,而且通过其大规模和多样性,为SAR目标检测算法的研究和评估提供了强有力的支持。数据集的标准化处理确保了图像分辨率和标注格式的统一,便于与流行的开源检测代码框架兼容,极大地促进了SAR目标检测技术的发展和创新。
arXiv 收录
全国 1∶200 000 数字地质图(公开版)空间数据库
As the only one of its kind, China National Digital Geological Map (Public Version at 1∶200 000 scale) Spatial Database (CNDGM-PVSD) is based on China' s former nationwide measured results of regional geological survey at 1∶200 000 scale, and is also one of the nationwide basic geosciences spatial databases jointly accomplished by multiple organizations of China. Spatially, it embraces 1 163 geological map-sheets (at scale 1: 200 000) in both formats of MapGIS and ArcGIS, covering 72% of China's whole territory with a total data volume of 90 GB. Its main sources is from 1∶200 000 regional geological survey reports, geological maps, and mineral resources maps with an original time span from mid-1950s to early 1990s. Approved by the State's related agencies, it meets all the related technical qualification requirements and standards issued by China Geological Survey in data integrity, logic consistency, location acc racy, attribution fineness, and collation precision, and is hence of excellent and reliable quality. The CNDGM-PVSD is an important component of China' s national spatial database categories, serving as a spatial digital platform for the information construction of the State's national economy, and providing informationbackbones to the national and provincial economic planning, geohazard monitoring, geological survey, mineral resources exploration as well as macro decision-making.
DataCite Commons 收录
olympics.csv
该数据集包含不同国家参加奥运会的奖牌榜,数据来源于维基百科的历届奥运会奖牌榜。
github 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
无人机智能识别违章建筑算法模型的图像训练数据
无人机智能识别违章建筑算法模型的图像训练数据的应用场景主要集中在提升AI模型对违章建筑的识别能力和准确度。通过对这些数据的训练,AI模型能够更有效地支撑无人机在国土空间治理中的智能化监测任务,基于地理坐标与二级标注体系,AI模型能区分未批先建/超面积建设/非法改建等违建形态,可应用于山地村落违建排查、工业园区超容建设监测等场景,可应用于支撑相关管理部门对违法建设行为的早发现、精定位、快处置闭环管理需求。1、数据来源:原始数据通过自有智能无人机拍摄采集,记录图像ID、采集时间、文件路径、采集设备、地理坐标、拍摄高度、环境参数、边界框组等数据,通过数据清洗,保证数据质量。 2、数据预处理与标注:①对原始数据按7:2:1比例划分训练集/验证集/测试集;②采用多级标注体系:一级标签(违建/合规)、二级标签(未批先建/超面积建设/非法改建等)。③关联要素包含用地性质、产权范围等信息。 3、模型选择和初始化:采用YOLOv5预训练模型,并初始化模型参数,设置合理的超参数:学习率0.002-0.0001动态调整,批量大小16,锚框参数根据拍摄图像特征优化;同时集成注意力机制增强小目标检测能力。 4、模型训练:使用PyTorch框架实施分布式训练,设置训练时长,采用迁移学习策略,冻结底层特征提取层参数,引入Mosaic数据增强提升复杂场景适应能力,设置早停机制(patience=15)防止过拟合。 5、模型评估:① 构建多维评估体系:基础指标(mAP@0.5)、夜间检测率、误报率、漏报率。② 设置渐进式测试:单体建筑→建筑群→混合功能区→历史保护区四阶段测试。 6、模型优化:优化推理引擎,保障推理速度,并建立区域特征库机制。
浙江省数据知识产权登记平台 收录