Data for: What drives university research performance? An analysis using the CWTS Leiden Ranking data
收藏BDD100K
数据集推动了视觉的进步,但现有的驾驶数据集在视觉内容和支持任务方面缺乏研究,以研究自动驾驶的多任务学习。研究人员通常只能在一个数据集上研究一小组问题,而现实世界的计算机视觉应用程序需要执行各种复杂的任务。我们构建了最大的驾驶视频数据集 BDD100K,包含 10 万个视频和 10 个任务,以评估图像识别算法在自动驾驶方面的令人兴奋的进展。该数据集具有地理、环境和天气的多样性,这对于训练不太可能对新条件感到惊讶的模型很有用。基于这个多样化的数据集,我们为异构多任务学习建立了一个基准,并研究了如何一起解决这些任务。我们的实验表明,现有模型需要特殊的训练策略来执行此类异构任务。 BDD100K 为未来在这个重要场所的学习打开了大门。更多详细信息请参见数据集主页。
OpenDataLab 收录
核电厂焊缝射线质量智能评定模型数据
1.对核电厂焊缝射线质量、缺陷进行智能精准识别与评定,为核电厂焊缝射线质量智能评定模型提供训练数据,提高核电厂焊缝射线评定标准的准确性,进一步提升核电厂焊缝射线质量。 2.能够为核电厂焊缝质量控制提供决策依据,通过焊缝质量、缺陷训练数据持续优化模型检测标准,进一步保障核电站设备安全和长期稳定运行。数据收集和处理: 步骤1数据收集:方式一:通过使用数字射线检测设备采集获取原始焊缝图像数据;方式二:通过高分辨率扫描设备对传统射线底片影像数据转化为原始焊缝图像数据。 步骤2数据处理:对收集到的原始焊缝图像数据进行图像预处理,去除图像噪声、矫正图像畸变,统一图像尺寸(将图像的高度(imageHeight)和宽度(imageWidth)统一为3580×780(像素),确保原始焊缝图像数据质量和一致性。 步骤3数据标注:使用图像标注工具对原始焊缝图像数据的Filename(文件名)、Shapes(形状)、imagePath(路径)、imageData(图像数据)、imageHeight(图像高度)、imageWidth(图像宽度)等字段进行数据标注。其中:Filename(文件名)按照image_XXX.json按序号依次标注;Shapes(形状)字段中的label(标签)用于标注缺陷类型,缺陷类型标签包括5个缺陷等级:liewen(裂纹)、qikong(气孔)、jiazha(夹渣)、weironghe(未熔合)、weihantou(未焊透),points(位置)用于标记缺陷在图像中的位置,通过坐标的形式进行标注,shape_type(形状类型)为用于框选缺陷的形状,在本数据标注过程中均使用rectangle(矩形)框进行框选,在同一个焊缝图像数据中可能存在多个缺陷,在进行数据标注的过程中Shapes(形状)可能包含多个缺陷;imagePath(路径)用于标记生成标注文件的存储位置,存储在图像的同一路径(文件夹)下;imageData(图像数据)为对通过数据收集阶段获取到的原始焊缝图像数据进行标注,按照image_XXX.tiff进行命名存储;对图像高度(imageHeight)和宽度(imageWidth)分别标注为3580和780。通过以上数据标注过程确保为后续模型训练提供高质量的标注数据。 通过使用核电厂焊缝射线质量智能评定模型数据能够构建例如:卷积神经网络(CNN)的自动识别模型,实现核电厂焊缝射线图像缺陷的自动识别并和缺陷类型的标注,辅助人工评定工作,提升检测效率和准确度。
浙江省数据知识产权登记平台 收录
中国1km分辨率逐月降水量数据集(1901-2024)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
yuvidhepe/us-accidents-updated
这是一个覆盖美国49个州的全国性交通事故数据集,数据收集自2016年2月至2023年3月,通过多种交通API实时收集。目前数据集中包含约770万条交通事故记录,可用于实时交通事故预测、热点位置研究、伤亡分析以及环境因素对事故发生的影响研究等。
hugging_face 收录
UAVDT Dataset
The authors constructed a new UAVDT Dataset focused on complex scenarios with new level challenges. Selected from 10 hours raw videos, about 80, 000 representative frames are fully annotated with bounding boxes as well as up to 14 kinds of attributes (e.g., weather condition, flying altitude, camera view, vehicle category, and occlusion) for three fundamental computer vision tasks: object detection, single object tracking, and multiple object tracking.
datasetninja.com 收录
