双随机一公开抽查事项信息|劳动监察数据集|行政执法数据集
收藏COCA (Corpus of Contemporary American English)
COCA是一个包含超过5.2亿词的英语语料库,涵盖了从1990年至今的文本。它包括口语、小说、流行杂志、报纸和学术文章五种文体,旨在反映当代美国英语的使用情况。
www.english-corpora.org 收录
核电厂焊缝射线质量智能评定模型数据
1.对核电厂焊缝射线质量、缺陷进行智能精准识别与评定,为核电厂焊缝射线质量智能评定模型提供训练数据,提高核电厂焊缝射线评定标准的准确性,进一步提升核电厂焊缝射线质量。 2.能够为核电厂焊缝质量控制提供决策依据,通过焊缝质量、缺陷训练数据持续优化模型检测标准,进一步保障核电站设备安全和长期稳定运行。数据收集和处理: 步骤1数据收集:方式一:通过使用数字射线检测设备采集获取原始焊缝图像数据;方式二:通过高分辨率扫描设备对传统射线底片影像数据转化为原始焊缝图像数据。 步骤2数据处理:对收集到的原始焊缝图像数据进行图像预处理,去除图像噪声、矫正图像畸变,统一图像尺寸(将图像的高度(imageHeight)和宽度(imageWidth)统一为3580×780(像素),确保原始焊缝图像数据质量和一致性。 步骤3数据标注:使用图像标注工具对原始焊缝图像数据的Filename(文件名)、Shapes(形状)、imagePath(路径)、imageData(图像数据)、imageHeight(图像高度)、imageWidth(图像宽度)等字段进行数据标注。其中:Filename(文件名)按照image_XXX.json按序号依次标注;Shapes(形状)字段中的label(标签)用于标注缺陷类型,缺陷类型标签包括5个缺陷等级:liewen(裂纹)、qikong(气孔)、jiazha(夹渣)、weironghe(未熔合)、weihantou(未焊透),points(位置)用于标记缺陷在图像中的位置,通过坐标的形式进行标注,shape_type(形状类型)为用于框选缺陷的形状,在本数据标注过程中均使用rectangle(矩形)框进行框选,在同一个焊缝图像数据中可能存在多个缺陷,在进行数据标注的过程中Shapes(形状)可能包含多个缺陷;imagePath(路径)用于标记生成标注文件的存储位置,存储在图像的同一路径(文件夹)下;imageData(图像数据)为对通过数据收集阶段获取到的原始焊缝图像数据进行标注,按照image_XXX.tiff进行命名存储;对图像高度(imageHeight)和宽度(imageWidth)分别标注为3580和780。通过以上数据标注过程确保为后续模型训练提供高质量的标注数据。 通过使用核电厂焊缝射线质量智能评定模型数据能够构建例如:卷积神经网络(CNN)的自动识别模型,实现核电厂焊缝射线图像缺陷的自动识别并和缺陷类型的标注,辅助人工评定工作,提升检测效率和准确度。
浙江省数据知识产权登记平台 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
RadDet
RadDet是一个包含11种雷达类别的数据集,包括6种新的低概率干扰(LPI)多相码(P1, P2, P3, P4, Px, Zadoff-Chu)和一种新的宽带调频连续波(FMCW)。数据集覆盖500 MHz频段,包含40,000个雷达帧,分为训练集、验证集和测试集。数据集在两种不同的雷达环境中提供:稀疏数据集(RadDet-1T)和密集数据集(RadDet-9T)。
github 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
