惠州市退役军人事务局现行有效规范性文件信息|退役军人事务数据集|规范性文件数据集
收藏COCA (Corpus of Contemporary American English)
COCA是一个包含超过5.2亿词的英语语料库,涵盖了从1990年至今的文本。它包括口语、小说、流行杂志、报纸和学术文章五种文体,旨在反映当代美国英语的使用情况。
www.english-corpora.org 收录
中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
核电厂焊缝射线质量智能评定模型数据
1.对核电厂焊缝射线质量、缺陷进行智能精准识别与评定,为核电厂焊缝射线质量智能评定模型提供训练数据,提高核电厂焊缝射线评定标准的准确性,进一步提升核电厂焊缝射线质量。 2.能够为核电厂焊缝质量控制提供决策依据,通过焊缝质量、缺陷训练数据持续优化模型检测标准,进一步保障核电站设备安全和长期稳定运行。数据收集和处理: 步骤1数据收集:方式一:通过使用数字射线检测设备采集获取原始焊缝图像数据;方式二:通过高分辨率扫描设备对传统射线底片影像数据转化为原始焊缝图像数据。 步骤2数据处理:对收集到的原始焊缝图像数据进行图像预处理,去除图像噪声、矫正图像畸变,统一图像尺寸(将图像的高度(imageHeight)和宽度(imageWidth)统一为3580×780(像素),确保原始焊缝图像数据质量和一致性。 步骤3数据标注:使用图像标注工具对原始焊缝图像数据的Filename(文件名)、Shapes(形状)、imagePath(路径)、imageData(图像数据)、imageHeight(图像高度)、imageWidth(图像宽度)等字段进行数据标注。其中:Filename(文件名)按照image_XXX.json按序号依次标注;Shapes(形状)字段中的label(标签)用于标注缺陷类型,缺陷类型标签包括5个缺陷等级:liewen(裂纹)、qikong(气孔)、jiazha(夹渣)、weironghe(未熔合)、weihantou(未焊透),points(位置)用于标记缺陷在图像中的位置,通过坐标的形式进行标注,shape_type(形状类型)为用于框选缺陷的形状,在本数据标注过程中均使用rectangle(矩形)框进行框选,在同一个焊缝图像数据中可能存在多个缺陷,在进行数据标注的过程中Shapes(形状)可能包含多个缺陷;imagePath(路径)用于标记生成标注文件的存储位置,存储在图像的同一路径(文件夹)下;imageData(图像数据)为对通过数据收集阶段获取到的原始焊缝图像数据进行标注,按照image_XXX.tiff进行命名存储;对图像高度(imageHeight)和宽度(imageWidth)分别标注为3580和780。通过以上数据标注过程确保为后续模型训练提供高质量的标注数据。 通过使用核电厂焊缝射线质量智能评定模型数据能够构建例如:卷积神经网络(CNN)的自动识别模型,实现核电厂焊缝射线图像缺陷的自动识别并和缺陷类型的标注,辅助人工评定工作,提升检测效率和准确度。
浙江省数据知识产权登记平台 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
