Sitios web que utilizan Hibu CMS en BRICS countries|内容管理系统数据集|BRICS国家数据集
收藏云浮市失信被执行人名单信息
该数据包含了2022年至今云浮市失信被执行人名单信息,指云浮市政务服务数据管理局对该信息的变动情况进行跟踪、采集、预测、分析、公布等活动。
开放广东 收录
Multi-Text CIR (MTCIR)
MTCIR是一个大规模的合成数据集,包含340万图像对和1770万修改文本。该数据集由亚马逊公司收集,旨在解决组合图像检索领域数据不足的问题,通过多模态大型语言模型生成图像对的修改文本,并提供了多个简短的修改文本,以覆盖各种属性,更好地反映人类查询构建方式,为CIR模型提供更真实、全面的训练基础。
arXiv 收录
无人机智能识别违章建筑算法模型的图像训练数据
无人机智能识别违章建筑算法模型的图像训练数据的应用场景主要集中在提升AI模型对违章建筑的识别能力和准确度。通过对这些数据的训练,AI模型能够更有效地支撑无人机在国土空间治理中的智能化监测任务,基于地理坐标与二级标注体系,AI模型能区分未批先建/超面积建设/非法改建等违建形态,可应用于山地村落违建排查、工业园区超容建设监测等场景,可应用于支撑相关管理部门对违法建设行为的早发现、精定位、快处置闭环管理需求。1、数据来源:原始数据通过自有智能无人机拍摄采集,记录图像ID、采集时间、文件路径、采集设备、地理坐标、拍摄高度、环境参数、边界框组等数据,通过数据清洗,保证数据质量。 2、数据预处理与标注:①对原始数据按7:2:1比例划分训练集/验证集/测试集;②采用多级标注体系:一级标签(违建/合规)、二级标签(未批先建/超面积建设/非法改建等)。③关联要素包含用地性质、产权范围等信息。 3、模型选择和初始化:采用YOLOv5预训练模型,并初始化模型参数,设置合理的超参数:学习率0.002-0.0001动态调整,批量大小16,锚框参数根据拍摄图像特征优化;同时集成注意力机制增强小目标检测能力。 4、模型训练:使用PyTorch框架实施分布式训练,设置训练时长,采用迁移学习策略,冻结底层特征提取层参数,引入Mosaic数据增强提升复杂场景适应能力,设置早停机制(patience=15)防止过拟合。 5、模型评估:① 构建多维评估体系:基础指标(mAP@0.5)、夜间检测率、误报率、漏报率。② 设置渐进式测试:单体建筑→建筑群→混合功能区→历史保护区四阶段测试。 6、模型优化:优化推理引擎,保障推理速度,并建立区域特征库机制。
浙江省数据知识产权登记平台 收录
dacl1k
dacl1k是一个专注于实际桥梁损伤检测的多标签分类数据集,由联邦国防军大学创建。该数据集包含1,474张图像,这些图像来源于实际的建筑检查,涉及多种损伤类型,如裂缝、风化、剥落、暴露钢筋和锈蚀等。dacl1k数据集的创建过程涉及专业工程师的标注,确保了数据的高质量和准确性。该数据集主要用于评估和改进桥梁损伤识别模型,特别是在实际应用场景中的性能。
arXiv 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录