apex-crackAi|裂缝检测数据集|机器学习数据集
收藏数据集概述
数据集名称
apex-crackAi
数据集描述
该数据集专门为改进YOLOv11的裂缝检测系统而设计,旨在为机器学习模型提供高质量的训练样本,以便有效识别和检测结构表面上的裂缝。
数据集类别
- 类别数量:1
- 类别名称:[crack]
数据集特点
- 数据集由多种不同环境下的裂缝图像组成,涵盖了不同的光照条件、角度和背景。
- 每张图像都经过精细的标注,确保裂缝的边界清晰可见,并且标注的准确性得到了严格的验证。
- 图像不仅包括微小的裂缝,还涵盖了较大、明显的裂缝,以帮助模型学习不同规模裂缝的特征。
- 数据集的构建考虑到了现实世界中裂缝出现的多样性,涵盖了混凝土、砖石等多种材料的裂缝图像。
数据集用途
通过使用“apex-crackAi”数据集,期望能够显著提高裂缝检测的准确性和效率,为相关领域的研究和实践提供有力支持。

中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录
腾讯词向量(Tencent AI Lab Embedding Corpus for Chinese Words and Phrases)
这些语料库的最新版本提供了100维度和200维度的向量表示形式,也就是嵌入,适用于中文和英文。具体来说,有超过1200万个中文单词和短语以及650万个英语单词和短语,它们是在大规模高质量数据上进行预先培训的。这些向量捕获单词和短语的语义含义,可以广泛应用于许多下游任务 (例如,命名实体识别和文本分类) 以及进一步的研究中。
OpenDataLab 收录
MedChain
MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。
arXiv 收录
Obstacle-dataset OD
该数据集用于十五种障碍物检测,包含VOC格式和YOLO训练的.txt文件,数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。
github 收录