产业通|产业数据数据集|人工智能数据集
收藏
MedHK23/CCA
CCA数据集包含200个描绘冠状动脉疾病的CTA图像案例,其中20个用于训练,180个用于测试。图像以0.5毫米的等向分辨率采集,并由四位放射科医生进行标注,确保每个案例由三位不同的医生独立标注,最后由第四位医生选择最佳标注。
hugging_face 收录
HRRSD
HRRSD包含21,761张从Google Earth和Baidu Map获取的高分辨率(0.15-m至1.2-m)图像,涵盖55,740个对象实例和13个类别的遥感图像对象。数据集被分为训练、验证和测试三个子集,分别包含5401、5417和10943张图像。此外,还提供了数据集的统计信息和基准测试结果。
github 收录
SARDet-100K, DOTA, DroneVehicle
该研究构建了一个多模态遥感目标检测的基准数据集,融合了SARDet-100K、DOTA和DroneVehicle三个数据集,涵盖了SAR、光学和红外等多种传感器模态。数据集旨在解决多模态遥感图像中的目标检测问题,特别是针对水平或旋转边界框的检测任务。通过整合不同模态的数据,该数据集为多任务学习提供了丰富的训练样本,能够有效提升模型在复杂场景下的泛化能力。数据集的应用领域包括无人机、卫星遥感等低空经济与地球观测任务,旨在实现多传感器数据的统一处理与高效检测。
arXiv 收录
IXI Dataset
IXI数据集包含近600张来自正常健康受试者的MRI图像,包括T1、T2、PD加权图像、MRA图像和扩散加权图像。数据集在Hammersmith医院、Guy’s医院和Institute of Psychiatry使用不同系统进行扫描。
github 收录
OCRBench v2
OCRBench v2 是由华中科技大学、阿德莱德大学、华南理工大学和字节跳动联合创建的一个大规模双语文本中心基准数据集。该数据集包含10,000条经过人工验证的问答对,涵盖了31种不同的场景,如街景、收据、公式、图表等。数据集通过23个任务评估LMMs在文本识别、文本定位、手写内容提取和逻辑推理等方面的能力。OCRBench v2 的创建过程包括从81个学术数据集中手动筛选数据,并补充私有数据以确保场景的多样性。该数据集主要用于评估LMMs在复杂OCR任务中的性能,旨在解决现有基准在任务多样性、上下文复杂性和规模上的不足。
arXiv 收录