Apple Detection Drone Brazil Dataset
收藏Apple Detection Drone Brazil Dataset 数据集概述
数据集基本信息
- 数据集名称:Apple Detection Drone Brazil Dataset
- 任务类型:目标检测
- 数据模态:RGB图像
- 采集平台:无人机(UAV,型号:DJI Phantom 4 Pro)
- 数据性质:真实数据
- 图像数量:约2,400张
- 图像分辨率:256×256像素
- 标注格式:每张图像独立的CSV和JSON文件;提供COCO格式
- 许可证:Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
- 版本:1.0.0
数据采集与来源
- 采集地点:巴西Vacaria-RS的Embrapa温带气候果树种植实验站
- 采集高度:12米
- 采集日期:2018年12月13日
- 苹果品种:富士(Fuji)和嘎啦(Gala)
- 果园地块:图像来自VITRINE和GEBLER两个地块,文件名中包含标识
- 原始标注工具:VGG Image Annotator (VIA)
- 原始存储库:https://github.com/thsant/add256
数据集结构
数据集遵循标准化结构规范,主要目录和文件如下:
apple_detection_drone_brazil/ ├── apples/ │ ├── csv/ # 每张图像的CSV标注 │ ├── json/ # 原始JSON标注 │ ├── images/ # 图像文件(JPG/PNG/BMP格式,256×256像素) │ ├── labelmap.json # 标签映射文件 │ └── sets/ # 数据集划分文件 │ ├── train.txt │ ├── val.txt │ ├── test.txt │ ├── all.txt │ └── train_val.txt ├── annotations/ # COCO格式JSON标注(生成) │ ├── apples_instances_train.json │ ├── apples_instances_val.json │ └── apples_instances_test.json ├── scripts/ # 转换脚本 │ ├── convert_to_coco.py # 将CSV转换为COCO格式 │ └── create_annotations.py # 生成独立的JSON标注 ├── data/ # 原始数据目录(可选) │ ├── images/ # 原始图像目录 │ ├── training.json # 原始训练集标注 │ ├── test.json # 原始测试集标注 │ ├── all.json # 原始全部标注 │ └── Dataset.ipynb # 原始笔记本 ├── LICENSE ├── README.md └── requirements.txt
数据划分与统计
- 总图像数:2,400
- 训练集:820张图像(
apples/sets/train.txt) - 验证集:205张图像(
apples/sets/val.txt) - 测试集:114张图像(
apples/sets/test.txt) - 类别数量:1类(苹果)
- 划分文件:通过
apples/sets/*.txt文件提供,用户可以修改这些文件以自定义划分。
标注模式
- CSV每图模式(存储在
apples/csv/文件夹):- 列包括
item, x, y, width, height, label(边界框为绝对像素坐标)。 - 原始标注为圆形格式(中心x,中心y,半径),已转换为矩形边界框。
- 列包括
- JSON每图模式(存储在
apples/json/文件夹):- 每张图像有对应的JSON文件,采用COCO风格格式。
- 边界框:
[x, y, width, height],绝对像素坐标。
- COCO风格格式(生成):
- 包含
info、images、categories、annotations字段。 - 类别定义为
{"id": 1, "name": "apple", "supercategory": "fruit"}。
- 包含
- 标签映射:
apples/labelmap.json定义了类别映射。
预处理与已知问题
- 预处理:图像被裁剪为256×256像素。原始圆形标注(中心,半径)已转换为矩形边界框。
- 坐标系统:原点在左上角,单位为像素。
- 文件命名:图像遵循模式
{orchard_type}-{plot_number}-{sequence}.{ext},其中{ext}可以是.jpg、.png或.bmp(例如:gebler-topview-008-02.jpg)。 - 已知问题:原始标注为圆形格式,已转换为矩形边界框以兼容标准检测框架。
评估与基准
- 评估指标:用于检测的mAP@[.50:.95]。
- 参考结果:请参阅引用论文获取基准结果。
使用与引用
- 快速开始:提供了使用Python(COCO API)加载数据和将数据转换为COCO JSON的示例代码。
- 依赖项:使用需要安装
pillow,可选安装pycocotools。 - 引用格式: bibtex @misc{santos2018add256, title={ADD256: Apple Detection Dataset}, author={Santos, Thiago T.}, year={2018}, howpublished={GitHub repository}, url={https://github.com/thsant/add256} }
维护与联系
- 维护者:数据集结构由标准化团队维护。
- 原作者:Thiago T. Santos。
- 来源:https://github.com/thsant/add256




