ReferCOCO数据集|视觉定位数据集|对象识别数据集
收藏数据集概述
数据集名称
ReferCOCO数据集
数据集组成
- refcoco:
- instances.json
- refs(google).p
- refs(unc).p
- refcoco+:
- instances.json
- refs(unc).p
- refcocog:
- instances.json
- refs(google).p
- refs(umd).p
- images:
- train2014
数据集处理命令
-
处理refcoco数据集:
python data_process.py --data_root data --output_dir data --dataset refcoco --split unc --generate_mask
-
处理refcoco+数据集:
python data_process.py --data_root data --output_dir data --dataset refcoco+ --split unc --generate_mask
-
处理refcocog数据集:
python data_process.py --data_root data --output_dir data --dataset refcocog --split umd --generate_mask
数据集处理结果
- 生成anns、masks文件夹

flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
UIEB, U45, LSUI
本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。
github 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录