COCO2014|计算机视觉数据集|图像标注数据集
收藏数据集概述
数据集名称
- GRIT: Faster and Better Image captioning Transformer (ECCV 2022)
预训练对象检测器
- 模型: Pretrained object detector (B) on 4 OD datasets
- 任务: Object Detection
- 检查点: GG Drive link
安装要求
- Python: >= 3.9
- CUDA: >= 11.3
- PyTorch: >= 1.12.0
- torchvision: >= 0.6.1
- 其他包: pycocotools, tensorboard, tqdm, h5py, nltk, einops, hydra, spacy, timm
数据准备
-
数据集: COCO 2014
-
目录结构:
path/to/coco_caption/ ├── annotations/ # annotation json files ├── train2014/ # train images ├── val2014/ # val images
训练
- 配置文件:
configs/caption/coco_config.yaml
- 训练命令: shell export DATA_ROOT=path/to/coco_dataset python train_caption.py exp.name=caption_4ds model.detector.checkpoint=./detector_checkpoint_4ds.pth
最终打印结果
- 命令: shell python print_result.py

TPTP
TPTP(Thousands of Problems for Theorem Provers)是一个包含大量逻辑问题的数据集,主要用于定理证明器的测试和评估。它包含了多种逻辑形式的问题,如一阶逻辑、高阶逻辑、命题逻辑等。
www.tptp.org 收录
MECCANO
MECCANO数据集是首个专注于工业类似环境中第一人称视角下人类-物体交互的研究数据集。该数据集由20名参与者在模拟工业场景中构建摩托车玩具模型的视频组成,包含299,376帧视频数据。数据集不仅标注了时间上的动作片段,还标注了空间上的活跃物体边界框,涵盖了12种动词、20种名词和61种独特动作的分类。MECCANO数据集旨在推动工业环境中第一人称视角下人类动作识别、活跃物体检测、活跃物体识别及第一人称视角下人类-物体交互检测等任务的研究。
arXiv 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
汕头市龙湖区社保局政务服务事项办事窗口信息
该数据为汕头市龙湖区社保局2020年至今政务服务事项办理窗口基本信息,为办事群众指明了具体办理事项线下办理该事项的具体窗口内容,主要包括:窗口名称、窗口地址、窗口电话、办公时间等关键信息。
开放广东 收录