hico_det

Hugging Face2024-09-05 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/zhimeng/hico_det

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含图像和对应的分类标签，标签分为'test'和'train'两个类别。数据集分为训练集和测试集，分别包含76236和19316个样本。数据集的总下载大小为16452513857字节，总数据集大小为16166810245.628字节。

This dataset contains images and their corresponding classification labels, with the labels divided into two categories: "test" and "train". The dataset is split into a training set and a test set, which contain 76236 and 19316 samples respectively. The total download size of the dataset is 16452513857 bytes, and the total size of the dataset is 16166810245.628 bytes.

创建时间：

2024-09-05

原始信息汇总

HICO-DET 数据集概述

数据集信息

特征

image: 图像数据
label: 标签数据
- class_label:
  - names:
    - 0: test
    - 1: train

数据分割

train:
- num_bytes: 12810367262.884 字节
- num_examples: 76236 个样本
test:
- num_bytes: 3356442982.744 字节
- num_examples: 19316 个样本

数据集大小

download_size: 16452513857 字节
dataset_size: 16166810245.628 字节

配置

config_name: default
- data_files:
  - train: data/train-*
  - test: data/test-*

搜集汇总

数据集介绍

构建方式

HICO-DET数据集专注于图像中的人-物交互（HOI）检测，其构建过程基于对47,776张图像的精细标注。这些图像被划分为训练集（38,118张）和测试集（9,658张），涵盖了600种人-物交互类别，涉及80种物体类别和117种动词类别。数据集的标注包括超过150,000个人-物交互对，每张图像均附有详细的物体类别、正面描述、负面描述及模糊描述，确保了数据的多样性和丰富性。

使用方法

使用HICO-DET数据集时，研究者可以通过Hugging Face的`datasets`库轻松加载数据。通过简单的Python代码，即可加载训练集和测试集，并访问图像、物体类别、描述等关键信息。此外，数据集还提供了`list_action.csv`文件，其中包含了所有（物体，动词）对的索引，便于进一步的分析和模型训练。这种便捷的使用方式使得HICO-DET成为人-物交互研究领域的重要资源。

背景与挑战

背景概述

HICO-DET数据集由密歇根大学的研究团队于2015年推出，旨在解决图像中人类与物体交互（HOI）的检测问题。该数据集包含47,776张图像，涵盖了600种人类与物体的交互类别，涉及80种物体类别和117种动词类别。HICO-DET的构建为计算机视觉领域提供了丰富的标注数据，推动了人类行为理解、图像语义分析等研究方向的发展。该数据集不仅为研究者提供了大规模的训练和测试数据，还为复杂场景下的交互检测任务奠定了坚实的基础。

当前挑战

HICO-DET数据集在解决人类与物体交互检测问题时面临多重挑战。首先，交互类别的多样性使得模型需要具备强大的泛化能力，以区分细微的交互差异。其次，数据集中存在大量模糊标注，增加了模型训练的难度。此外，构建过程中，研究人员需处理图像中复杂的场景和多目标交互，这对标注的准确性和一致性提出了极高要求。最后，数据集的规模较大，对计算资源和存储空间的需求较高，进一步增加了研究的复杂性。

常用场景

经典使用场景

HICO-DET数据集在计算机视觉领域中被广泛用于人类-物体交互（HOI）检测任务。该数据集包含了47,776张图像，涵盖了600种不同的HOI类别，涉及80种物体类别和117种动词类别。研究人员通常利用该数据集训练和评估模型，以识别图像中人类与物体之间的复杂交互行为，如“人拿杯子”或“人推椅子”。这些任务不仅要求模型能够准确检测物体，还需要理解人类动作与物体之间的关系。

解决学术问题

HICO-DET数据集解决了计算机视觉领域中人类-物体交互检测的复杂性问题。通过提供超过150,000个标注的人类-物体对，该数据集为研究人员提供了一个丰富的实验平台，用于开发能够理解复杂场景的模型。其多样化的HOI类别和详细的标注信息，使得模型能够在多类别、多对象的场景中进行精确的交互检测，推动了视觉理解技术的发展。

实际应用

在实际应用中，HICO-DET数据集被广泛应用于智能监控、机器人交互和增强现实等领域。例如，在智能监控系统中，该数据集可以帮助识别异常行为，如“人推倒椅子”或“人拿起危险物品”。在机器人交互中，模型可以通过学习HOI数据，更好地理解人类意图，从而做出更自然的响应。此外，增强现实应用也可以利用该数据集，实现更精准的虚拟物体与真实场景的交互。

数据集最近研究