HumanCalibrator

github2025-06-08 更新2025-06-19 收录

下载链接：

https://github.com/Zeqing-Wang/HumanCalibrator

下载链接

链接失效反馈

官方服务：

资源简介：

COCO Human-Aware Val是从COCO 2017 Val分割中自动生成的分割，包含XX张图像，每张图像包含一个异常及其对应的边界框。AIGC Human-Aware 1K是一个手动标注的分割，包含1000张图像。由于异常位置的不确定性，AIGC Human-Aware 1K中没有标注边界框。

The COCO Human-Aware Val dataset is an automatically generated segmentation from the COCO 2017 Val split, containing XX images, each with one anomaly and its corresponding bounding box. The AIGC Human-Aware 1K is a manually annotated segmentation that includes 1000 images. Due to the uncertainty in anomaly location, no bounding boxes are annotated in the AIGC Human-Aware 1K.

创建时间：

2025-05-19

原始信息汇总

HumanCalibrator 数据集概述

基本信息

论文标题: Is this Generated Person Existed in Real-world? Fine-grained Detecting and Calibrating Abnormal Human-body (CVPR 2025)
作者: Zeqing Wang, Qingyang Ma, Wentao Wan, Haojie Li, Keze Wang, Yonghong Tian
arXiv链接: https://arxiv.org/abs/2411.14205
数据集链接: https://huggingface.co/datasets/NNaptmn/HumanCalibrator

数据集组成

1. COCO Human-Aware Val

来源: 从COCO 2017 Val split自动生成
内容: 包含XX张图像，每张图像包含一个异常及其对应的边界框

2. AIGC Human-Aware 1K

内容: 包含1000张手动标注的图像
特点: 由于异常位置的不确定性，未标注边界框
警告: 部分图像可能引起不适

训练数据

下载地址: https://huggingface.co/datasets/NNaptmn/HumanCalibrator

模型检查点

基础模型: LLaVa1.5 7B
下载地址: https://drive.google.com/drive/folders/1E2l9fRQq9l5YjPJnVCAnrwNQJv9uFVZ0?usp=sharing
文件名: llava-v1.5-7b-task-train_ver_with_neg_inpainting_1721922413_0392356_2_epoch.tar.gz

引用格式

bibtex @inproceedings{wang2025generated, title={Is this generated person existed in real-world? fine-grained detecting and calibrating abnormal human-body}, author={Wang, Zeqing and Ma, Qingyang and Wan, Wentao and Li, Haojie and Wang, Keze and Tian, Yonghong}, booktitle={Proceedings of the Computer Vision and Pattern Recognition Conference}, pages={21226--21237}, year={2025} }

搜集汇总

数据集介绍

构建方式

HumanCalibrator数据集的构建融合了自动化生成与人工标注的双重策略，体现了计算机视觉领域对生成内容真实性检测的前沿探索。COCO Human-Aware Val子集基于COCO 2017验证集通过算法自动注入异常特征，并保留边界框标注；而AIGC Human-Aware 1K子集则通过严格的人工筛选流程，从1000张生成图像中识别细微的人体异常，虽未标注具体位置但确保了质量。这种混合构建方式既保证了数据规模又兼顾了标注精度。

特点

该数据集的核心价值在于其针对生成式AI人体异常的细粒度检测能力。COCO子集提供结构化异常定位信息，适用于监督学习任务；AIGC子集则聚焦生成图像的全局合理性判断，包含可能引起不适但极具研究价值的样本。两个子集形成互补，覆盖了从传统图像异常到AIGC特有伪影的完整谱系，为模型校准提供了多维度的评估基准。特别设计的伦理审查机制在数据可用性与人文关怀间取得了平衡。

使用方法

研究者可通过Hugging Face平台获取预处理好的训练数据，需预先配置LLaVa、Grounded-Segment-Anything等依赖环境。数据集支持两种典型应用范式：对于COCO子集可利用边界框信息开发异常检测模型；AIGC子集则适用于端到端的生成图像真实性分类。官方提供的基于LLaVa1.5-7B的预训练权重可作为基线，用户可参照论文实验协议进行微调或零样本评估，注意需遵循严格的伦理使用准则。

背景与挑战

背景概述

HumanCalibrator数据集由Zeqing Wang等研究人员在2025年CVPR会议上提出，旨在解决生成式人工智能中人体异常检测与校准的核心问题。该数据集依托COCO 2017验证集构建自动化标注分支，并新增手工标注的AIGC人体异常样本，为鉴别生成图像中非真实存在的人体形态提供了细粒度研究基准。其创新性地将视觉语言模型LLaVa与稳定扩散模型相结合，推动了生成内容可信度验证领域的方法论发展。

当前挑战

该数据集面临双重技术挑战：在领域问题层面，需突破传统异常检测对显式边界框标注的依赖，解决生成式人体中非刚性异常的定位难题；在构建过程中，既要克服AIGC样本视觉不适感的伦理筛选压力，又需处理生成异常与自然异常的语义鸿沟。数据标注的不确定性导致AIGC分支放弃边界框标注，进一步增加了模型训练的复杂度。

常用场景

经典使用场景

在计算机视觉领域，HumanCalibrator数据集为研究人员提供了一个独特的平台，用于探索生成式人工智能在人体图像合成中的异常检测问题。该数据集通过精心构建的COCO Human-Aware Val和AIGC Human-Aware 1K两个子集，为算法开发提供了丰富的异常人体样本，特别适合用于训练和评估细粒度异常检测模型。

实际应用

在实际应用中，HumanCalibrator数据集可显著提升数字内容审核系统的性能。社交媒体平台利用基于该数据集训练的模型，能够自动识别并过滤含有异常人体特征的AI生成内容。影视特效行业则借助其评估工具，确保虚拟角色符合人体解剖学规范。此外，该数据集也为法医学图像分析提供了有价值的参考标准。

衍生相关工作

围绕HumanCalibrator数据集已产生多项重要研究，包括基于LLaVa架构的异常检测模型改进、结合Grounded-Segment-Anything的细粒度定位方法，以及利用Stable Diffusion进行数据增强的技术。这些工作显著推进了生成内容检测领域的发展，部分成果已在CVPR等顶级会议发表，形成了完整的技术生态链。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集