HumanCalibrator
收藏github2025-06-08 更新2025-06-19 收录
下载链接:
https://github.com/Zeqing-Wang/HumanCalibrator
下载链接
链接失效反馈官方服务:
资源简介:
COCO Human-Aware Val是从COCO 2017 Val分割中自动生成的分割,包含XX张图像,每张图像包含一个异常及其对应的边界框。AIGC Human-Aware 1K是一个手动标注的分割,包含1000张图像。由于异常位置的不确定性,AIGC Human-Aware 1K中没有标注边界框。
The COCO Human-Aware Val dataset is an automatically generated segmentation from the COCO 2017 Val split, containing XX images, each with one anomaly and its corresponding bounding box. The AIGC Human-Aware 1K is a manually annotated segmentation that includes 1000 images. Due to the uncertainty in anomaly location, no bounding boxes are annotated in the AIGC Human-Aware 1K.
创建时间:
2025-05-19
原始信息汇总
HumanCalibrator 数据集概述
基本信息
- 论文标题: Is this Generated Person Existed in Real-world? Fine-grained Detecting and Calibrating Abnormal Human-body (CVPR 2025)
- 作者: Zeqing Wang, Qingyang Ma, Wentao Wan, Haojie Li, Keze Wang, Yonghong Tian
- arXiv链接: https://arxiv.org/abs/2411.14205
- 数据集链接: https://huggingface.co/datasets/NNaptmn/HumanCalibrator
数据集组成
1. COCO Human-Aware Val
- 来源: 从COCO 2017 Val split自动生成
- 内容: 包含XX张图像,每张图像包含一个异常及其对应的边界框
2. AIGC Human-Aware 1K
- 内容: 包含1000张手动标注的图像
- 特点: 由于异常位置的不确定性,未标注边界框
- 警告: 部分图像可能引起不适
训练数据
- 下载地址: https://huggingface.co/datasets/NNaptmn/HumanCalibrator
模型检查点
- 基础模型: LLaVa1.5 7B
- 下载地址: https://drive.google.com/drive/folders/1E2l9fRQq9l5YjPJnVCAnrwNQJv9uFVZ0?usp=sharing
- 文件名: llava-v1.5-7b-task-train_ver_with_neg_inpainting_1721922413_0392356_2_epoch.tar.gz
引用格式
bibtex @inproceedings{wang2025generated, title={Is this generated person existed in real-world? fine-grained detecting and calibrating abnormal human-body}, author={Wang, Zeqing and Ma, Qingyang and Wan, Wentao and Li, Haojie and Wang, Keze and Tian, Yonghong}, booktitle={Proceedings of the Computer Vision and Pattern Recognition Conference}, pages={21226--21237}, year={2025} }
搜集汇总
数据集介绍

构建方式
HumanCalibrator数据集的构建融合了自动化生成与人工标注的双重策略,体现了计算机视觉领域对生成内容真实性检测的前沿探索。COCO Human-Aware Val子集基于COCO 2017验证集通过算法自动注入异常特征,并保留边界框标注;而AIGC Human-Aware 1K子集则通过严格的人工筛选流程,从1000张生成图像中识别细微的人体异常,虽未标注具体位置但确保了质量。这种混合构建方式既保证了数据规模又兼顾了标注精度。
特点
该数据集的核心价值在于其针对生成式AI人体异常的细粒度检测能力。COCO子集提供结构化异常定位信息,适用于监督学习任务;AIGC子集则聚焦生成图像的全局合理性判断,包含可能引起不适但极具研究价值的样本。两个子集形成互补,覆盖了从传统图像异常到AIGC特有伪影的完整谱系,为模型校准提供了多维度的评估基准。特别设计的伦理审查机制在数据可用性与人文关怀间取得了平衡。
使用方法
研究者可通过Hugging Face平台获取预处理好的训练数据,需预先配置LLaVa、Grounded-Segment-Anything等依赖环境。数据集支持两种典型应用范式:对于COCO子集可利用边界框信息开发异常检测模型;AIGC子集则适用于端到端的生成图像真实性分类。官方提供的基于LLaVa1.5-7B的预训练权重可作为基线,用户可参照论文实验协议进行微调或零样本评估,注意需遵循严格的伦理使用准则。
背景与挑战
背景概述
HumanCalibrator数据集由Zeqing Wang等研究人员在2025年CVPR会议上提出,旨在解决生成式人工智能中人体异常检测与校准的核心问题。该数据集依托COCO 2017验证集构建自动化标注分支,并新增手工标注的AIGC人体异常样本,为鉴别生成图像中非真实存在的人体形态提供了细粒度研究基准。其创新性地将视觉语言模型LLaVa与稳定扩散模型相结合,推动了生成内容可信度验证领域的方法论发展。
当前挑战
该数据集面临双重技术挑战:在领域问题层面,需突破传统异常检测对显式边界框标注的依赖,解决生成式人体中非刚性异常的定位难题;在构建过程中,既要克服AIGC样本视觉不适感的伦理筛选压力,又需处理生成异常与自然异常的语义鸿沟。数据标注的不确定性导致AIGC分支放弃边界框标注,进一步增加了模型训练的复杂度。
常用场景
经典使用场景
在计算机视觉领域,HumanCalibrator数据集为研究人员提供了一个独特的平台,用于探索生成式人工智能在人体图像合成中的异常检测问题。该数据集通过精心构建的COCO Human-Aware Val和AIGC Human-Aware 1K两个子集,为算法开发提供了丰富的异常人体样本,特别适合用于训练和评估细粒度异常检测模型。
实际应用
在实际应用中,HumanCalibrator数据集可显著提升数字内容审核系统的性能。社交媒体平台利用基于该数据集训练的模型,能够自动识别并过滤含有异常人体特征的AI生成内容。影视特效行业则借助其评估工具,确保虚拟角色符合人体解剖学规范。此外,该数据集也为法医学图像分析提供了有价值的参考标准。
衍生相关工作
围绕HumanCalibrator数据集已产生多项重要研究,包括基于LLaVa架构的异常检测模型改进、结合Grounded-Segment-Anything的细粒度定位方法,以及利用Stable Diffusion进行数据增强的技术。这些工作显著推进了生成内容检测领域的发展,部分成果已在CVPR等顶级会议发表,形成了完整的技术生态链。
以上内容由遇见数据集搜集并总结生成



