qihoo360/FineHARD
收藏Hugging Face2025-10-09 更新2025-05-31 收录
下载链接:
https://hf-mirror.com/datasets/qihoo360/FineHARD
下载链接
链接失效反馈官方服务:
资源简介:
FineHARD是一个细粒度视觉和文本对齐的数据集,包含图像和对应的文本描述。该数据集用于训练FG-CLIP模型,旨在通过两阶段的训练过程实现图像和文本的精确对齐。
FineHARD is a fine-grained visual and textual alignment dataset, which includes images and their corresponding textual descriptions. This dataset is used to train the FG-CLIP model, aiming to achieve precise alignment between images and texts through a two-stage training process.
提供机构:
qihoo360
搜集汇总
数据集介绍

背景与挑战
背景概述
FineHARD是一个细粒度视觉定位和重标注数据集,规模在10M到100M之间,用于训练FG-CLIP模型以实现图像和文本的细粒度对齐。数据集包含区域级标注和正负样本描述,支持模型的细粒度判别能力提升。
以上内容由遇见数据集搜集并总结生成



