CrowdVLM-R1 Dataset
收藏CrowdVLM-R1 数据集概述
数据集描述
- 数据集名称:CrowdVLM-R1
- 主要目标:通过Fuzzy Group Relative Policy Reward (FGRPR)框架增强视觉语言模型在人群计数任务中的能力
- 核心创新:模糊奖励函数替代传统的0/1准确度奖励,提供更精细的激励
数据集内容
- 数据来源:
- 数据特点:包含训练图像和测试图像,扩展版数据集提供更多训练图像但保持测试图像不变
技术框架
- 基于VLM-R1项目改进
- 关键修改:
src/open_r1/grpo_rec.py文件中的count_reward和count_format_reward函数 - 框架图示:
- 总体框架示意图
- 结合模糊奖励函数的GRPO详细框架图
性能表现
- 在5个领域内数据集上超越所有基线模型(包括GPT4o、LLaMA2(90B)和SFT)
- 在领域外数据集上表现与SFT相当,但在目标值较大时表现更优
引用信息
bib @misc{wang2025crowdvlmr1expandingr1ability, title={CrowdVLM-R1: Expanding R1 Ability to Vision Language Model for Crowd Counting using Fuzzy Group Relative Policy Reward}, author={Zhiqiang Wang and Pengbin Feng and Yanbin Lin and Shuzhang Cai and Zongao Bian and Jinghua Yan and Xingquan Zhu}, year={2025}, eprint={2504.03724}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2504.03724}, }
@misc{shen2025vlmr1, author = {Shen, Haozhan and Zhang, Zilun and Zhang, Qianqian and Xu, Ruochen and Zhao, Tiancheng}, title = {VLM-R1: A stable and generalizable R1-style Large Vision-Language Model}, howpublished = {https://github.com/om-ai-lab/VLM-R1}, note = {Accessed: 2025-02-15}, year = {2025} }




