five

prometheus-eval/Perception-Collection

收藏
Hugging Face2024-01-15 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/prometheus-eval/Perception-Collection
下载链接
链接失效反馈
官方服务:
资源简介:
Perception Collection是第一个可用于训练评估者视觉语言模型(VLM)的多模态反馈数据集。该数据集包含15K细粒度标准,用于确定每个实例的关键方面。数据集的结构包括图像路径、指令、输出等多个字段,并且数据集的训练部分包含150,108个样本。数据集的语言为英语。

Perception Collection是第一个可用于训练评估者视觉语言模型(VLM)的多模态反馈数据集。该数据集包含15K细粒度标准,用于确定每个实例的关键方面。数据集的结构包括图像路径、指令、输出等多个字段,并且数据集的训练部分包含150,108个样本。数据集的语言为英语。
提供机构:
prometheus-eval
原始信息汇总

数据集概述

基本信息

  • 许可证: cc-by-4.0
  • 任务类别:
    • 视觉问答
    • 文本生成
    • 图像到文本
  • 语言: 英语
  • 数据集大小: 100K<n<1M

数据集摘要

Perception Collection 是首个多模态反馈数据集,可用于训练评估型视觉语言模型(VLM)。该数据集包含15K细粒度标准,用于确定每个实例的关键方面。

数据集结构

  • image: 用于训练的图像路径,包括MMMU数据集和COCO 2017训练数据集的图像。
  • instruction: 提供给评估型VLM的输入,包括评估指令和响应、参考答案、评分标准。
  • output: 评估型VLM应生成的输出,包括反馈和评分决策,以[RESULT]分隔。
  • orig_instruction: 待评估的指令,与包含所有组件的指令不同。
  • orig_response: 待评估的响应。
  • orig_reference_answer: 对orig_instruction的参考答案。
  • orig_criteria: 用于评估orig_response的评分标准。
  • orig_score1_description: 给出1分的描述。
  • orig_score2_description: 给出2分的描述。
  • orig_score3_description: 给出3分的描述。
  • orig_score4_description: 给出4分的描述。
  • orig_score5_description: 给出5分的描述。
  • orig_feedback: 对orig_response的反馈。
  • orig_score: 给orig_response的整数评分(1到5之间)。

数据分割

名称 训练集大小
Perception-Collection 150,108

引用信息

如果该数据集对您有帮助,请考虑引用我们的论文:

bibtex @misc{lee2024prometheusvision, title={Prometheus-Vision: Vision-Language Model as a Judge for Fine-Grained Evaluation}, author={Seongyun Lee and Seungone Kim and Sue Hyun Park and Geewook Kim and Minjoon Seo}, year={2024}, eprint={2401.06591}, archivePrefix={arXiv}, primaryClass={cs.CL} }

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作