zjr2000/REVERIE
收藏数据集卡片:REVERIE
数据集详情
数据集类型: REVERIE 是首个大规模视觉指令调优数据集,带有反射性理性注释。REVERIE 包含 115k 机器生成的推理指令,每个指令都经过精心注释,配有一对正确和混淆的响应,并附有详细的理性说明,解释每个响应的正确性或错误性的理由。
数据收集: REVERIE 通过提示 Gemini-1.0-Vision-Pro API 收集。
统计数据: REVERIE 数据集包含 71,558 张自然图像。其中包括来自 Visual Genome 的 50,938 张图像,来自 COCO 的 15,706 张图像,以及来自 ScienceQA 的 4914 张图像。REVERIE 包含 115,280 条指令及其对应的正面响应,以及 138,897 条负面响应,每个响应都附有反射性理性说明,总计 254,177 个训练实例。REVERIE 涵盖四种视觉语言任务,包括多项选择 QA、简答 QA、开放式 QA 和是/否问题。
数据集结构
json { "id": IMAGE_ID, "image": IMAGE_FILE_NAME, "conversations": [ { "from": "human", "value": QUESTION, }, { "from": "gpt", "value": RESPONSE, }, { "from": "human", "value": RATIONALE PROMPT, }, { "from": "gpt", "value": POSITIVE/NEGATIVE RATIONALE } ] }
许可证: Creative Commons Attribution Non Commercial 4.0;并应遵守 Gemini API 的条款:https://ai.google.dev/gemini-api/terms




