Dataset
收藏Hugging Face2024-07-23 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/VideoGameBunny/Dataset
下载链接
链接失效反馈官方服务:
资源简介:
VideoGameBunny Dataset是一个包含185,259张高分辨率图像的数据集,这些图像来自413个视频游戏,源自YouTube视频。该数据集旨在解决游戏特定指令跟随数据的不足,并提升开源模型对视频游戏内容的理解和响应能力。数据集包括短标题、长标题、图像到JSON的转换和图像基础的问答对等多种指令类型。
创建时间:
2024-07-14
原始信息汇总
VideoGameBunny Instruction Following Dataset
概述
我们提供了一个包含185,259张来自413个视频游戏的高分辨率图像的综合数据集,这些图像来源于YouTube视频。该数据集旨在解决缺乏特定游戏指令跟随数据的问题,并旨在提高开源模型理解和响应视频游戏内容的能力。
数据集组成
我们的数据集包括使用不同大型多模态模型为这些图像生成的各种类型的指令:
- 短标题
- 长标题
- 图像到JSON转换
- 基于图像的问答对
数据集统计
| 任务 | 生成器 | 样本数量 |
|---|---|---|
| 短标题 | Gemini-1.0-Pro-Vision | 70,673 |
| 长标题 | GPT-4V | 70,799 |
| 图像到JSON | Gemini-1.5-Pro | 136,974 |
| 问答 | Llama-3, GPT-4o | 81,122 |
搜集汇总
数据集介绍

构建方式
VideoGameBunny数据集的构建基于413款视频游戏的高分辨率图像,这些图像源自YouTube视频。通过利用多种大型多模态模型,如Gemini-1.0-Pro-Vision、GPT-4V、Gemini-1.5-Pro、Llama-3和GPT-4o,生成了包括简短描述、详细描述、图像到JSON转换以及基于图像的问答对在内的多种指令类型。这一过程不仅丰富了数据集的内容,还确保了数据的多样性和实用性。
使用方法
VideoGameBunny数据集适用于训练和评估图像到文本转换的模型,特别是在视频游戏领域的应用。用户可以通过加载数据集,利用其丰富的图像和指令对进行模型训练,从而提升模型在游戏内容理解和指令跟随方面的性能。此外,数据集的结构化格式(如JSON)也便于开发者进行数据分析和模型优化。
背景与挑战
背景概述
VideoGameBunny Instruction Following Dataset由VideoGameBunny团队于近期发布,旨在解决视频游戏领域中指令跟随数据的匮乏问题。该数据集包含了来自413款视频游戏的185,259张高分辨率图像,这些图像源自YouTube视频。通过引入多种类型的指令生成任务,如短描述、长描述、图像到JSON转换以及基于图像的问答对,该数据集为开源模型提供了丰富的训练资源,以提升其在视频游戏内容理解和响应方面的能力。该数据集的发布不仅填补了游戏领域多模态数据集的空白,还为游戏AI的研究和应用提供了重要的数据支持。
当前挑战
VideoGameBunny数据集在构建过程中面临多重挑战。首先,视频游戏内容的多样性和复杂性使得图像标注和指令生成任务变得尤为困难,尤其是在确保标注准确性和一致性的前提下。其次,数据集的规模庞大,涉及大量高分辨率图像的采集和处理,这对计算资源和存储能力提出了较高要求。此外,不同游戏之间的视觉风格和交互逻辑差异显著,如何设计通用的指令生成模型以覆盖广泛的游戏类型,也是一个亟待解决的问题。最后,数据集的开放性和可扩展性需要在保证数据质量的同时,兼顾未来可能的更新和扩展需求。
常用场景
经典使用场景
VideoGameBunny数据集在视频游戏领域的研究中具有重要应用,尤其是在图像到文本的转换任务中。该数据集通过提供来自413款视频游戏的高分辨率图像及其对应的指令数据,为研究人员提供了一个丰富的资源库,用于训练和评估多模态模型在游戏内容理解和响应方面的能力。经典的使用场景包括生成游戏场景的短描述、长描述、图像到JSON的转换以及基于图像的问答对生成。
解决学术问题
VideoGameBunny数据集解决了视频游戏领域缺乏特定指令跟随数据的问题,填补了多模态模型在游戏内容理解上的空白。通过提供多样化的指令数据,该数据集显著提升了开源模型在处理复杂游戏场景时的表现,推动了图像到文本转换任务的进展。其意义在于为游戏AI的研究提供了坚实的基础,促进了游戏内容生成和交互技术的创新。
实际应用
在实际应用中,VideoGameBunny数据集被广泛用于开发智能游戏助手和自动化游戏内容生成系统。例如,游戏开发者可以利用该数据集训练模型,自动生成游戏场景的描述或生成游戏内的任务提示。此外,该数据集还可用于增强游戏推荐系统,通过分析玩家与游戏内容的交互,提供个性化的游戏体验。
数据集最近研究
最新研究方向
近年来,随着多模态学习技术的快速发展,VideoGameBunny数据集在游戏内容理解与指令生成领域引起了广泛关注。该数据集通过整合来自413款视频游戏的高分辨率图像,并结合多种大模型生成的指令数据,为游戏场景下的图像到文本转换任务提供了丰富的训练资源。当前研究热点集中在如何利用该数据集提升模型对游戏场景的语义理解能力,特别是在图像描述生成、图像到结构化数据的转换以及基于图像的问答系统等任务上。这些研究方向不仅推动了游戏AI的智能化发展,也为跨模态学习模型的性能优化提供了新的实验平台。
以上内容由遇见数据集搜集并总结生成



