five

Zacks-Chen/CoIN

收藏
Hugging Face2024-06-18 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/Zacks-Chen/CoIN
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过整合多个公开且常用的指令调优数据集构建而成,包括VQAv2、VizWiz、ScienceQA、TextVQA、GQA和OCR-VQA。为了增强数据集的多样性,还引入了分类任务和指代表达理解任务,使用了ImageNet、RefCOCO、RefCOCO+和RefCOCOg。在进行指令调优之前,用户需要自行下载这些数据集。此外,数据集使用了两种类型的指令模板来全面评估性能。

该数据集是通过整合多个公开且常用的指令调优数据集构建而成,包括VQAv2、VizWiz、ScienceQA、TextVQA、GQA和OCR-VQA。为了增强数据集的多样性,还引入了分类任务和指代表达理解任务,使用了ImageNet、RefCOCO、RefCOCO+和RefCOCOg。在进行指令调优之前,用户需要自行下载这些数据集。此外,数据集使用了两种类型的指令模板来全面评估性能。
提供机构:
Zacks-Chen
原始信息汇总

ContinuaL Instruction Tuning Dataset Card

数据集详情

数据集来源

该数据集是通过使用公开可用的常见指令调优数据集构建的,包括 VQAv2、VizWiz、ScienceQA、TextVQA、GQA 和 OCR-VQA。

此外,为了增强多样性,我们在 CoIN 中引入了分类任务和引用表达理解任务,使用 ImageNet、RefCOCO、RefCOCO+ 和 RefCOCOg。

在进行指令调优之前,请自行下载这些数据集。

图像来源 下载路径
COCO train2014, test2015, val2014
RefCOCO annotation
RefCOCO+ annotation
RefCOCOg annotation
ImageNet images
OCR-VQA images
GQA images
TextVQA train, test
ScienceQA images
VizWiz train, val, test

指令模板

为了全面评估性能,我们使用两种类型的模板构建指令。

许可证:Creative Commons Attribution 4.0 International

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作