VisDial (Visual Dialog)|视觉问答数据集|对话系统数据集

OpenDataLab2025-04-05 更新2024-05-09 收录

视觉问答

对话系统

下载链接：

https://opendatalab.org.cn/OpenDataLab/VisDial

下载链接

链接失效反馈

资源简介：

Visual Dialog (VisDial) 数据集包含基于 MS COCO 数据集图像的人工注释问题。该数据集是通过配对 Amazon Mechanical Turk 上的两个主题来讨论图像而开发的。一个人被分配了“提问者”的工作，另一个人担任“回答者”。提问者只能看到图像的文本描述（即来自 MS COCO 数据集的图像标题），而原始图像对提问者仍然是隐藏的。他们的任务是询问关于这个隐藏图像的问题，以“更好地想象场景”。回答者看到图像、标题并回答提问者提出的问题。他们两人最多可以通过提问和回答问题来继续对话10轮。 VisDial v1.0 在 MS COCO（2017 训练集）上包含 123K 对话，用于训练拆分，2K 对话与验证图像用于验证拆分，以及 8K 对话在测试集上用于测试标准集。之前发布的 v0.5 和 v0.9 版本的 VisDial 数据集（对应于 MS COCO 的旧拆分）被认为已弃用。

提供机构：

OpenDataLab

创建时间：

2022-06-07

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集，包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境，包括行人、车辆、自行车等多种目标，以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集，手动标注了超过260万个目标边界框，并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录

MOOCs Dataset

该数据集包含了大规模开放在线课程（MOOCs）的相关数据，包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。

www.kaggle.com 收录

DALY

DALY数据集包含了全球疾病负担研究（Global Burden of Disease Study）中的伤残调整生命年（Disability-Adjusted Life Years, DALYs）数据。该数据集提供了不同国家和地区在不同年份的DALYs指标，用于衡量因疾病、伤害和早逝导致的健康损失。

ghdx.healthdata.org 收录

UCI Wine

UCI Wine数据集包含了178个样本，每个样本有13个特征，用于分类任务。这些特征包括葡萄酒的化学成分，如酒精含量、苹果酸、灰分等。数据集的目标是将葡萄酒分类为三个不同的品种。

archive.ics.uci.edu 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL，主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录