five

TIFA, AIGCIQA2023, ECCV_Caption, D3PO|机器学习数据集|人类反馈数据集

收藏
github2024-02-05 更新2024-05-31 收录
机器学习
人类反馈
下载链接:
https://github.com/mehdidc/compositionality-datasets-merge
下载链接
链接失效反馈
资源简介:
本仓库包含了多个数据集,包括TIFA、AIGCIQA2023、ECCV_Caption和D3PO,用于奖励模型的人类反馈研究。每个数据集都有详细的下载和设置指南。

This repository contains multiple datasets, including TIFA, AIGCIQA2023, ECCV_Caption, and D3PO, for research on human feedback in reward models. Each dataset comes with detailed download and setup instructions.
创建时间:
2024-01-05
原始信息汇总

数据集概述

数据集下载与设置

图像下载

  • TIFA 和 AIGCIQA2023 数据集图像: 可从 此链接 下载。下载后解压,将得到 annotated_imagesallimg 两个文件夹。

TIFA 数据集

  • 偏好排名数据: 位于 csvs/tifa.csv
  • 图像设置: 确保 annotated_images 文件夹与 tifa.csv 位于同一目录。

AIGCIQA2023 数据集

  • 偏好排名数据: 位于 csvs/aigciqa2023.csv
  • 图像设置: 确保 allimg 文件夹与 aigciqa2023.csv 位于同一目录。

ECCV_Caption 数据集

  • 偏好排名数据: 位于 eccv_caption.csv
  • 图像设置: 需下载 COCO2014 val split,解压后将 val2014 文件夹存储在 eccv_caption.csv 同一目录。

D3PO 数据集

  • 图像下载: 可从 此链接 下载。
  • 图像设置: 解压后,将 text2image_evaluation/img 文件夹放置在 D3PO 数据集的 csv 文件同一目录。
AI搜集汇总
数据集介绍
main_image_url
构建方式
TIFA、AIGCIQA2023、ECCV_Caption和D3PO数据集的构建均基于人类反馈的奖励模型,旨在评估图像生成模型的组合性。TIFA和AIGCIQA2023的图像数据通过Google Drive提供下载,解压后分别生成`annotated_images`和`allimg`文件夹。ECCV_Caption的图像数据则来源于COCO2014验证集,需下载并解压`val2014`文件夹。D3PO的图像数据同样通过Google Drive获取,解压后需确保`text2image_evaluation/img`文件夹与CSV文件位于同一目录。
使用方法
使用这些数据集时,首先需下载并解压相应的图像数据,确保图像文件夹与CSV文件位于同一目录。对于TIFA和AIGCIQA2023,分别需要`annotated_images`和`allimg`文件夹;ECCV_Caption需要`val2014`文件夹;D3PO则需要`text2image_evaluation/img`文件夹。通过读取CSV文件中的偏好排序数据,研究人员可以结合图像数据对图像生成模型的组合性进行深入分析和评估。
背景与挑战
背景概述
TIFA、AIGCIQA2023、ECCV_Caption和D3PO数据集是近年来在人工智能与计算机视觉领域备受关注的数据资源,旨在推动基于人类反馈的奖励模型在组合性任务中的应用。这些数据集由多个研究团队共同构建,涵盖了图像生成、质量评估、图像描述等多个研究方向。TIFA和AIGCIQA2023数据集聚焦于图像生成与质量评估,ECCV_Caption则侧重于图像描述的偏好排序,而D3PO则进一步扩展了文本到图像生成任务的评估范围。这些数据集的创建为相关领域的研究提供了丰富的实验数据,推动了生成模型与人类反馈机制的深度融合。
当前挑战
这些数据集在构建与应用过程中面临多重挑战。在领域问题方面,如何准确捕捉人类对图像生成与描述的偏好,并将其转化为可量化的奖励信号,是一个核心难题。此外,图像生成与描述任务本身具有高度主观性,如何设计有效的评估指标以反映人类真实感知仍需深入探索。在数据集构建过程中,数据采集与标注的复杂性也不容忽视。例如,TIFA和AIGCIQA2023需要大量人工标注以生成偏好排序数据,而ECCV_Caption则依赖于COCO数据集的扩展,数据一致性与质量控制的难度较高。D3PO在文本到图像生成任务中,还需解决生成图像与文本语义对齐的挑战。这些问题的解决对提升数据集的应用价值至关重要。
常用场景
经典使用场景
在计算机视觉与自然语言处理的交叉领域,TIFA、AIGCIQA2023、ECCV_Caption和D3PO数据集被广泛应用于图像生成与文本描述的质量评估。这些数据集通过提供详细的偏好排序数据,帮助研究者训练和验证模型在生成图像与文本描述时的表现。特别是在多模态任务中,这些数据集为模型提供了丰富的训练样本,使其能够更好地理解图像与文本之间的复杂关系。
解决学术问题
这些数据集有效解决了生成模型在图像与文本描述任务中的评估难题。通过提供人类反馈的偏好排序数据,研究者能够更准确地衡量生成模型的质量与一致性。这不仅提升了模型在生成任务中的表现,还为多模态学习领域提供了新的研究方向,推动了生成模型在复杂场景中的应用。
实际应用
在实际应用中,TIFA、AIGCIQA2023、ECCV_Caption和D3PO数据集被广泛用于图像生成、文本描述生成以及多模态任务的质量控制。例如,在广告设计、虚拟现实和游戏开发中,这些数据集帮助开发者优化生成内容的质量,确保其符合用户需求。此外,它们还被用于教育领域,辅助生成教学材料,提升学习体验。
数据集最近研究
最新研究方向
在人工智能生成内容(AIGC)领域,TIFA、AIGCIQA2023、ECCV_Caption和D3PO数据集的最新研究方向聚焦于基于人类反馈的奖励模型构建与组合性评估。这些数据集通过提供详细的偏好排名数据,支持研究者探索生成模型在图像描述、文本生成等任务中的表现。特别是TIFA和AIGCIQA2023数据集,通过标注图像和偏好数据,为生成模型的优化提供了重要依据。ECCV_Caption数据集则结合COCO2014验证集,进一步推动了图像描述生成的研究。D3PO数据集则专注于文本到图像生成任务的评估,为多模态生成模型的性能提升提供了关键支持。这些数据集的研究不仅推动了生成模型的技术进步,也为人工智能在创意领域的应用奠定了坚实基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

YOLO-dataset

该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。

github 收录

Google Scholar

Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。

scholar.google.com 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

jpft/danbooru2023

Danbooru2023是一个大规模的动漫图像数据集,包含超过500万张由爱好者社区贡献并详细标注的图像。图像标签涵盖角色、场景、版权、艺术家等方面,平均每张图像有30个标签。该数据集可用于训练图像分类、多标签标注、角色检测、生成模型等多种计算机视觉任务。数据集基于danbooru2021构建,扩展至包含ID #6,857,737的图像,增加了超过180万张新图像,总大小约为8TB。图像以原始格式提供,分为1000个子目录,使用图像ID的模1000进行分桶,以避免文件系统性能问题。

hugging_face 收录