FIG

Hugging Face2025-10-29 更新2025-10-30 收录

下载链接：

https://huggingface.co/datasets/TyangJN/FIG

下载链接

链接失效反馈

官方服务：

资源简介：

ORIG数据集是一个用于事实图像生成的事实图像生成评估系统。该数据集通过迭代地从网络中检索多模态证据，并逐步将精炼的知识整合到丰富的提示中，以指导图像生成。数据集包含10个类别，涉及动物、文化、事件、食物、地标、人物、植物、产品、体育和交通等方面。

创建时间：

2025-10-24

原始信息汇总

FIG数据集概述

数据集基本信息

许可证: Apache-2.0
语言: 英语、中文
标签: agent
数据规模: 1K<n<10K

数据集配置

Prompts配置

数据文件: prompts.jsonl
分割: prompt

Reference配置

包含10个类别的参考数据：

Animal: txt/animal/animal_reference.jsonl
Culture: txt/culture/culture_reference.jsonl
Event: txt/event/event_reference.jsonl
Food: txt/food/food_reference.jsonl
Landmarks: txt/landmarks/landmarks_reference.jsonl
People: txt/people/people_reference.jsonl
Plant: txt/plant/plant_reference.jsonl
Product: txt/product/product_reference.jsonl
Sports: txt/sports/sports_reference.jsonl
Transportation: txt/transportation/transportation_reference.jsonl

Evaluation配置

包含10个类别的评估数据：

Animal: txt/animal/animal_evaluation.jsonl
Culture: txt/culture/culture_evaluation.jsonl
Event: txt/event/event_evaluation.jsonl
Food: txt/food/food_evaluation.jsonl
Landmarks: txt/landmarks/landmarks_evaluation.jsonl
People: txt/people/people_evaluation.jsonl
Plant: txt/plant/plant_evaluation.jsonl
Product: txt/product/product_evaluation.jsonl
Sports: txt/sports/sports_evaluation.jsonl
Transportation: txt/transportation/transportation_evaluation.jsonl

Images配置

数据文件: img/img_reference.jsonl
分割: Reference

数据集用途

该数据集支持事实性图像生成（FIG）任务的系统评估，涵盖感知、组合和时间维度。

数据集类别

Animal: 生命周期、行为、栖息地
Culture: 传统、文物、仪式
Event: 历史时刻、庆祝活动
Food: 传统菜肴、制作过程
Landmarks: 著名建筑、地点
People: 历史人物、职业
Plant: 生长阶段、物种
Product: 设计演变、用途
Sports: 规则、装备、技术
Transportation: 车辆演变、操作

搜集汇总

数据集介绍

构建方式

在构建多模态检索增强图像生成数据集时，研究者采用了系统化的方法，通过开放网络动态检索最新信息，并整合文本与图像证据。该过程涉及多轮迭代的证据收集与筛选，确保数据覆盖感知、组合和时间等多个维度。数据集划分为提示、参考和评估三个主要配置，每个配置下细分为动物、文化、事件等十个类别，以支持全面的基准测试。

特点

该数据集具备多模态融合的显著特点，能够结合文本与视觉信息进行事实性验证。其涵盖十个广泛领域，包括动物生命周期、文化传统和交通工具演变等，提供了丰富的语义层次。数据集支持动态更新机制，通过开放网络检索确保信息的时效性，同时采用迭代式证据整合策略，有效提升生成内容的准确性和一致性。

使用方法

用户可通过加载预配置的数据集文件，快速访问不同类别的参考与评估数据。利用提供的管道接口，能够灵活选择检索模型和生成后端，实现多轮证据增强的图像生成。数据集支持本地模型部署，允许自定义检索轮次和批量处理，适用于复杂查询场景下的系统性实验与性能评估。

背景与挑战

背景概述

在人工智能领域，多模态模型的发展虽已实现高度逼真的图像生成，却难以保证生成内容与可验证事实的一致性。为应对这一挑战，研究团队于2024年提出了FIG数据集，聚焦于事实性图像生成任务。该数据集由TyangJN等学者构建，通过开放式多模态检索增强框架，将动态网络信息与视觉生成过程深度融合，覆盖动物、文化、事件等十大知识范畴，显著提升了生成图像在细粒度属性和时效性事件中的事实准确性。

当前挑战

FIG数据集致力于解决多模态生成模型中事实一致性不足的核心难题，其构建面临双重挑战：在领域层面，需克服传统静态知识库对动态演变的现实世界表征的局限性；在技术实现中，则需设计高效的跨模态证据检索机制，并建立能够同步评估视觉质量与事实准确性的多维基准体系。

常用场景

经典使用场景

在跨模态生成研究领域，FIG数据集为评估多模态检索增强的图像生成系统提供了标准化基准。该数据集涵盖动物、文化、事件等十个精细分类，每个类别均包含详实的参考文本与评估标准，能够全面检验模型在感知真实性、组合逻辑性和时间准确性等维度的表现。研究人员通过该数据集可系统评估生成图像与客观事实的一致性，推动多模态理解与生成技术的深度融合。

实际应用

在现实应用层面，FIG数据集支撑的检索增强技术已广泛应用于新闻媒体内容生成、教育可视化材料制作等领域。媒体机构可利用该技术生成具有准确历史背景的新闻配图，教育工作者能快速创建符合科学事实的教学示意图。电子商务平台也借助此类技术生成真实反映产品细节的商品展示图，显著提升了数字内容生产的准确性与效率。

衍生相关工作

基于FIG数据集的研究催生了多模态检索增强生成的技术范式，相关经典工作包括动态知识融合框架、迭代式证据筛选机制等创新方法。这些研究深化了开放域知识获取与视觉内容生成的协同机制理解，推动了如时序一致性生成模型、跨模态事实验证系统等衍生方向的发展，为构建下一代可信赖的多模态人工智能系统提供了重要技术支撑。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集