图律脉动数据集-放大、缩小
收藏魔搭社区2026-05-16 更新2025-04-12 收录
下载链接:
https://modelscope.cn/datasets/DiffSynth-Studio/ImagePulse-ZoominZoomout
下载链接
链接失效反馈官方服务:
资源简介:
# 图律脉动数据集-放大、缩小
本数据集由开源项目 [ImagePulse](https://github.com/modelscope/ImagePulse) 构建,可用于训练超分辨率和扩图任务。
主要字段说明:
* `image_1`: 图像1
* `image_cropped`: 裁剪图像,从图像1中裁剪出的部分
* `image_2`: 图像2,将裁剪图像放大得到的图像
* `mask`: 图像2所覆盖的图像1区域
* `editing_instruction`: 将图像1编辑成图像2所需的文本指令
* `reverse_editing_instruction`: 将图像2编辑成图像1所需的文本指令
数据集构建流程:
* 在数据集 [DiffusionDB](https://modelscope.cn/datasets/AI-ModelScope/diffusiondb) 中随机抽取提示词
* 用 [FLUX](https://modelscope.cn/models/black-forest-labs/FLUX.1-dev) 模型根据提示词生成图像1
* 用 [Qwen-VL](https://modelscope.cn/models/Qwen/Qwen2.5-VL-72B-Instruct) 模型以 bbox 格式标注出图像1中的实体,并随机裁剪某一区域得到裁剪图像
* 用 [Qwen-VL](https://modelscope.cn/models/Qwen/Qwen2.5-VL-72B-Instruct) 编写裁剪部分的提示词
* 用 [FLUX](https://modelscope.cn/models/black-forest-labs/FLUX.1-dev) 和 [Upscaler-ControlNet](https://modelscope.cn/models/jasperai/Flux.1-dev-Controlnet-Upscaler) 放大选中的区域,得到图像2
* 用 [Qwen-VL](https://modelscope.cn/models/Qwen/Qwen2.5-VL-72B-Instruct) 模型重新生成对偶编辑指令
数据样例:
|image_1|image_2|image_cropped|mask|editing_instruction|reverse_editing_instruction|
|-|-|-|-|-|-|
|||||Zoom in to focus on the headband.|Zoom out to show the full view of the anime girl.|
|||||Remove the superhero costume and replace it with a red shirt. Adjust the lighting to highlight the man's face.|Add a superhero costume with a red and yellow emblem on the chest and a red cape. Adjust the lighting to emphasize the costume.|
|||||Remove the elephant and replace it with a large rock.|Replace the large rock with an elephant.|
# 图律脉动数据集-放大、缩小
本数据集由开源项目 ImagePulse 构建,可用于超分辨率与图像扩图任务的模型训练。
主要字段说明:
* `image_1`:图像1
* `image_cropped`:裁剪图像,即从图像1中裁剪得到的区域图像
* `image_2`:图像2,即对裁剪图像进行放大处理后得到的图像
* `mask`:图像2所覆盖的图像1区域的掩码图像
* `editing_instruction`:将图像1编辑为图像2所需的文本指令
* `reverse_editing_instruction`:将图像2编辑为图像1所需的文本指令
数据集构建流程:
* 从数据集 DiffusionDB 中随机抽取提示词
* 利用 FLUX 模型根据抽取的提示词生成图像1
* 使用 Qwen-VL 模型以边界框(bbox)格式标注图像1中的实体,并随机裁剪某一区域得到裁剪图像
* 通过 Qwen-VL 模型编写针对裁剪区域的提示词
* 结合 FLUX 与 Upscaler-ControlNet 模型对选中区域进行放大处理,得到图像2
* 借助 Qwen-VL 模型重新生成对偶编辑指令
数据样例:
|image_1|image_2|image_cropped|mask|editing_instruction|reverse_editing_instruction|
|-|-|-|-|-|-|
|||||放大以聚焦于发带。|缩小以展示该动漫少女的完整画面。|
|||||移除超级英雄制服,替换为红色衬衫,并调整光线以突出男子面部。|添加带有红黄胸徽与红色披风的超级英雄制服,并调整光线以突出该制服。|
|||||移除大象并替换为一块巨石。|将巨石替换为大象。|
提供机构:
maas
创建时间:
2025-04-07
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集由ImagePulse开源项目构建,专门用于超分辨率和图像放大任务的训练。它提供图像对(包括原始图像、裁剪区域及放大版本)以及相应的文本编辑指令,数据通过从DiffusionDB选取提示词,并利用FLUX、Qwen-VL和Upscaler-ControlNet等模型生成和标注而构建。数据集采用Apache License 2.0许可证,大小约353.60GB,已更新至2025年4月。
以上内容由遇见数据集搜集并总结生成



