five

图律脉动数据集-放大、缩小

收藏
魔搭社区2026-05-16 更新2025-04-12 收录
下载链接:
https://modelscope.cn/datasets/DiffSynth-Studio/ImagePulse-ZoominZoomout
下载链接
链接失效反馈
官方服务:
资源简介:
# 图律脉动数据集-放大、缩小 本数据集由开源项目 [ImagePulse](https://github.com/modelscope/ImagePulse) 构建,可用于训练超分辨率和扩图任务。 主要字段说明: * `image_1`: 图像1 * `image_cropped`: 裁剪图像,从图像1中裁剪出的部分 * `image_2`: 图像2,将裁剪图像放大得到的图像 * `mask`: 图像2所覆盖的图像1区域 * `editing_instruction`: 将图像1编辑成图像2所需的文本指令 * `reverse_editing_instruction`: 将图像2编辑成图像1所需的文本指令 数据集构建流程: * 在数据集 [DiffusionDB](https://modelscope.cn/datasets/AI-ModelScope/diffusiondb) 中随机抽取提示词 * 用 [FLUX](https://modelscope.cn/models/black-forest-labs/FLUX.1-dev) 模型根据提示词生成图像1 * 用 [Qwen-VL](https://modelscope.cn/models/Qwen/Qwen2.5-VL-72B-Instruct) 模型以 bbox 格式标注出图像1中的实体,并随机裁剪某一区域得到裁剪图像 * 用 [Qwen-VL](https://modelscope.cn/models/Qwen/Qwen2.5-VL-72B-Instruct) 编写裁剪部分的提示词 * 用 [FLUX](https://modelscope.cn/models/black-forest-labs/FLUX.1-dev) 和 [Upscaler-ControlNet](https://modelscope.cn/models/jasperai/Flux.1-dev-Controlnet-Upscaler) 放大选中的区域,得到图像2 * 用 [Qwen-VL](https://modelscope.cn/models/Qwen/Qwen2.5-VL-72B-Instruct) 模型重新生成对偶编辑指令 数据样例: |image_1|image_2|image_cropped|mask|editing_instruction|reverse_editing_instruction| |-|-|-|-|-|-| |![](examples/1744017806213212210.png)|![](examples/1744017806661371148.png)|![](examples/1744017807087521895.png)|![](examples/1744017807158059796.png)|Zoom in to focus on the headband.|Zoom out to show the full view of the anime girl.| |![](examples/1744018155020381346.png)|![](examples/1744018155427860250.png)|![](examples/1744018155855043024.png)|![](examples/1744018156047318211.png)|Remove the superhero costume and replace it with a red shirt. Adjust the lighting to highlight the man's face.|Add a superhero costume with a red and yellow emblem on the chest and a red cape. Adjust the lighting to emphasize the costume.| |![](examples/1744022952566167918.png)|![](examples/1744022953056227755.png)|![](examples/1744022953542855348.png)|![](examples/1744022953578925049.png)|Remove the elephant and replace it with a large rock.|Replace the large rock with an elephant.|

# 图律脉动数据集-放大、缩小 本数据集由开源项目 ImagePulse 构建,可用于超分辨率与图像扩图任务的模型训练。 主要字段说明: * `image_1`:图像1 * `image_cropped`:裁剪图像,即从图像1中裁剪得到的区域图像 * `image_2`:图像2,即对裁剪图像进行放大处理后得到的图像 * `mask`:图像2所覆盖的图像1区域的掩码图像 * `editing_instruction`:将图像1编辑为图像2所需的文本指令 * `reverse_editing_instruction`:将图像2编辑为图像1所需的文本指令 数据集构建流程: * 从数据集 DiffusionDB 中随机抽取提示词 * 利用 FLUX 模型根据抽取的提示词生成图像1 * 使用 Qwen-VL 模型以边界框(bbox)格式标注图像1中的实体,并随机裁剪某一区域得到裁剪图像 * 通过 Qwen-VL 模型编写针对裁剪区域的提示词 * 结合 FLUX 与 Upscaler-ControlNet 模型对选中区域进行放大处理,得到图像2 * 借助 Qwen-VL 模型重新生成对偶编辑指令 数据样例: |image_1|image_2|image_cropped|mask|editing_instruction|reverse_editing_instruction| |-|-|-|-|-|-| |![](examples/1744017806213212210.png)|![](examples/1744017806661371148.png)|![](examples/1744017807087521895.png)|![](examples/1744017807158059796.png)|放大以聚焦于发带。|缩小以展示该动漫少女的完整画面。| |![](examples/1744018155020381346.png)|![](examples/1744018155427860250.png)|![](examples/1744018155855043024.png)|![](examples/1744018156047318211.png)|移除超级英雄制服,替换为红色衬衫,并调整光线以突出男子面部。|添加带有红黄胸徽与红色披风的超级英雄制服,并调整光线以突出该制服。| |![](examples/1744022952566167918.png)|![](examples/1744022953056227755.png)|![](examples/1744022953542855348.png)|![](examples/1744022953578925049.png)|移除大象并替换为一块巨石。|将巨石替换为大象。|
提供机构:
maas
创建时间:
2025-04-07
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集由ImagePulse开源项目构建,专门用于超分辨率和图像放大任务的训练。它提供图像对(包括原始图像、裁剪区域及放大版本)以及相应的文本编辑指令,数据通过从DiffusionDB选取提示词,并利用FLUX、Qwen-VL和Upscaler-ControlNet等模型生成和标注而构建。数据集采用Apache License 2.0许可证,大小约353.60GB,已更新至2025年4月。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务