five

API

收藏
github2024-05-31 收录
下载链接:
https://github.com/Kiteretsu77/APISR
下载链接
链接失效反馈
官方服务:
资源简介:
API(Anime Production-oriented Image)数据集由密歇根大学、耶鲁大学和浙江大学联合创建,旨在解决现实世界中动漫图像超分辨率问题。研究人员通过深入分析动漫生产流程,提出了一种新的动漫图像收集流程,选取视频中压缩程度最低、信息量最丰富的帧,以此构建数据集,从而有效避免了视频传输和物理老化导致的手绘线条弱化问题。API数据集包含了3,740张高质量的动漫图像,这些图像经过精心筛选,确保了数据的多样性和复杂性。该数据集的应用领域广泛,特别是在娱乐和商业领域,对于提升动漫图像的视觉质量和清晰度具有重要意义。

The API (Anime Production-oriented Image) dataset was jointly created by the University of Michigan, Yale University, and Zhejiang University, aiming to address the real-world super-resolution problem for anime images. By thoroughly analyzing the anime production pipeline, the researchers proposed a novel anime image collection workflow, selecting the frames with the lowest compression level and the richest information content from videos to construct the dataset, thus effectively avoiding the weakening of hand-drawn lines caused by video transmission and physical aging. The API dataset contains 3,740 high-quality anime images, which have been carefully screened to ensure the data's diversity and complexity. This dataset has a wide range of application scenarios, especially in the entertainment and commercial fields, and is of great significance for improving the visual quality and clarity of anime images.
提供机构:
密歇根大学、耶鲁大学和浙江大学
原始信息汇总

APISR: Anime Production Inspired Real-World Anime Super-Resolution

概述

APISR是一个图像和视频放大器,旨在恢复和增强来自现实世界场景的各种退化的低质量低分辨率动漫图像和视频源。

更新

  • 已发布APISR论文版本的实现
  • 已发布不同放大因子的权重(2x, 4x等)
  • 已添加Gradio演示(在线)
  • 已提供不同架构(DAT-Small)的权重
  • 已添加与Toon Crafter结合的结果

可视化

提供了多个动漫图像的超分辨率结果,包括EVA、Pokemon、Gundam0079等。

安装

  • 克隆项目仓库
  • 创建conda环境
  • 安装Pytorch和其他所需包
  • 安装FFMPEG(仅在训练和数据集准备阶段需要)

推理

  • Gradio快速推理:在线演示可在HuggingFace或Colab找到
  • 常规推理:下载模型权重并执行inference.py脚本

数据集准备

  • 使用dataset_curation_pipeline收集和准备数据集
  • 下载IC9600权重并执行collect.py脚本
  • 运行prepare_datasets.sh脚本进行数据集预处理

训练

  • 准备预处理的数据集
  • 执行train.py脚本进行网络L1损失训练
  • 执行train.py脚本进行GAN对抗训练,需指定预训练路径

引用

如果APISR对您的研究有用,请引用我们的工作。

许可证

本项目基于GPL 3.0许可证发布。

搜集汇总
数据集介绍
main_image_url
构建方式
APISR数据集的构建基于对真实世界中低质量、低分辨率动漫图像和视频的恢复与增强需求。该数据集通过收集多种降质场景下的动漫视频源,利用IC9600权重进行图像复杂度评分,筛选出最具信息量的图像。随后,通过预处理步骤生成伪GT(Ground Truth)图像,并进行降质处理以生成训练所需的低分辨率图像。整个过程确保了数据集的多样性和真实性,为模型训练提供了丰富的数据支持。
使用方法
APISR数据集的使用方法包括数据集的下载、预处理以及模型训练。用户可以通过执行脚本对视频源进行处理,生成训练所需的图像数据集。在模型训练阶段,用户可以根据需求调整超参数,并选择合适的训练策略,如L1损失训练和GAN对抗训练。此外,数据集还提供了在线演示和本地推理选项,用户可以通过Gradio或常规推理脚本进行快速验证和应用。
背景与挑战
背景概述
APISR数据集,全称为Anime Production Inspired Real-World Anime Super-Resolution,由Wang, Boyang等人于2024年创建,旨在解决低质量、低分辨率动漫图像和视频在真实世界场景中的恢复与增强问题。该数据集的核心研究问题是如何有效地提升动漫内容的视觉质量,特别是在存在多种降质因素的情况下。APISR的开发不仅推动了动漫超分辨率技术的发展,还为相关领域的研究人员提供了一个宝贵的资源,以探索和验证新的图像处理算法。
当前挑战
APISR数据集在构建过程中面临多项挑战。首先,如何从真实世界的动漫视频源中提取出具有代表性的低质量图像样本,是一个复杂且耗时的任务。其次,数据集的多样性要求涵盖各种降质类型,如压缩失真、噪声和模糊等,这增加了数据预处理的难度。此外,为了确保训练模型的有效性,数据集需要包含高质量的参考图像,以便进行精确的对比和评估。最后,如何在有限的计算资源下高效地进行数据集的构建和模型的训练,也是一项重要的挑战。
常用场景
经典使用场景
APISR数据集的经典使用场景主要集中在动漫图像和视频的超分辨率增强。该数据集通过提供高质量的动漫图像和视频,使得研究人员和开发者能够训练和验证其超分辨率算法,特别是在处理低质量、低分辨率的动漫内容时。这种应用不仅提升了图像和视频的视觉质量,还为动漫制作和后期处理提供了技术支持。
解决学术问题
APISR数据集解决了动漫图像和视频超分辨率领域的多个学术研究问题。首先,它填补了高质量动漫数据集的空白,为研究人员提供了丰富的训练和测试资源。其次,通过模拟真实世界的图像退化,该数据集帮助研究者开发出更鲁棒的超分辨率算法,特别是在处理复杂纹理和动态场景时。此外,APISR还推动了GAN和深度学习技术在动漫领域的应用,提升了算法的实际效果和应用价值。
实际应用
在实际应用中,APISR数据集被广泛用于动漫制作、视频编辑和游戏开发等领域。例如,动漫制作公司可以利用该数据集训练的模型来提升老旧动漫作品的画质,使其更适合现代观众的观看需求。视频编辑软件则可以集成APISR技术,帮助用户快速提升视频质量,减少后期处理的时间和成本。此外,游戏开发者也可以利用该技术提升游戏画面的细节和清晰度,增强玩家的沉浸感。
数据集最近研究
最新研究方向
在动漫图像与视频超分辨率领域,APISR数据集的最新研究方向主要集中在提升低质量、低分辨率动漫图像和视频的恢复与增强效果。该研究不仅关注于传统的图像放大技术,还引入了真实世界场景中的多种退化因素,如噪声、模糊和压缩失真等。通过结合扩散生成图像和GAN对抗训练等前沿技术,APISR旨在实现更为自然和高质量的超分辨率效果。此外,该研究还探索了不同架构(如DAT-Small)和不同放大因子(如2x、4x)的权重优化,以适应多样化的应用需求。这些研究成果不仅推动了动漫图像处理技术的发展,也为相关领域的研究和应用提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作