five

Sking

收藏
Hugging Face2026-05-31 更新2026-06-01 收录
下载链接:
https://huggingface.co/datasets/EntropyDrop/Sking
下载链接
链接失效反馈
官方服务:
资源简介:
Sking是一个专门用于Minecraft皮肤生成与处理的数据集,集成了完整的3D渲染与数据预处理流水线。该数据集旨在支持文本到图像和图像到图像任务,特别是针对Minecraft角色皮肤的生成与编辑。数据集的核心内容围绕64x64像素的RGBA格式Minecraft皮肤纹理展开,通过自动化处理流程,原始皮肤纹理被转换为多种形式:包括格式标准化(自动检测并转换Alex格式为Steve格式)、3D体素渲染引擎将2D纹理转换为3D体素角色网格(支持核心层和装饰层的双图层渲染),最终生成768x768像素的复合布局图像,该图像同时包含原始2D皮肤纹理和17个预配置的3D渲染视角(涵盖行走、闲置、背视图、特写及图层切换角度)。数据集还包含用于高级ControlNet训练框架的标准化控制图像(1024x1024透明画布),以及通过专用提取器从合成图像中恢复的64x64皮肤UV贴图。处理流程解决了体素边缘纹理一致性问题,并提供了皮肤水平翻转、前视图数据集切片、皮肤合并等实用功能。整个数据集通过多线程批处理管道生成,支持并行处理,并配备了RESTful FastAPI服务,便于从训练目标图像中提取可用的皮肤纹理。数据集适用于Minecraft皮肤生成、3D角色建模、纹理合成、多视角图像生成等计算机视觉和图形学任务。

Sking is a dataset specifically designed for Minecraft skin generation and processing, integrating a complete 3D rendering and data preprocessing pipeline. The dataset aims to support text-to-image and image-to-image tasks, particularly for the generation and editing of Minecraft character skins. The core content revolves around 64x64 pixel RGBA format Minecraft skin textures. Through an automated processing workflow, original skin textures are converted into multiple forms: first, format standardization automatically detects and converts Alex format (3-pixel arm width) to Steve format (4-pixel arm width); then, a 3D voxel rendering engine transforms 2D textures into 3D voxel character meshes, supporting dual-layer rendering for core layers (base body) and decorative layers (jacket, sleeves, pants, hat); finally, generating 768x768 pixel composite layout images that include both the original 2D skin texture and 17 pre-configured 3D rendering perspectives (covering walking, idle, back view, close-up, and layer switching angles). The dataset also includes standardized control images (1024x1024 transparent canvas) for advanced ControlNet training frameworks, as well as 64x64 skin UV maps recovered from synthetic images via a dedicated extractor. The processing workflow addresses voxel edge texture consistency issues and provides practical functions such as skin horizontal flipping, front-view dataset slicing (retaining the left half), and skin merging (combining the head of skin A with the body/limbs of skin B). The entire dataset is generated through a multi-threaded batch processing pipeline, supports parallel processing, and is equipped with a RESTful FastAPI service for extracting usable skin textures from training target images. The dataset is suitable for computer vision and graphics tasks such as Minecraft skin generation, 3D character modeling, texture synthesis, and multi-view image generation.
创建时间:
2026-05-26
原始信息汇总

数据集概述:Sking

  • 数据集名称: Sking
  • 语言: 英语 (en)
  • 许可证: AGPL-3.0
  • 任务类别: 文本到图像 (text-to-image), 图像到图像 (image-to-image)
  • 标签: minecraft, 3d, voxel, minecraft-skin, texture, dataset-generation

核心功能与用途

该数据集及相关管道专为训练和微调 Sking Model 而设计,是一个完整的 Minecraft 皮肤 3D 体素渲染与数据集预处理流水线。主要功能包括:

  • 3D 体素渲染 (mc_render.py): 基于 PyVista (VTK) 将 2D 皮肤纹理转换为 3D 体素角色网格,支持双层渲染(核心层与装饰层)、肢体关节参数化旋转、交互式光照模式及正交/透视投影。
  • 体素纹理一致性解析器 (mc_voxel_texture_resolver.py): 解决双层皮肤在 3D 体素化过程中的视觉间隙伪影,按优先级顺序自动填充相邻透明面。
  • 布局标准化:Alex-to-Steve (alice_to_steve.py): 自动检测并转换细臂(Alex)皮肤为标准(Steve)格式,统一数据集特征。
  • 多视图布局烘焙 (build_target_img.py): 生成 768x768 的复合布局图像,包含 2D 皮肤纹理及 17 个预配置的 3D 渲染视口。
  • 批量处理管道 (build_target_imgs.py): 利用多线程并行处理批量渲染任务。
  • 皮肤 UV 图提取 (extract_skin.py): 从合成训练目标图像中裁剪并提取 64x64 的皮肤 UV 图,支持命令行与 FastAPI 微服务模式。
  • 条件图像格式化 (force_resize_control_imgs.py): 自动重采样并将控制图像居中放置于 1024x1024 的透明画布中。
  • 水平翻转 (ext_flip_img.py): 对角色前/后视图进行水平翻转,并正确镜像皮肤 UV 图。
  • 前视图数据集切片 (make_half_dataset.py): 生成仅包含前视图的子集,用于训练。
  • 皮肤合并工具 (merge_skins.py): 将皮肤 A 的头部与皮肤 B 的身体/四肢合并。

项目结构

Sking/ ├── mc_render.py # 核心3D引擎 ├── mc_voxel_texture_resolver.py # 体素纹理修补器 ├── alice_to_steve.py # Alex到Steve转换算法 ├── build_target_img.py # 单皮肤多视图布局烘焙 ├── build_target_imgs.py # 并发批量渲染管道 ├── extract_skin.py # UV图提取CLI与FastAPI服务 ├── force_resize_control_imgs.py # 控制图重采样与画布标准化 ├── ext_flip_img.py # 视图翻转与UV镜像 ├── make_half_dataset.py # 前视图数据集切片 ├── merge_skins.py # 皮肤合并工具 ├── skin-mask.png # 核心层像素空间映射掩码 ├── skin-decor-mask.png # 装饰层像素空间映射掩码 ├── skins/ # 原始输入皮肤目录 ├── target_imgs_v73/ # 烘焙多视图布局输出目录 ├── control_imgs/ # 条件控制图处理目录 └── control_imgs_v2/ # 多视图布局控制图目录

系统要求与安装

  • 前提条件: Python 3.8 或更高版本,建议使用虚拟环境。

  • 安装依赖: bash pip install pyvista numpy pillow fastapi uvicorn opencv-python pydantic

  • 无头环境注意: 在无图形界面的服务器上运行需使用 xvfb-run 等虚拟帧缓冲工具。

相关资源

搜集汇总
数据集介绍
main_image_url
构建方式
Sking数据集的构建依赖于一套完整的自动化流水线,该流水线以2D Minecraft皮肤纹理为输入,通过PyVista引擎实现双层3D体素渲染,将基础层与装饰层融合并支持多视角参数化配置。系统内置Alex至Steve格式的动态检测与转换模块,通过像素列投影复制解决手臂宽度差异。进一步地,采用3D体素投影映射算法自动填充透明相邻面产生的视觉缝隙,确保渲染一致性。最终,经box filtering升采样的64x64纹理与17个预设3D视口被烘焙为768x768的复合布局图像,构成训练目标。批处理流程通过多线程池管理独立子进程,支持多核并行运算,大幅提升数据生成效率。
特点
该数据集具有鲜明的技术特性,其核心在于对Minecraft皮肤这一非连续纹理空间实现了精细的3D体素化表征。独特的双层渲染机制清晰分离了身体核心与装饰层,为生成模型提供了结构化的视觉线索。数据布局中融入了17种包含行走、待机、背面、特写及图层切换的多角度视角,极大丰富了姿态多样性。此外,系统提供了一套完整的控制信号格式化工具,包括1024x1024标准画布重采样、水平翻转与UV图镜像,以及前端视图切分,确保与ControlNet等先进框架无缝兼容。叠加的白色Alpha指示器技术,则巧妙地将透明度信息编码为生成模型的条件信号。
使用方法
使用Sking数据集主要依赖其配套的Python脚本与REST API。用户可通过`build_target_img.py`对单张皮肤执行完整流水线,生成多视角复合布局;或利用`build_target_imgs.py`实现批量并行处理。`extract_skin.py`提供命令行与FastAPI两种模式,用于从合成训练目标中恢复出干净的64x64 UV贴图,API端点接受Base64编码图像并返回同样编码的皮肤图。对于数据增强,`ext_flip_img.py`可水平翻转角色视图并同步镜像UV图;`make_half_dataset.py`则通过水平切分生成仅含正面视图的子集。所有运算流程均经过参数化封装,适配Headless环境并支持xvfb-run执行。
背景与挑战
背景概述
在虚拟数字人资产创作领域,Minecraft皮肤作为最具代表性的体素化角色外观载体,其自动化生成与渲染长期面临标准化缺失与技术孤岛困境。Sking数据集由EntropyDrop团队于2024年创建,聚焦于解决Minecraft皮肤从二维纹理到三维体素渲染的全流程数据构建问题。该数据集不仅包含海量经过格式标准化的64×64 RGBA皮肤UV贴图,更创新性地提供了配套的17视角多视图合成布局、体素边缘纹理一致性修补算法以及Alex/Steve双体型自动转换流水线。通过将PyVista驱动的三维体素渲染引擎与FastAPI微服务架构相结合,Sking首次为生成式模型训练提供了端到端的结构化数据基准,显著降低了体素风格条件控制模型(如ControlNet)的数据准备门槛,在游戏AI与体素内容生成领域具有奠基性影响。
当前挑战
该数据集面临的核心挑战源自Minecraft皮肤的双层体素渲染机制:当透明外层(如夹克、帽子)附着于内层身体表面时,相邻体素面因透明导致渲染间隙,形成视觉伪影。为克服这一领域问题,Sking设计了基于优先级序列(前→后→顶→底→左→右)的三维体素投影映射算法,自动填充缺失面,但该方案在复杂重叠结构(如多层配饰)中仍存在映射歧义。构建过程中,团队需解决Alex纤细手臂(3像素宽)向Steve标准(4像素宽)的格式转换难题,通过像素列投影与复制映射实现了无损适配。此外,多视角布局烘培需在768×768复合图像中精确编排17个视口,同时保证光照参数可调与透明度信息无损传递,对渲染管线的并行处理效率与内存管理提出了极高要求。
常用场景
经典使用场景
在数字内容创作与游戏研究领域,Sking数据集为基于体素的三维角色生成提供了独特的资源支撑。该数据集聚焦于Minecraft皮肤的双层纹理结构,通过整合64×64像素的二维UV映射与三维体素渲染,构建了包含17个预设视角的768×768复合布局图像。其经典使用场景围绕从二维皮肤纹理到三维体素角色的自动化管线展开,为生成式模型提供了结构化的配对数据,特别适用于文本引导的图像生成与图像到图像的翻译任务。
解决学术问题
Sking数据集着重解决了二维纹理到三维体素模型映射中的核心学术难题,包括双层体素渲染时相邻面的视觉间隙伪影问题,以及Alex与Steve模型间手臂宽度差异的标准化转换。通过体素投影映射算法和像素列复制映射方法,数据集消除了透明面片间的裂缝效应,确保了纹理的一致性。这些突破为计算机视觉领域的三维体素生成、纹理语义对齐及多视角渲染提供了基准研究平台,推动了可控体素内容生成的理论进展。
衍生相关工作
围绕Sking数据集,研究者已发展出一系列衍生工作,推动了体素生成技术的演进。其中,基于该数据集训练的Sking模型展示了从文字描述到完整三维角色的生成能力,而ControlNet框架的适配版本则利用该数据的标准化控制图像实现了更精细的姿态与视角调控。此外,数据集的横向翻转与前半视角切片工具进一步扩展了数据增强策略,为后续的域适应、少样本学习等研究奠定了数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作