Dusduo/1stGen-Pokemon-Images
收藏Hugging Face2023-12-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Dusduo/1stGen-Pokemon-Images
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含第一代宝可梦的图像和标签,共有143个类别。每个宝可梦的目录包含50到200张图像。数据集分为训练集和测试集,训练集包含8440个样本,测试集包含2110个样本。数据集的总下载大小为1928731574字节,总数据集大小为1961121463.49字节。
该数据集包含第一代宝可梦的图像和标签,共有143个类别。每个宝可梦的目录包含50到200张图像。数据集分为训练集和测试集,训练集包含8440个样本,测试集包含2110个样本。数据集的总下载大小为1928731574字节,总数据集大小为1961121463.49字节。
提供机构:
Dusduo
原始信息汇总
数据集概述
数据集信息
特征
- image: 图像数据
- label: 类别标签,包含143个类别,具体名称如下:
- 0: Abra
- 1: Aerodactyl
- 2: Alakazam
- 3: Arbok
- 4: Arcanine
- 5: Articuno
- 6: Beedrill
- 7: Bellsprout
- 8: Blastoise
- 9: Bulbasaur
- 10: Butterfree
- 11: Caterpie
- 12: Chansey
- 13: Charizard
- 14: Charmander
- 15: Charmeleon
- 16: Clefable
- 17: Clefairy
- 18: Cloyster
- 19: Cubone
- 20: Dewgong
- 21: Diglett
- 22: Ditto
- 23: Dodrio
- 24: Doduo
- 25: Dragonair
- 26: Dragonite
- 27: Dratini
- 28: Drowzee
- 29: Dugtrio
- 30: Eevee
- 31: Ekans
- 32: Electabuzz
- 33: Electrode
- 34: Exeggcute
- 35: Exeggutor
- 36: Farfetchd
- 37: Fearow
- 38: Flareon
- 39: Gastly
- 40: Gengar
- 41: Geodude
- 42: Gloom
- 43: Golbat
- 44: Goldeen
- 45: Golduck
- 46: Graveler
- 47: Grimer
- 48: Growlithe
- 49: Gyarados
- 50: Haunter
- 51: Hitmonchan
- 52: Hitmonlee
- 53: Horsea
- 54: Hypno
- 55: Ivysaur
- 56: Jigglypuff
- 57: Jolteon
- 58: Jynx
- 59: Kabutops
- 60: Kadabra
- 61: Kakuna
- 62: Kangaskhan
- 63: Kingler
- 64: Koffing
- 65: Lapras
- 66: Lickitung
- 67: Machamp
- 68: Machoke
- 69: Machop
- 70: Magikarp
- 71: Magmar
- 72: Magnemite
- 73: Magneton
- 74: Mankey
- 75: Marowak
- 76: Meowth
- 77: Metapod
- 78: Mew
- 79: Mewtwo
- 80: Moltres
- 81: Mr. Mime
- 82: MrMime
- 83: Nidoking
- 84: Nidoqueen
- 85: Nidorina
- 86: Nidorino
- 87: Ninetales
- 88: Oddish
- 89: Omanyte
- 90: Omastar
- 91: Parasect
- 92: Pidgeot
- 93: Pidgeotto
- 94: Pidgey
- 95: Pikachu
- 96: Pinsir
- 97: Poliwag
- 98: Poliwhirl
- 99: Poliwrath
- 100: Ponyta
- 101: Porygon
- 102: Primeape
- 103: Psyduck
- 104: Raichu
- 105: Rapidash
- 106: Raticate
- 107: Rattata
- 108: Rhydon
- 109: Rhyhorn
- 110: Sandshrew
- 111: Sandslash
- 112: Scyther
- 113: Seadra
- 114: Seaking
- 115: Seel
- 116: Shellder
- 117: Slowbro
- 118: Slowpoke
- 119: Snorlax
- 120: Spearow
- 121: Squirtle
- 122: Starmie
- 123: Staryu
- 124: Tangela
- 125: Tauros
- 126: Tentacool
- 127: Tentacruel
- 128: Vaporeon
- 129: Venomoth
- 130: Venonat
- 131: Venusaur
- 132: Victreebel
- 133: Vileplume
- 134: Voltorb
- 135: Vulpix
- 136: Wartortle
- 137: Weedle
- 138: Weepinbell
- 139: Weezing
- 140: Wigglytuff
- 141: Zapdos
- 142: Zubat
数据集划分
- train: 训练集,包含8440个样本,大小为1594428375.04字节
- test: 测试集,包含2110个样本,大小为366693088.45字节
数据集大小
- download_size: 1928731574字节
- dataset_size: 1961121463.49字节
配置
- default: 默认配置
- train: 数据路径为
data/train-* - test: 数据路径为
data/test-*
- train: 数据路径为
搜集汇总
数据集介绍

构建方式
在计算机视觉与游戏文化交叉领域,该数据集源自Kaggle平台上的原始资源,系统性地整合了第一世代宝可梦的视觉资料。构建过程中,依据宝可梦种类创建了143个独立目录,每个目录对应一个特定宝可梦,排除了尼多兰与尼多朗的性别变体。数据采集覆盖了每类宝可梦50至200幅图像,通过规范化整理形成训练集与测试集,分别包含8440和2110个样本,确保了数据在类别与数量上的均衡分布。
特点
该数据集以图像分类任务为核心,其显著特征在于囊括了第一世代全部151种宝可梦中的143类,构成了一个多类别视觉识别库。每幅图像均标注了对应的宝可梦名称标签,标签体系采用分类编码与名称映射的双重结构,便于机器学习模型进行端到端训练。数据规模达到近200万字节,图像内容呈现宝可梦的多样化视觉形态,为模型提供了丰富的特征学习空间,适用于细粒度图像识别研究。
使用方法
在机器学习应用场景中,该数据集可直接用于监督学习框架下的图像分类模型训练。研究人员可通过HuggingFace平台加载数据集,利用其预划分的训练集与测试集进行模型训练与评估。典型流程包括图像预处理、特征提取及分类器构建,适用于卷积神经网络等深度学习架构的验证与优化。数据集结构兼容常见机器学习工具链,支持快速迭代实验,助力计算机视觉算法在游戏角色识别领域的性能提升。
背景与挑战
背景概述
在计算机视觉与机器学习领域,图像分类任务常需高质量、结构化的数据集以推动算法发展。Dusduo/1stGen-Pokemon-Images数据集由社区研究者基于Kaggle平台原始数据构建,专注于第一代宝可梦图像,涵盖143个类别,每类包含50至200张图像,总计逾万样本。该数据集旨在为细粒度图像识别提供基准,其创建源于对流行文化元素进行系统性数字化归档的需求,不仅服务于娱乐产业应用,亦为多类别分类、数据增强及迁移学习研究提供了丰富素材。
当前挑战
该数据集核心挑战在于细粒度图像分类的复杂性:宝可梦形态多样,同类个体间存在姿态、颜色与背景的高度变异,且不同类别间可能具有相似视觉特征,如进化链中的过渡形态,这对模型区分细微差异的能力提出严峻考验。构建过程中,挑战主要集中于数据收集与标注的规范性:原始图像来源不一,需统一处理尺寸、质量与格式;同时,类别平衡性亦成问题,部分稀有宝可梦样本量较少,可能影响模型训练的泛化性能。
常用场景
经典使用场景
在计算机视觉领域,图像分类任务常需结构清晰、类别丰富的基准数据集。Dusduo/1stGen-Pokemon-Images数据集以其涵盖第一代宝可梦的143个类别,成为多类别图像分类模型训练与评估的经典选择。该数据集包含超过万张图像,每类样本数量均衡,为研究者提供了验证卷积神经网络(CNN)等模型在细粒度分类任务上性能的优质平台。
衍生相关工作
围绕该数据集,已衍生出多项探索性研究。例如,研究者利用其进行生成对抗网络(GAN)的创意实验,生成新颖的宝可梦风格图像;亦有工作专注于少样本学习,测试模型在部分类别数据稀缺时的分类性能。此外,该数据集常作为基准,用于比较不同深度学习架构在复杂多类分类任务上的效率与准确性,促进了模型优化与创新方法的涌现。
数据集最近研究
最新研究方向
在计算机视觉与游戏文化交叉领域,Dusduo/1stGen-Pokemon-Images数据集作为经典IP的视觉资源库,正推动生成式人工智能与细粒度图像识别的前沿探索。该数据集囊括初代宝可梦的多样图像,为风格迁移、角色生成等创意应用提供了丰富素材,尤其在扩散模型与生成对抗网络的训练中展现出独特价值。伴随元宇宙与数字藏品的热潮,此类数据集支撑着虚拟角色设计与跨媒体内容生成的技术实践,其影响延伸至娱乐科技与文化遗产数字化领域,为算法创新与产业应用搭建了桥梁。
以上内容由遇见数据集搜集并总结生成



