five

Dusduo/1stGen-Pokemon-Images

收藏
Hugging Face2023-12-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Dusduo/1stGen-Pokemon-Images
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含第一代宝可梦的图像和标签,共有143个类别。每个宝可梦的目录包含50到200张图像。数据集分为训练集和测试集,训练集包含8440个样本,测试集包含2110个样本。数据集的总下载大小为1928731574字节,总数据集大小为1961121463.49字节。

该数据集包含第一代宝可梦的图像和标签,共有143个类别。每个宝可梦的目录包含50到200张图像。数据集分为训练集和测试集,训练集包含8440个样本,测试集包含2110个样本。数据集的总下载大小为1928731574字节,总数据集大小为1961121463.49字节。
提供机构:
Dusduo
原始信息汇总

数据集概述

数据集信息

特征

  • image: 图像数据
  • label: 类别标签,包含143个类别,具体名称如下:
    • 0: Abra
    • 1: Aerodactyl
    • 2: Alakazam
    • 3: Arbok
    • 4: Arcanine
    • 5: Articuno
    • 6: Beedrill
    • 7: Bellsprout
    • 8: Blastoise
    • 9: Bulbasaur
    • 10: Butterfree
    • 11: Caterpie
    • 12: Chansey
    • 13: Charizard
    • 14: Charmander
    • 15: Charmeleon
    • 16: Clefable
    • 17: Clefairy
    • 18: Cloyster
    • 19: Cubone
    • 20: Dewgong
    • 21: Diglett
    • 22: Ditto
    • 23: Dodrio
    • 24: Doduo
    • 25: Dragonair
    • 26: Dragonite
    • 27: Dratini
    • 28: Drowzee
    • 29: Dugtrio
    • 30: Eevee
    • 31: Ekans
    • 32: Electabuzz
    • 33: Electrode
    • 34: Exeggcute
    • 35: Exeggutor
    • 36: Farfetchd
    • 37: Fearow
    • 38: Flareon
    • 39: Gastly
    • 40: Gengar
    • 41: Geodude
    • 42: Gloom
    • 43: Golbat
    • 44: Goldeen
    • 45: Golduck
    • 46: Graveler
    • 47: Grimer
    • 48: Growlithe
    • 49: Gyarados
    • 50: Haunter
    • 51: Hitmonchan
    • 52: Hitmonlee
    • 53: Horsea
    • 54: Hypno
    • 55: Ivysaur
    • 56: Jigglypuff
    • 57: Jolteon
    • 58: Jynx
    • 59: Kabutops
    • 60: Kadabra
    • 61: Kakuna
    • 62: Kangaskhan
    • 63: Kingler
    • 64: Koffing
    • 65: Lapras
    • 66: Lickitung
    • 67: Machamp
    • 68: Machoke
    • 69: Machop
    • 70: Magikarp
    • 71: Magmar
    • 72: Magnemite
    • 73: Magneton
    • 74: Mankey
    • 75: Marowak
    • 76: Meowth
    • 77: Metapod
    • 78: Mew
    • 79: Mewtwo
    • 80: Moltres
    • 81: Mr. Mime
    • 82: MrMime
    • 83: Nidoking
    • 84: Nidoqueen
    • 85: Nidorina
    • 86: Nidorino
    • 87: Ninetales
    • 88: Oddish
    • 89: Omanyte
    • 90: Omastar
    • 91: Parasect
    • 92: Pidgeot
    • 93: Pidgeotto
    • 94: Pidgey
    • 95: Pikachu
    • 96: Pinsir
    • 97: Poliwag
    • 98: Poliwhirl
    • 99: Poliwrath
    • 100: Ponyta
    • 101: Porygon
    • 102: Primeape
    • 103: Psyduck
    • 104: Raichu
    • 105: Rapidash
    • 106: Raticate
    • 107: Rattata
    • 108: Rhydon
    • 109: Rhyhorn
    • 110: Sandshrew
    • 111: Sandslash
    • 112: Scyther
    • 113: Seadra
    • 114: Seaking
    • 115: Seel
    • 116: Shellder
    • 117: Slowbro
    • 118: Slowpoke
    • 119: Snorlax
    • 120: Spearow
    • 121: Squirtle
    • 122: Starmie
    • 123: Staryu
    • 124: Tangela
    • 125: Tauros
    • 126: Tentacool
    • 127: Tentacruel
    • 128: Vaporeon
    • 129: Venomoth
    • 130: Venonat
    • 131: Venusaur
    • 132: Victreebel
    • 133: Vileplume
    • 134: Voltorb
    • 135: Vulpix
    • 136: Wartortle
    • 137: Weedle
    • 138: Weepinbell
    • 139: Weezing
    • 140: Wigglytuff
    • 141: Zapdos
    • 142: Zubat

数据集划分

  • train: 训练集,包含8440个样本,大小为1594428375.04字节
  • test: 测试集,包含2110个样本,大小为366693088.45字节

数据集大小

  • download_size: 1928731574字节
  • dataset_size: 1961121463.49字节

配置

  • default: 默认配置
    • train: 数据路径为data/train-*
    • test: 数据路径为data/test-*
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉与游戏文化交叉领域,该数据集源自Kaggle平台上的原始资源,系统性地整合了第一世代宝可梦的视觉资料。构建过程中,依据宝可梦种类创建了143个独立目录,每个目录对应一个特定宝可梦,排除了尼多兰与尼多朗的性别变体。数据采集覆盖了每类宝可梦50至200幅图像,通过规范化整理形成训练集与测试集,分别包含8440和2110个样本,确保了数据在类别与数量上的均衡分布。
特点
该数据集以图像分类任务为核心,其显著特征在于囊括了第一世代全部151种宝可梦中的143类,构成了一个多类别视觉识别库。每幅图像均标注了对应的宝可梦名称标签,标签体系采用分类编码与名称映射的双重结构,便于机器学习模型进行端到端训练。数据规模达到近200万字节,图像内容呈现宝可梦的多样化视觉形态,为模型提供了丰富的特征学习空间,适用于细粒度图像识别研究。
使用方法
在机器学习应用场景中,该数据集可直接用于监督学习框架下的图像分类模型训练。研究人员可通过HuggingFace平台加载数据集,利用其预划分的训练集与测试集进行模型训练与评估。典型流程包括图像预处理、特征提取及分类器构建,适用于卷积神经网络等深度学习架构的验证与优化。数据集结构兼容常见机器学习工具链,支持快速迭代实验,助力计算机视觉算法在游戏角色识别领域的性能提升。
背景与挑战
背景概述
在计算机视觉与机器学习领域,图像分类任务常需高质量、结构化的数据集以推动算法发展。Dusduo/1stGen-Pokemon-Images数据集由社区研究者基于Kaggle平台原始数据构建,专注于第一代宝可梦图像,涵盖143个类别,每类包含50至200张图像,总计逾万样本。该数据集旨在为细粒度图像识别提供基准,其创建源于对流行文化元素进行系统性数字化归档的需求,不仅服务于娱乐产业应用,亦为多类别分类、数据增强及迁移学习研究提供了丰富素材。
当前挑战
该数据集核心挑战在于细粒度图像分类的复杂性:宝可梦形态多样,同类个体间存在姿态、颜色与背景的高度变异,且不同类别间可能具有相似视觉特征,如进化链中的过渡形态,这对模型区分细微差异的能力提出严峻考验。构建过程中,挑战主要集中于数据收集与标注的规范性:原始图像来源不一,需统一处理尺寸、质量与格式;同时,类别平衡性亦成问题,部分稀有宝可梦样本量较少,可能影响模型训练的泛化性能。
常用场景
经典使用场景
在计算机视觉领域,图像分类任务常需结构清晰、类别丰富的基准数据集。Dusduo/1stGen-Pokemon-Images数据集以其涵盖第一代宝可梦的143个类别,成为多类别图像分类模型训练与评估的经典选择。该数据集包含超过万张图像,每类样本数量均衡,为研究者提供了验证卷积神经网络(CNN)等模型在细粒度分类任务上性能的优质平台。
衍生相关工作
围绕该数据集,已衍生出多项探索性研究。例如,研究者利用其进行生成对抗网络(GAN)的创意实验,生成新颖的宝可梦风格图像;亦有工作专注于少样本学习,测试模型在部分类别数据稀缺时的分类性能。此外,该数据集常作为基准,用于比较不同深度学习架构在复杂多类分类任务上的效率与准确性,促进了模型优化与创新方法的涌现。
数据集最近研究
最新研究方向
在计算机视觉与游戏文化交叉领域,Dusduo/1stGen-Pokemon-Images数据集作为经典IP的视觉资源库,正推动生成式人工智能与细粒度图像识别的前沿探索。该数据集囊括初代宝可梦的多样图像,为风格迁移、角色生成等创意应用提供了丰富素材,尤其在扩散模型与生成对抗网络的训练中展现出独特价值。伴随元宇宙与数字藏品的热潮,此类数据集支撑着虚拟角色设计与跨媒体内容生成的技术实践,其影响延伸至娱乐科技与文化遗产数字化领域,为算法创新与产业应用搭建了桥梁。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作