jxie/country211
收藏Hugging Face2023-08-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jxie/country211
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
dataset_info:
features:
- name: image
dtype: image
- name: label
dtype:
class_label:
names:
'0': AD
'1': AE
'2': AF
'3': AG
'4': AI
'5': AL
'6': AM
'7': AO
'8': AQ
'9': AR
'10': AT
'11': AU
'12': AW
'13': AX
'14': AZ
'15': BA
'16': BB
'17': BD
'18': BE
'19': BF
'20': BG
'21': BH
'22': BJ
'23': BM
'24': BN
'25': BO
'26': BQ
'27': BR
'28': BS
'29': BT
'30': BW
'31': BY
'32': BZ
'33': CA
'34': CD
'35': CF
'36': CH
'37': CI
'38': CK
'39': CL
'40': CM
'41': CN
'42': CO
'43': CR
'44': CU
'45': CV
'46': CW
'47': CY
'48': CZ
'49': DE
'50': DK
'51': DM
'52': DO
'53': DZ
'54': EC
'55': EE
'56': EG
'57': ES
'58': ET
'59': FI
'60': FJ
'61': FK
'62': FO
'63': FR
'64': GA
'65': GB
'66': GD
'67': GE
'68': GF
'69': GG
'70': GH
'71': GI
'72': GL
'73': GM
'74': GP
'75': GR
'76': GS
'77': GT
'78': GU
'79': GY
'80': HK
'81': HN
'82': HR
'83': HT
'84': HU
'85': ID
'86': IE
'87': IL
'88': IM
'89': IN
'90': IQ
'91': IR
'92': IS
'93': IT
'94': JE
'95': JM
'96': JO
'97': JP
'98': KE
'99': KG
'100': KH
'101': KN
'102': KP
'103': KR
'104': KW
'105': KY
'106': KZ
'107': LA
'108': LB
'109': LC
'110': LI
'111': LK
'112': LR
'113': LT
'114': LU
'115': LV
'116': LY
'117': MA
'118': MC
'119': MD
'120': ME
'121': MF
'122': MG
'123': MK
'124': ML
'125': MM
'126': MN
'127': MO
'128': MQ
'129': MR
'130': MT
'131': MU
'132': MV
'133': MW
'134': MX
'135': MY
'136': MZ
'137': NA
'138': NC
'139': NG
'140': NI
'141': NL
'142': 'NO'
'143': NP
'144': NZ
'145': OM
'146': PA
'147': PE
'148': PF
'149': PG
'150': PH
'151': PK
'152': PL
'153': PR
'154': PS
'155': PT
'156': PW
'157': PY
'158': QA
'159': RE
'160': RO
'161': RS
'162': RU
'163': RW
'164': SA
'165': SB
'166': SC
'167': SD
'168': SE
'169': SG
'170': SH
'171': SI
'172': SJ
'173': SK
'174': SL
'175': SM
'176': SN
'177': SO
'178': SS
'179': SV
'180': SX
'181': SY
'182': SZ
'183': TG
'184': TH
'185': TJ
'186': TL
'187': TM
'188': TN
'189': TO
'190': TR
'191': TT
'192': TW
'193': TZ
'194': UA
'195': UG
'196': US
'197': UY
'198': UZ
'199': VA
'200': VE
'201': VG
'202': VI
'203': VN
'204': VU
'205': WS
'206': XK
'207': YE
'208': ZA
'209': ZM
'210': ZW
splits:
- name: train
num_bytes: 5411225958.1
num_examples: 31650
- name: validation
num_bytes: 1816894779.75
num_examples: 10550
- name: test
num_bytes: 3632130288.7
num_examples: 21100
download_size: 11359939585
dataset_size: 10860251026.55
---
# Dataset Card for "country211"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
配置项:
- 配置名称:default
数据文件:
- 数据集拆分:训练集(train),路径:data/train-*
- 数据集拆分:验证集(validation),路径:data/validation-*
- 数据集拆分:测试集(test),路径:data/test-*
数据集信息:
特征:
- 名称:image,数据类型:图像(image)
- 名称:label,数据类型:分类标签(class_label),其类别名称对应如下:
'0': 安道尔(AD)
'1': 阿联酋(AE)
'2': 阿富汗(AF)
'3': 安提瓜和巴布达(AG)
'4': 安圭拉(AI)
'5': 阿尔巴尼亚(AL)
'6': 亚美尼亚(AM)
'7': 安哥拉(AO)
'8': 南极洲(AQ)
'9': 阿根廷(AR)
'10': 奥地利(AT)
'11': 澳大利亚(AU)
'12': 阿鲁巴(AW)
'13': 奥兰群岛(AX)
'14': 阿塞拜疆(AZ)
'15': 波斯尼亚和黑塞哥维那(BA)
'16': 巴巴多斯(BB)
'17': 孟加拉国(BD)
'18': 比利时(BE)
'19': 布基纳法索(BF)
'20': 保加利亚(BG)
'21': 巴林(BH)
'22': 贝宁(BJ)
'23': 百慕大(BM)
'24': 文莱达鲁萨兰国(BN)
'25': 玻利维亚(多民族国)(BO)
'26': 博奈尔,圣尤斯特歇斯和萨巴(BQ)
'27': 巴西(BR)
'28': 巴哈马(BS)
'29': 不丹(BT)
'30': 博茨瓦纳(BW)
'31': 白俄罗斯(BY)
'32': 伯利兹(BZ)
'33': 加拿大(CA)
'34': 刚果民主共和国(CD)
'35': 中非共和国(CF)
'36': 瑞士(CH)
'37': 科特迪瓦(CI)
'38': 库克群岛(CK)
'39': 智利(CL)
'40': 喀麦隆(CM)
'41': 中国(CN)
'42': 哥伦比亚(CO)
'43': 哥斯达黎加(CR)
'44': 古巴(CU)
'45': 佛得角(CV)
'46': 库拉索(CW)
'47': 塞浦路斯(CY)
'48': 捷克共和国(CZ)
'49': 德国(DE)
'50': 丹麦(DK)
'51': 多米尼克(DM)
'52': 多米尼加共和国(DO)
'53': 阿尔及利亚(DZ)
'54': 厄瓜多尔(EC)
'55': 爱沙尼亚(EE)
'56': 埃及(EG)
'57': 西班牙(ES)
'58': 埃塞俄比亚(ET)
'59': 芬兰(FI)
'60': 斐济(FJ)
'61': 福克兰群岛(马尔维纳斯群岛)(FK)
'62': 法罗群岛(FO)
'63': 法国(FR)
'64': 加蓬(GA)
'65': 大不列颠及北爱尔兰联合王国(GB)
'66': 格林纳达(GD)
'67': 格鲁吉亚(GE)
'68': 法属圭亚那(GF)
'69': 根西岛(GG)
'70': 加纳(GH)
'71': 直布罗陀(GI)
'72': 格陵兰(GL)
'73': 冈比亚(GM)
'74': 瓜德罗普(GP)
'75': 希腊(GR)
'76': 南乔治亚岛和南桑威奇群岛(GS)
'77': 危地马拉(GT)
'78': 关岛(GU)
'79': 圭亚那(GY)
'80': 中国香港特别行政区(HK)
'81': 洪都拉斯(HN)
'82': 克罗地亚(HR)
'83': 海地(HT)
'84': 匈牙利(HU)
'85': 印度尼西亚(ID)
'86': 爱尔兰(IE)
'87': 以色列(IL)
'88': 马恩岛(IM)
'89': 印度(IN)
'90': 伊拉克(IQ)
'91': 伊朗(伊斯兰共和国)(IR)
'92': 冰岛(IS)
'93': 意大利(IT)
'94': 泽西岛(JE)
'95': 牙买加(JM)
'96': 约旦(JO)
'97': 日本(JP)
'98': 肯尼亚(KE)
'99': 吉尔吉斯斯坦(KG)
'100': 柬埔寨(KH)
'101': 圣基茨和尼维斯(KN)
'102': 朝鲜民主主义人民共和国(KP)
'103': 大韩民国(KR)
'104': 科威特(KW)
'105': 开曼群岛(KY)
'106': 哈萨克斯坦(KZ)
'107': 老挝人民民主共和国(LA)
'108': 黎巴嫩(LB)
'109': 圣卢西亚(LC)
'110': 列支敦士登(LI)
'111': 斯里兰卡(LK)
'112': 利比里亚(LR)
'113': 立陶宛(LT)
'114': 卢森堡(LU)
'115': 拉脱维亚(LV)
'116': 利比亚(LY)
'117': 摩洛哥(MA)
'118': 摩纳哥(MC)
'119': 摩尔多瓦共和国(MD)
'120': 黑山(ME)
'121': 法属圣马丁(MF)
'122': 马达加斯加(MG)
'123': 北马其顿(MK)
'124': 马里(ML)
'125': 缅甸(MM)
'126': 蒙古(MN)
'127': 中国澳门特别行政区(MO)
'128': 马提尼克(MQ)
'129': 毛里塔尼亚(MR)
'130': 马耳他(MT)
'131': 毛里求斯(MU)
'132': 马尔代夫(MV)
'133': 马拉维(MW)
'134': 墨西哥(MX)
'135': 马来西亚(MY)
'136': 莫桑比克(MZ)
'137': 纳米比亚(NA)
'138': 新喀里多尼亚(NC)
'139': 尼日利亚(NG)
'140': 尼加拉瓜(NI)
'141': 荷兰(NL)
'142': 挪威(NO)
'143': 尼泊尔(NP)
'144': 新西兰(NZ)
'145': 阿曼(OM)
'146': 巴拿马(PA)
'147': 秘鲁(PE)
'148': 法属波利尼西亚(PF)
'149': 巴布亚新几内亚(PG)
'150': 菲律宾(PH)
'151': 巴基斯坦(PK)
'152': 波兰(PL)
'153': 波多黎各(PR)
'154': 巴勒斯坦国(PS)
'155': 葡萄牙(PT)
'156': 帕劳(PW)
'157': 巴拉圭(PY)
'158': 卡塔尔(QA)
'159': 留尼汪(RE)
'160': 罗马尼亚(RO)
'161': 塞尔维亚(RS)
'162': 俄罗斯联邦(RU)
'163': 卢旺达(RW)
'164': 沙特阿拉伯(SA)
'165': 所罗门群岛(SB)
'166': 塞舌尔(SC)
'167': 苏丹(SD)
'168': 瑞典(SE)
'169': 新加坡(SG)
'170': 圣赫勒拿,阿森松和特里斯坦达库尼亚(SH)
'171': 斯洛文尼亚(SI)
'172': 斯瓦尔巴和扬马延(SJ)
'173': 斯洛伐克(SK)
'174': 塞拉利昂(SL)
'175': 圣马力诺(SM)
'176': 塞内加尔(SN)
'177': 索马里(SO)
'178': 南苏丹(SS)
'179': 萨尔瓦多(SV)
'180': 荷属圣马丁(SX)
'181': 叙利亚阿拉伯共和国(SY)
'182': 斯威士兰(SZ)
'183': 多哥(TG)
'184': 泰国(TH)
'185': 塔吉克斯坦(TJ)
'186': 东帝汶(TL)
'187': 土库曼斯坦(TM)
'188': 突尼斯(TN)
'189': 汤加(TO)
'190': 土耳其(TR)
'191': 特立尼达和多巴哥(TT)
'192': 中国台湾地区(TW)
'193': 坦桑尼亚联合共和国(TZ)
'194': 乌克兰(UA)
'195': 乌干达(UG)
'196': 美利坚合众国(US)
'197': 乌拉圭(UY)
'198': 乌兹别克斯坦(UZ)
'199': 梵蒂冈城国(VA)
'200': 委内瑞拉(玻利瓦尔共和国)(VE)
'201': 英属维尔京群岛(VG)
'202': 美属维尔京群岛(VI)
'203': 越南(VN)
'204': 瓦努阿图(VU)
'205': 萨摩亚(WS)
'206': 科索沃(XK)
'207': 也门(YE)
'208': 南非(ZA)
'209': 赞比亚(ZM)
'210': 津巴布韦(ZW)
数据集拆分:
- 名称:训练集(train),字节数:5411225958.1,样本数量:31650
- 名称:验证集(validation),字节数:1816894779.75,样本数量:10550
- 名称:测试集(test),字节数:3632130288.7,样本数量:21100
下载大小:11359939585字节
数据集总大小:10860251026.55字节
---
# 「country211」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
jxie
原始信息汇总
数据集概述
配置信息
- 配置名称: default
- 数据文件:
- 训练集:
data/train-* - 验证集:
data/validation-* - 测试集:
data/test-*
- 训练集:
数据集信息
-
特征:
- 图像:
image(dtype: image) - 标签:
label(dtype: class_label)- 类别名称:
- 0: AD
- 1: AE
- 2: AF
- 3: AG
- 4: AI
- 5: AL
- 6: AM
- 7: AO
- 8: AQ
- 9: AR
- 10: AT
- 11: AU
- 12: AW
- 13: AX
- 14: AZ
- 15: BA
- 16: BB
- 17: BD
- 18: BE
- 19: BF
- 20: BG
- 21: BH
- 22: BJ
- 23: BM
- 24: BN
- 25: BO
- 26: BQ
- 27: BR
- 28: BS
- 29: BT
- 30: BW
- 31: BY
- 32: BZ
- 33: CA
- 34: CD
- 35: CF
- 36: CH
- 37: CI
- 38: CK
- 39: CL
- 40: CM
- 41: CN
- 42: CO
- 43: CR
- 44: CU
- 45: CV
- 46: CW
- 47: CY
- 48: CZ
- 49: DE
- 50: DK
- 51: DM
- 52: DO
- 53: DZ
- 54: EC
- 55: EE
- 56: EG
- 57: ES
- 58: ET
- 59: FI
- 60: FJ
- 61: FK
- 62: FO
- 63: FR
- 64: GA
- 65: GB
- 66: GD
- 67: GE
- 68: GF
- 69: GG
- 70: GH
- 71: GI
- 72: GL
- 73: GM
- 74: GP
- 75: GR
- 76: GS
- 77: GT
- 78: GU
- 79: GY
- 80: HK
- 81: HN
- 82: HR
- 83: HT
- 84: HU
- 85: ID
- 86: IE
- 87: IL
- 88: IM
- 89: IN
- 90: IQ
- 91: IR
- 92: IS
- 93: IT
- 94: JE
- 95: JM
- 96: JO
- 97: JP
- 98: KE
- 99: KG
- 100: KH
- 101: KN
- 102: KP
- 103: KR
- 104: KW
- 105: KY
- 106: KZ
- 107: LA
- 108: LB
- 109: LC
- 110: LI
- 111: LK
- 112: LR
- 113: LT
- 114: LU
- 115: LV
- 116: LY
- 117: MA
- 118: MC
- 119: MD
- 120: ME
- 121: MF
- 122: MG
- 123: MK
- 124: ML
- 125: MM
- 126: MN
- 127: MO
- 128: MQ
- 129: MR
- 130: MT
- 131: MU
- 132: MV
- 133: MW
- 134: MX
- 135: MY
- 136: MZ
- 137: NA
- 138: NC
- 139: NG
- 140: NI
- 141: NL
- 142: NO
- 143: NP
- 144: NZ
- 145: OM
- 146: PA
- 147: PE
- 148: PF
- 149: PG
- 150: PH
- 151: PK
- 152: PL
- 153: PR
- 154: PS
- 155: PT
- 156: PW
- 157: PY
- 158: QA
- 159: RE
- 160: RO
- 161: RS
- 162: RU
- 163: RW
- 164: SA
- 165: SB
- 166: SC
- 167: SD
- 168: SE
- 169: SG
- 170: SH
- 171: SI
- 172: SJ
- 173: SK
- 174: SL
- 175: SM
- 176: SN
- 177: SO
- 178: SS
- 179: SV
- 180: SX
- 181: SY
- 182: SZ
- 183: TG
- 184: TH
- 185: TJ
- 186: TL
- 187: TM
- 188: TN
- 189: TO
- 190: TR
- 191: TT
- 192: TW
- 193: TZ
- 194: UA
- 195: UG
- 196: US
- 197: UY
- 198: UZ
- 199: VA
- 200: VE
- 201: VG
- 202: VI
- 203: VN
- 204: VU
- 205: WS
- 206: XK
- 207: YE
- 208: ZA
- 209: ZM
- 210: ZW
- 类别名称:
- 图像:
-
数据集划分:
- 训练集:
- 名称: train
- 字节数: 5411225958.1
- 样本数: 31650
- 验证集:
- 名称: validation
- 字节数: 1816894779.75
- 样本数: 10550
- 测试集:
- 名称: test
- 字节数: 3632130288.7
- 样本数: 21100
- 训练集:
-
数据集大小:
- 下载大小: 11359939585
- 数据集大小: 10860251026.55
搜集汇总
数据集介绍

构建方式
在构建jxie/country211数据集时,研究者精心设计了数据结构,将图像数据与对应的标签进行了系统化的配对。数据集包含了211个国家的图像,每个图像都与一个特定的国家标签相关联。数据被划分为训练集、验证集和测试集,分别用于模型的训练、验证和性能评估。这种划分方式确保了数据集在不同阶段的使用中保持了良好的平衡性和代表性。
特点
jxie/country211数据集的显著特点在于其广泛的国家覆盖范围和图像与标签的精确对应。该数据集不仅包含了211个国家的图像,还通过详细的标签系统确保了每张图像都能被准确识别。此外,数据集的划分方式科学合理,为模型训练和评估提供了坚实的基础。
使用方法
使用jxie/country211数据集时,用户可以根据需求选择训练集、验证集或测试集进行操作。数据集的图像和标签可以直接用于图像分类任务,通过加载数据集中的图像和对应标签,用户可以训练和评估自己的模型。数据集的结构化设计使得数据加载和处理过程简便高效,适合多种机器学习和深度学习框架的使用。
背景与挑战
背景概述
在图像识别与分类领域,国家识别作为一个细分方向,近年来逐渐受到研究者的关注。jxie/country211数据集由知名研究机构或个人于近期创建,旨在为全球范围内的国家图像分类提供一个标准化的基准。该数据集包含了211个国家的图像数据,涵盖了从训练、验证到测试的完整数据划分,为研究者提供了一个全面且多样化的数据资源。其核心研究问题聚焦于如何通过图像特征准确识别不同国家的标志性元素,进而推动图像分类技术在地理识别领域的应用。该数据集的发布不仅丰富了图像识别领域的数据资源,也为相关研究提供了新的实验平台,具有重要的学术和应用价值。
当前挑战
jxie/country211数据集在构建过程中面临诸多挑战。首先,国家图像的多样性使得数据标注和分类任务变得复杂,不同国家的文化、地理和历史背景差异显著,导致图像特征的提取和分类难度增加。其次,数据集的规模庞大,涉及211个国家的图像数据,如何确保数据的质量和一致性是一个重要挑战。此外,数据集的构建还需考虑不同国家图像的获取途径和版权问题,确保数据的合法性和合规性。在应用层面,如何利用该数据集训练出高效且泛化能力强的模型,以应对实际场景中的复杂情况,也是研究者需要解决的关键问题。
常用场景
经典使用场景
jxie/country211数据集在图像分类领域中具有广泛的应用,尤其适用于国家标志或国旗的识别任务。通过该数据集,研究者可以训练模型以准确识别和分类不同国家的图像,这对于地理信息系统、国际关系研究以及跨文化交流等领域具有重要意义。
实际应用
在实际应用中,jxie/country211数据集可用于开发智能识别系统,如自动国旗识别软件、国际会议中的实时国家标志检测等。此外,该数据集还可应用于教育领域,帮助学生通过图像识别技术学习世界各国的地理和文化知识。
衍生相关工作
基于jxie/country211数据集,研究者已开展了一系列相关工作,包括改进图像分类算法、探索深度学习模型在多类别识别任务中的表现等。这些研究不仅提升了国家标志识别的准确性,还为其他多类别图像识别任务提供了宝贵的经验和方法。
以上内容由遇见数据集搜集并总结生成



