five

TrainingDataPro/asian-kyc-photo-dataset

收藏
Hugging Face2024-04-25 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/TrainingDataPro/asian-kyc-photo-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: cc-by-nc-nd-4.0 task_categories: - image-classification - image-segmentation - image-to-image - feature-extraction - image-feature-extraction - object-detection language: - en tags: - legal - code - finance --- # Know Your Customer Dataset, Face Detection and Re-identification, Asian People # The similar dataset that includes all ethnicities - [Selfies and ID Dataset](https://trainingdata.pro/datasets/document-photos-and-selfies?utm_source=huggingface&utm_medium=cpc&utm_campaign=asian-kyc) **9,900**+ photos including **1,300**+ document photos from **660** people from **27** countries. The dataset includes 2 photos of a person from his documents and 13 selfies. All people presented in the dataset are **South Asian, East Asian or Middle Asian**. The dataset contains a variety of images capturing individuals from diverse *backgrounds and age groups*. **Photo documents contains only a photo of a person. All personal information from the document is hidden** ![](https://www.googleapis.com/download/storage/v1/b/kaggle-user-content/o/inbox%2F12421376%2F63f531bd9930fa2149f3d257f68d65ca%2FFrame%2015.png?generation=1712234429707103&alt=media) ### Documents in the dataset - Passports - International passport - Driver licenses - Student cards - Health certificate - Pensioner's ID - Pass to work - Other documents The dataset can be utilized for a wide range of tasks, including **face recognition, emotion detection, age estimation, gender classification**, or any problem related to human image analysis. # 💴 For Commercial Usage: Full version of the dataset includes 9,900+ photos of people, leave a request on **[TrainingData](https://trainingdata.pro/datasets/asian-people-kyc-photo?utm_source=huggingface&utm_medium=cpc&utm_campaign=asian-kyc)** to buy the dataset ### Metadata for the full dataset: - **assignment_id** - unique identifier of the media file - **worker_id** - unique identifier of the person - **age** - age of the person - **gender** - gender of the person - **country** - country of the person - **ethnicity** - ethnicity of the person - **photo_1_extension, photo_2_extension, …, photo_15_extension** - photo extensions in the dataset - **photo_1_resolution, photo_2_resolution, …, photo_15_resolution** - photo resolution in the dataset ### Statistics for the dataset ![](https://www.googleapis.com/download/storage/v1/b/kaggle-user-content/o/inbox%2F12421376%2Fba893bc048ad9f8fe029c6f1833a8df9%2FFrame%2099.png?generation=1712235055301722&alt=media) # 💴 Buy the Dataset: This is just an example of the data. Leave a request on **[https://trainingdata.pro/datasets](https://trainingdata.pro/datasets/asian-people-kyc-photo?utm_source=huggingface&utm_medium=cpc&utm_campaign=asian-kyc) to learn about the price and buy the dataset** # Content The dataset consists of: - **files** - includes 5 folders corresponding to each person and including 15 images (2 id photos and 13 selfies), - **.csv file** - contains information about the images and people in the dataset ### File with the extension .csv - **id**: id of the person, - **age** - age of the person, - **gender** - gender of the person, - **country** - country of the person, - **id_1, id_2**: link to access id photos, - **selfie_1, selfie_2, ..., selfie_13**: link to access each of the 13 selfies of the person ## **[TrainingData](https://trainingdata.pro/datasets/asian-people-kyc-photo?utm_source=huggingface&utm_medium=cpc&utm_campaign=asian-kyc)** provides high-quality data annotation tailored to your needs More datasets in TrainingData's Kaggle account: **https://www.kaggle.com/trainingdatapro/datasets** TrainingData's GitHub: **https://github.com/Trainingdata-datamarket/TrainingData_All_datasets** *keywords: biometric system, biometric dataset, face recognition database, face recognition dataset, face detection dataset, facial analysis, object detection dataset, deep learning datasets, computer vision datset, human images dataset, human faces dataset, machine learning, image-to-image, re-identification, id photos, selfies and paired id, photos, id verification models, passport, id card image, digital photo-identification, asian people, asian dataset*

许可证:CC-BY-NC-ND-4.0 任务类别: - 图像分类(image-classification) - 图像分割(image-segmentation) - 图像到图像转换(image-to-image) - 特征提取(feature-extraction) - 图像特征提取(image-feature-extraction) - 目标检测(object-detection) 语言: - 英语(en) 标签: - 法律 - 代码 - 金融 # 了解你的客户(Know Your Customer, KYC)数据集:人脸检测与重识别,亚洲人群 包含所有族裔的同类数据集——[自拍与身份证件数据集](https://trainingdata.pro/datasets/document-photos-and-selfies?utm_source=huggingface&utm_medium=cpc&utm_campaign=asian-kyc) 本数据集包含9900余张照片,其中包括来自27个国家的660名人物的1300余张证件照片。 每位人物均提供2张证件照与13张自拍照,数据集内所有人物均为南亚、东亚或中亚人群。数据集涵盖了来自不同*背景与年龄群体*的人物图像。 **证件照片仅保留人物面部,证件上的所有个人信息均已隐去** ![](https://www.googleapis.com/download/storage/v1/b/kaggle-user-content/o/inbox%2F12421376%2F63f531bd9930fa2149f3d257f68d65ca%2FFrame%2015.png?generation=1712234429707103&alt=media) ### 数据集包含的证件类型 - 护照(Passports) - 国际护照(International passport) - 驾照(Driver licenses) - 学生卡(Student cards) - 健康证明(Health certificate) - 退休人员身份证件(Pensioner's ID) - 工作许可(Pass to work) - 其他证件(Other documents) 本数据集可应用于多种任务,包括**人脸识别(face recognition)、情绪检测(emotion detection)、年龄估计(age estimation)、性别分类(gender classification)**,以及其他与人类图像分析相关的各类问题。 # 💴 商业使用说明:完整版本数据集包含9900余张人物照片,可前往**[TrainingData](https://trainingdata.pro/datasets/asian-people-kyc-photo?utm_source=huggingface&utm_medium=cpc&utm_campaign=asian-kyc)** 提交申请以购买该数据集 ### 完整数据集元数据说明 - **媒体文件唯一标识符(assignment_id)**:媒体文件的唯一标识 - **人物唯一标识符(worker_id)**:人物的唯一标识 - **人物年龄(age)**:人物的实际年龄 - **人物性别(gender)**:人物的性别 - **人物所属国家(country)**:人物所属的国家 - **人物族裔(ethnicity)**:人物的族裔背景 - **照片1至照片15的文件扩展名(photo_1_extension, photo_2_extension, …, photo_15_extension)**:数据集内对应照片的文件扩展名 - **照片1至照片15的分辨率(photo_1_resolution, photo_2_resolution, …, photo_15_resolution)**:数据集内对应照片的分辨率 ### 数据集统计信息 ![](https://www.googleapis.com/download/storage/v1/b/kaggle-user-content/o/inbox%2F12421376%2Fba893bc048ad9f8fe029c6f1833a8df9%2FFrame%2099.png?generation=1712235055301722&alt=media) # 💴 购买数据集:本页面仅展示数据示例,可前往**[https://trainingdata.pro/datasets](https://trainingdata.pro/datasets/asian-people-kyc-photo?utm_source=huggingface&utm_medium=cpc&utm_campaign=asian-kyc)** 查询价格并提交购买申请 # 数据集内容 本数据集包含以下内容: - **文件目录**:包含5个对应单个人物的文件夹,每个文件夹内包含15张图像(2张证件照与13张自拍照) - **.csv 格式文件**:包含数据集内图像与人物的相关信息 ### .csv 格式文件字段说明 - **id(人物ID)**:人物的唯一标识 - **age(人物年龄)**:人物的实际年龄 - **gender(人物性别)**:人物的性别 - **country(所属国家)**:人物所属的国家 - **id_1, id_2**:证件照的访问链接 - **selfie_1, selfie_2, ..., selfie_13**:对应13张自拍照的访问链接 ## **[TrainingData](https://trainingdata.pro/datasets/asian-people-kyc-photo?utm_source=huggingface&utm_medium=cpc&utm_campaign=asian-kyc)** 可提供按需定制的高质量数据标注服务 TrainingData 在 Kaggle 平台的更多数据集:**https://www.kaggle.com/trainingdatapro/datasets** TrainingData 的 GitHub 仓库:**https://github.com/Trainingdata-datamarket/TrainingData_All_datasets** *关键词:生物识别系统(biometric system)、生物特征数据集(biometric dataset)、人脸识别数据库(face recognition database)、人脸识别数据集(face recognition dataset)、人脸检测数据集(face detection dataset)、面部分析(facial analysis)、目标检测数据集(object detection dataset)、深度学习数据集(deep learning datasets)、计算机视觉数据集(computer vision dataset)、人类图像数据集(human images dataset)、人脸数据集(human faces dataset)、机器学习(machine learning)、图像到图像转换(image-to-image)、重识别(re-identification)、证件照片(id photos)、自拍与配对证件照(selfies and paired id photos)、身份验证模型(id verification models)、护照(passport)、证件卡图像(id card image)、数字照片身份识别(digital photo-identification)、亚洲人群(asian people)、亚洲数据集(asian dataset)*
提供机构:
TrainingDataPro
原始信息汇总

数据集概述

数据集名称

Know Your Customer Dataset, Face Detection and Re-identification, Asian People

数据集内容

  • 照片数量:超过9,900张照片,包括1,300多张证件照片。
  • 人物数量:来自27个国家的660人。
  • 照片类型:每人包括2张证件照片和13张自拍照。
  • 人物特征:所有人物为南亚、东亚或中亚人,涵盖不同背景和年龄组。
  • 证件类型:包括护照、国际护照、驾照、学生卡、健康证书、退休人员身份证、工作通行证等。

数据集用途

适用于多种任务,如人脸识别、情感检测、年龄估计、性别分类等与人类图像分析相关的问题。

数据集结构

  • 文件结构:包含5个文件夹,每个文件夹对应一个人,包含15张图像(2张证件照和13张自拍照)。
  • .csv文件内容:包含人物的ID、年龄、性别、国家、证件照链接和自拍照链接。

数据集元数据

  • assignment_id:媒体文件的唯一标识符。
  • worker_id:人物的唯一标识符。
  • age:人物的年龄。
  • gender:人物的性别。
  • country:人物的国家。
  • ethnicity:人物的种族。
  • photo_1_extension, ..., photo_15_extension:照片扩展名。
  • photo_1_resolution, ..., photo_15_resolution:照片分辨率。

许可证

cc-by-nc-nd-4.0

搜集汇总
数据集介绍
main_image_url
构建方式
本数据集的构建基于对个人身份验证领域需求的深刻理解,通过收集和分析来自27个国家的660位人士的身份证件照片及自拍照,形成了包含9,900余张照片的集合。每位人士提供2张证件照和13张自拍照,所有照片均经过处理,确保个人信息的匿名性,且参与者的民族背景涵盖南亚、东亚和中亚,满足多样化的研究需求。
特点
该数据集的特点在于其多样性及在人脸识别领域的专业性。照片涵盖了不同年龄和背景的人群,且包含多种类型的证件,如护照、驾照、学生证等。数据集的 metadata 提供了丰富的信息,包括年龄、性别、国籍、民族等,为研究提供了多维度的分析基础。此外,数据集遵循cc-by-nc-nd-4.0协议,保证了数据的使用和分享在合规的框架内进行。
使用方法
使用该数据集时,用户可依据数据集提供的.csv文件,便捷地获取每张照片的链接和相关个人信息。适用于人脸识别、情绪识别、年龄估计、性别分类等人类图像分析任务。对于商业用途,用户需通过官方网站提出申请,购买完整版数据集以获得更全面的数据服务。
背景与挑战
背景概述
在人工智能领域中,人脸识别技术是生物识别技术的重要组成部分,对于提升身份验证的准确性和便捷性具有重要意义。由此,TrainingDataPro团队创建了名为asian-kyc-photo-dataset的数据集,该数据集基于Selfies and ID Dataset,包含来自27个国家,660位人士的9,900多张照片,其中包括1,300多张身份证件照片。这些照片覆盖了南亚、东亚和中亚人群,具有多样的背景和年龄段,旨在为人脸识别、情绪识别、年龄估计、性别分类等领域的研究提供支持。该数据集的创建,不仅丰富了人脸识别领域的数据资源,也为相关研究提供了重要基础。
当前挑战
尽管asian-kyc-photo-dataset为相关领域的研究提供了重要支持,但在使用过程中也面临一些挑战。首先,数据集的构建过程中,确保个人隐私信息的安全和合规是一项重要挑战。其次,由于数据集包含了不同国家和地区的身份证件,如何有效处理和识别各种格式和类型的证件图像,也是研究者和工程师需要解决的难题。此外,数据集的多样性和广泛性要求算法具有较高的泛化能力,这对于模型的训练和优化提出了更高的要求。
常用场景
经典使用场景
在人工智能领域,尤其是人脸识别技术的研究与应用中,TrainingDataPro/asian-kyc-photo-dataset数据集以其丰富多样的图像资料,成为了一个不可或缺的资源。该数据集被广泛用于图像分类、人脸检测、年龄估计等任务,其经典的使用场景包括在人脸识别系统中进行模型训练,以提升系统对亚洲人群的识别准确度。
解决学术问题
该数据集解决了人脸识别技术在处理亚洲人群时存在的准确度不足问题。由于不同人种面部特征存在差异,传统的数据集往往无法满足对亚洲人群的识别需求。TrainingDataPro/asian-kyc-photo-dataset数据集的构建,为学术研究提供了针对性的数据支持,从而推动了人脸识别技术的普遍适用性和精确性。
衍生相关工作
TrainingDataPro/asian-kyc-photo-dataset数据集的推出,催生了一系列相关的研究工作。学者们基于该数据集进行了人脸识别算法的优化、跨年龄识别技术的研究、以及多模态身份认证系统的开发等,为人工智能领域的发展贡献了丰富的学术成果和实践经验。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作