five

umuteren/insightface_embeddings

收藏
Hugging Face2024-05-27 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/umuteren/insightface_embeddings
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含由InsightFace模型从FaceData数据集生成的人脸嵌入,存储为.h5文件,总大小为139GB。该数据集适用于人脸识别和验证任务。每个数据实例包括由InsightFace模型生成的嵌入向量和对应的图像,存储在HDF5文件中。数据集的创建过程包括从FaceData数据集加载图像、使用InsightFace模型检测人脸、裁剪和调整人脸大小、生成嵌入向量,并将图像和嵌入向量存储在HDF5文件中。

该数据集包含由InsightFace模型从FaceData数据集生成的人脸嵌入,存储为.h5文件,总大小为139GB。该数据集适用于人脸识别和验证任务。每个数据实例包括由InsightFace模型生成的嵌入向量和对应的图像,存储在HDF5文件中。数据集的创建过程包括从FaceData数据集加载图像、使用InsightFace模型检测人脸、裁剪和调整人脸大小、生成嵌入向量,并将图像和嵌入向量存储在HDF5文件中。
提供机构:
umuteren
原始信息汇总

数据集卡片 for Insight Face Embeddings

数据集概述

该数据集包含由InsightFace模型从FaceData数据集生成的面部嵌入。嵌入存储在.h5文件中,总数据集大小为139GB。该数据集适用于面部识别和验证任务。

数据集结构

数据实例

每个数据实例由InsightFace模型生成的嵌入向量和相应的图像组成。嵌入和图像存储在HDF5(.h5)文件中,每个文件对应于从FaceData数据集处理的一批图像。

数据字段

每个.h5文件包含:

  • /images/{image_name}: 对应面部的调整大小和裁剪后的图像。
  • /embeddings/{image_name}: 面部的嵌入向量。
  • /filename_{image_name}: 图像的原始文件名,存储为属性。

数据集创建

源数据

  • 原始数据集: 嵌入是从FaceData数据集生成的,该数据集包含用于训练和评估的面部图像。
  • 模型: 使用InsightFace模型生成嵌入。

预处理

预处理步骤包括:

  1. 从FaceData数据集加载图像。
  2. 使用InsightFace模型检测面部。
  3. 将检测到的面部裁剪并调整到标准大小。
  4. 为检测到的面部生成嵌入。
  5. 将图像和嵌入存储在HDF5文件中。

示例

以下是如何加载和使用数据的示例:

python import h5py import numpy as np

def load_hdf5_data(hdf5_file): with h5py.File(hdf5_file, r) as h5f: images = {} embeddings = {} filenames = []

    for key in h5f[images].keys():
        image_name = h5f.attrs[ffilename_{key}]
        img = np.array(h5f[fimages/{key}])
        embedding = np.array(h5f[fembeddings/{key}])
        
        images[image_name] = img
        embeddings[image_name] = embedding
        filenames.append(image_name)

    return images, embeddings, filenames

示例用法

hdf5_file = face_embeddings26.h5 images, embeddings, filenames = load_hdf5_data(hdf5_file)

print("从HDF5文件加载的数据:") print(f"文件名: {filenames[0]}") print(f"图像形状: {images[filenames[0]].shape}") print(f"嵌入形状: {embeddings[filenames[0]].shape}")

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作