umuteren/insightface_embeddings
收藏Hugging Face2024-05-27 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/umuteren/insightface_embeddings
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含由InsightFace模型从FaceData数据集生成的人脸嵌入,存储为.h5文件,总大小为139GB。该数据集适用于人脸识别和验证任务。每个数据实例包括由InsightFace模型生成的嵌入向量和对应的图像,存储在HDF5文件中。数据集的创建过程包括从FaceData数据集加载图像、使用InsightFace模型检测人脸、裁剪和调整人脸大小、生成嵌入向量,并将图像和嵌入向量存储在HDF5文件中。
该数据集包含由InsightFace模型从FaceData数据集生成的人脸嵌入,存储为.h5文件,总大小为139GB。该数据集适用于人脸识别和验证任务。每个数据实例包括由InsightFace模型生成的嵌入向量和对应的图像,存储在HDF5文件中。数据集的创建过程包括从FaceData数据集加载图像、使用InsightFace模型检测人脸、裁剪和调整人脸大小、生成嵌入向量,并将图像和嵌入向量存储在HDF5文件中。
提供机构:
umuteren
原始信息汇总
数据集卡片 for Insight Face Embeddings
数据集概述
该数据集包含由InsightFace模型从FaceData数据集生成的面部嵌入。嵌入存储在.h5文件中,总数据集大小为139GB。该数据集适用于面部识别和验证任务。
数据集结构
数据实例
每个数据实例由InsightFace模型生成的嵌入向量和相应的图像组成。嵌入和图像存储在HDF5(.h5)文件中,每个文件对应于从FaceData数据集处理的一批图像。
数据字段
每个.h5文件包含:
- /images/{image_name}: 对应面部的调整大小和裁剪后的图像。
- /embeddings/{image_name}: 面部的嵌入向量。
- /filename_{image_name}: 图像的原始文件名,存储为属性。
数据集创建
源数据
- 原始数据集: 嵌入是从FaceData数据集生成的,该数据集包含用于训练和评估的面部图像。
- 模型: 使用InsightFace模型生成嵌入。
预处理
预处理步骤包括:
- 从FaceData数据集加载图像。
- 使用InsightFace模型检测面部。
- 将检测到的面部裁剪并调整到标准大小。
- 为检测到的面部生成嵌入。
- 将图像和嵌入存储在HDF5文件中。
示例
以下是如何加载和使用数据的示例:
python import h5py import numpy as np
def load_hdf5_data(hdf5_file): with h5py.File(hdf5_file, r) as h5f: images = {} embeddings = {} filenames = []
for key in h5f[images].keys():
image_name = h5f.attrs[ffilename_{key}]
img = np.array(h5f[fimages/{key}])
embedding = np.array(h5f[fembeddings/{key}])
images[image_name] = img
embeddings[image_name] = embedding
filenames.append(image_name)
return images, embeddings, filenames
示例用法
hdf5_file = face_embeddings26.h5 images, embeddings, filenames = load_hdf5_data(hdf5_file)
print("从HDF5文件加载的数据:") print(f"文件名: {filenames[0]}") print(f"图像形状: {images[filenames[0]].shape}") print(f"嵌入形状: {embeddings[filenames[0]].shape}")



