zhouxzh/retinaface_widerface
收藏Hugging Face2026-03-30 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/zhouxzh/retinaface_widerface
下载链接
链接失效反馈官方服务:
资源简介:
# retinaface_widerface
这个目录用于生成可直接上传到 Hugging Face Datasets 的 WiderFace 教学版数据。
## 目标格式
转换完成后会生成两个 split:
- train
- val
对应文件路径默认是:
- train/train-00000-of-00001.parquet
- val/val-00000-of-00001.parquet
## 数据来源
- train 来自 data/widerface/train/label.txt 和 data/widerface/train/images
- val 来自 data/widerface/val/images 和 widerface_evaluate/ground_truth 下的 4 个 mat 文件
## 运行方式
在仓库根目录执行:
```bash
conda run -n retinaface python data/retinaface_widerface/build_parquet.py
```
如果环境里还没有 Hugging Face datasets:
```bash
conda run -n retinaface pip install datasets pillow scipy pyarrow
```
## 输出字段
每条样本都包含这些字段:
- image: 内嵌图片,可直接被 load_dataset 解码
- image_path: 相对路径
- event: WiderFace 事件目录名
- split: train 或 val
- width
- height
- bboxes: 人脸框列表,字段为 x y w h
- landmarks: 训练集的人脸关键点列表,字段为 x1 y1 ... x5 y5 v1 ... v5;验证集为空列表
- blur: 训练集原始 blur 分数列表;验证集为空列表
- easy_keep_indices: 验证集 easy 评估保留框索引,0-based;训练集为空列表
- medium_keep_indices: 验证集 medium 评估保留框索引,0-based;训练集为空列表
- hard_keep_indices: 验证集 hard 评估保留框索引,0-based;训练集为空列表
## 读取方式
```python
from datasets import load_dataset
root = "data/retinaface_widerface"
ds = load_dataset("parquet", data_files={
"train": f"{root}/train/*.parquet",
"val": f"{root}/val/*.parquet",
})
```
提供机构:
zhouxzh



