MichalMlodawski/closed-open-eyes

Name: MichalMlodawski/closed-open-eyes
Creator: MichalMlodawski
Published: 2024-07-20 13:18:07
License: 暂无描述

Hugging Face2024-07-20 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/MichalMlodawski/closed-open-eyes

下载链接

链接失效反馈

官方服务：

资源简介：

Open and Closed Eyes数据集是一个用于计算机视觉和机器学习任务的数据集，特别适用于识别和区分不同场景下的睁眼和闭眼状态。数据集包含约126,000个平衡样本，存储为Parquet文件，每个记录包含图像ID、左右眼的边界框坐标、标签（睁眼或闭眼）以及图像数据。数据集涵盖了多种类别，包括年龄、性别、场景、肤色、面部焦点、服装、发型、时间、天气、情绪和配饰等。此外，README还提供了数据集的伦理考虑、维护建议和引用方式。

The Open and Closed Eyes Dataset is designed for computer vision and machine learning tasks, particularly for recognizing and distinguishing between open and closed eyes. This dataset includes AI-generated images with a balanced distribution across various categories such as age groups, gender, scenery, skin color, face focus, clothing, hairstyle, time of day, weather, emotion, and accessories. The dataset is stored in Parquet files and includes metadata like image ID, bounding box coordinates for eyes, labels indicating open or closed eyes, and image data including the file and filename. The dataset is intended to be used for training and evaluating models, with ethical considerations and potential biases noted.

提供机构：

MichalMlodawski

原始信息汇总

Open and Closed Eyes Dataset

概述

名称: Open and Closed Eyes Dataset
语言: 英语
大小: 100K<n<1M
任务类别: 图像分类, 目标检测
标签: ai-generated, balanced-dataset
许可证: odc-by

数据集结构

存储格式: Parquet文件
文件命名: dataset_XXX.parquet

数据元素

Image_id: 图像的唯一标识符
Left_eye_react: 左眼边界框坐标
Right_eye_react: 右眼边界框坐标
Label: 眼睛状态标签（open_eyes 或 closed_eyes）
Image_data:
- file: 图像数据（字节格式）
- filename: 图像文件名（基于SHA256校验和）

类别和属性

Eyes:
- Open eyes
- Closed eyes
Age Groups:
- Infant, Young adult, Adult, Middle-aged, Senior, Elderly
Gender:
- Female, Male
Scenery:
- Inside train, Beach, Mountain, City, Forest, Desert, Car interior, Kitchen, Park, Office, Home living room, Space, Underwater, Airport terminal, Concert hall, Museum, Gym, Restaurant, Library, Farm, Art gallery, Rooftop, Garden, Cave, Waterfall, Castle interior, Shopping mall, University lecture hall, Ski resort lodge, Tropical beach house, Ancient temple interior, Futuristic city apartment, Hot air balloon basket, Carnival tent, Haunted house interior, Volcano observatory, Space station interior, Jungle treehouse, Arctic research station, Savanna safari camp, Cozy bedroom, Modern bathroom, Stylish home office, Luxurious hotel room, Rustic cabin interior, Industrial loft, Minimalist studio apartment, Vintage diner, School classroom, Hospital ward, Movie theater, Computer server room, Greenhouse interior, Subway station, Airport control tower, Lighthouse interior, Medieval tavern, Futuristic laboratory, Underground bunker, Treehouse interior, Ancient ruins, Underwater cave, Zen garden, Post-apocalyptic cityscape, Steampunk workshop, Fairy tale cottage, Cyberpunk street, Floating sky island, Abandoned amusement park, Crystal cave, Alien planet landscape, Medieval castle courtyard, Deep space nebula, Rainforest canopy, Arctic ice shelf, Volcanic landscape, Bustling bazaar, Tranquil monastery, Neon-lit nightclub, Retro 1950s diner
Skin Color:
- White, Black, Brown, Light, Dark, Olive, Tan, Albino, Freckled, Vitiligo, Reddish, Yellowish
Face Focus:
- Focus on left side, Focus on right side, Focus on center, Focus on top, Focus on bottom, Focus on eyes, Focus on nose, Focus on mouth, Focus on chin, Focus on forehead, Full face focus
Clothing:
- Casual, Formal, Sports, Traditional, Futuristic, Summer, Winter, Business, Swimwear, Nightwear, Costume, Uniform, Vintage, Bohemian, Punk, Gothic, High fashion, Streetwear, Cyberpunk, Steampunk, Medieval, Renaissance, Space suit, Superhero costume, Military uniform, Royalty attire, Hippie, Grunge, Preppy, Hip-hop fashion, Emo fashion
Hairstyle:
- Short hair, Long hair, Curly hair, Straight hair, Braided hair, Bald, Wavy hair, Ponytail, Buzz cut, Dreadlocks, Mohawk, Afro, Pixie cut, Bob cut, Undercut, Mullet, Side-swept hair, Spiky hair, Slicked back hair, Messy hair, Ombre hair, Highlighted hair, Two-toned hair, Asymmetrical hair, Pompadour, Quiff, Faux hawk, Bowl cut, Shag haircut, Layered hair, Feathered hair, Cornrows, Man bun, Topknot, Crown braid, Fishtail braid
Time of Day:
- Early morning, Mid-morning, Late morning, Noon, Early afternoon, Mid-afternoon, Late afternoon, Early evening, Dusk, Night, Midnight, Pre-dawn
Weather:
- Sunny, Partly cloudy, Overcast, Light rain, Heavy rain, Thunderstorm, Snowy, Blizzard, Foggy, Misty, Windy, Calm, Hail, Sleet, Hurricane, Tornado, Sandstorm, Heat wave, Cold snap, Rainbow
Emotion:
- Happy, Sad, Angry, Surprised, Neutral, Scared, Disgusted, Confused, Excited, Thoughtful, Amused, Bored, Confident, Curious, Embarrassed, Proud, Relieved, Anxious, Hopeful, Determined
Accessories:
- Hat, Cap, Beanie, Scarf, Earrings, Necklace, Bracelet, Ring, Watch, Tie, Bow tie, Bandana, Headband, Hair clip, Belt, Suspenders, Gloves, Handbag, Backpack, Umbrella, Cane, Walking stick, Monocle, Pocket watch, Brooch, Lapel pin, None

使用方法

访问数据: 使用PyArrow或Pandas加载Parquet文件。
图像数据: 使用PIL或OpenCV解码和显示图像。
边界框: 使用边界框坐标精确定位眼睛。
标签和元数据: 根据提供的标签和元数据过滤和分类图像。

伦理考虑和限制

潜在的NSFW内容: 可能包含不适合工作环境的内容。
文化特异性: 可能不完全代表所有文化背景。
潜在偏见: 生成过程中可能存在性别、年龄和种族偏见。
图像多样性和复杂性: 某些方面的多样性和复杂性可能有限。

引用

@misc{open_closed_eyes2024, author = {Michał Młodawski}, title = {Open and Closed Eyes Dataset}, month = July, year = 2024, url = {https://huggingface.co/datasets/MichalMlodawski/closed-open-eyes}, }

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，眼睑状态识别对于疲劳检测、情感分析等应用至关重要。本数据集通过人工智能生成技术构建，包含约12.6万张平衡样本，以Parquet格式高效存储。数据生成过程涵盖了多样化的年龄组别、性别、肤色、场景、服饰、发型、时间、天气、情绪及配饰等属性，确保了样本的广泛代表性。每张图像均标注了唯一的图像标识符、左右眼边界框坐标以及眼睑开闭状态标签，图像数据以字节形式存储，文件名基于SHA256校验和生成，保障了数据的完整性与可追溯性。

使用方法

研究人员可通过PyArrow或Pandas等库加载Parquet文件，便捷地访问结构化数据。图像字节数据可利用PIL或OpenCV进行解码与可视化处理。左右眼边界框坐标可直接用于眼部定位与检测模型的训练与评估。标签与元数据支持按场景、情感、人口属性等多重维度进行数据筛选与子集构建，适用于图像分类、目标检测乃至细粒度属性分析等任务。使用时应留意数据生成过程中可能存在的文化特异性与潜在偏差，并在模型开发中纳入适当的偏差检测与缓解策略。

背景与挑战

背景概述

在计算机视觉领域，眼睑状态识别是面部行为分析、疲劳检测及人机交互等应用的核心基础。MichalMlodawski于2024年构建的Open and Closed Eyes数据集，旨在通过人工智能生成技术，提供大规模、多样化的睁眼与闭眼图像样本。该数据集包含约12.6万张平衡样本，覆盖不同年龄、性别、肤色、场景及情感状态，其结构化标注包括眼部边界框坐标与状态标签，为模型训练与评估提供了高泛化性的数据资源。该资源的发布，显著推动了眼睑状态识别模型在复杂真实场景中的鲁棒性研究，并为相关应用领域的算法优化奠定了数据基础。

当前挑战

该数据集致力于解决眼睑状态识别在多样化真实场景中的泛化性问题，其核心挑战在于如何准确区分光照变化、头部姿态偏移及面部遮挡等因素干扰下的睁闭眼状态。在构建过程中，挑战主要体现在生成数据的多样性与真实性平衡：一方面需确保涵盖广泛的人口属性、场景与情感组合，以模拟现实世界的复杂性；另一方面需控制生成图像的质量与标注一致性，避免因生成偏差引入模型训练噪声。此外，数据集中潜在的文化特异性与生成偏差，也对模型的公平性与泛化能力提出了持续性的验证要求。

常用场景

经典使用场景

在计算机视觉领域，眼睑状态识别是面部行为分析的基础任务之一。该数据集通过提供大量标注清晰的睁眼与闭眼图像，为训练高精度分类模型奠定了数据基础。其经典使用场景在于构建端到端的图像分类系统，模型能够依据眼部特征准确判断睁闭状态，这一过程常涉及卷积神经网络等深度学习架构的优化与验证。

解决学术问题

该数据集有效应对了学术研究中样本多样性与标注一致性的挑战。通过涵盖不同年龄、性别、肤色及复杂场景下的眼部图像，它缓解了模型因数据单一而导致的泛化能力不足问题。其意义在于为眼动分析、疲劳检测等研究方向提供了标准化评估基准，推动了跨场景鲁棒性算法的进步。

实际应用

在实际应用中，该数据集支撑了驾驶员疲劳监测、安防系统中的活体检测以及无障碍交互界面的开发。例如，在智能座舱系统内，模型可实时分析驾驶员眼睑状态，预警疲劳驾驶风险；在金融身份验证场景，则能辅助判别用户是否为真实活体，增强安全防护层级。

数据集最近研究