five

DIF

收藏
arXiv2019-09-09 更新2024-06-21 收录
下载链接:
https://sites.google.com/view/difproject/home
下载链接
链接失效反馈
官方服务:
资源简介:
DIF(感知醉酒人脸数据集)是由印度理工学院罗帕尔分校创建的第一个用于自动双模非侵入式醉酒检测的音视频数据库。该数据集包含从在线资源获取的醉酒和清醒人士的视听数据,总计6427个视频片段,用于训练深度学习算法以预测个人是否醉酒。数据集的创建涉及从YouTube等网站收集视频,并通过视频标题和描述进行分类。DIF数据集的应用领域主要集中在减少因醉酒驾驶引起的交通事故和相关经济损失,通过在车辆中集成自动醉酒驾驶员检测系统来实现。

DIF (Perceptual Drunken Face Dataset) is the first audio-visual database developed by the Indian Institute of Technology Ropar for automated dual-mode non-invasive drunkenness detection. This dataset contains audio-visual data of drunk and sober individuals collected from online resources, with a total of 6,427 video clips, which are used to train deep learning algorithms to predict whether a person is intoxicated. The creation of the DIF dataset involves collecting videos from platforms such as YouTube and classifying them based on their titles and descriptions. The main application fields of the DIF dataset focus on reducing traffic accidents and associated economic losses caused by drunk driving, which can be realized by integrating automated drunk driver detection systems into vehicles.
提供机构:
印度理工学院罗帕尔分校
创建时间:
2018-05-25
搜集汇总
数据集介绍
main_image_url
构建方式
DIF 数据集的构建方式是通过从在线社交平台上收集酒精影响下和清醒状态下的人的视频。为了确保数据集的真实性和多样性,研究者使用了YouTube和Periscope等网站,通过搜索关键词如“醉酒反应”、“醉酒评论”等来获取醉酒状态下的视频,并从YouTube上收集反应视频作为清醒状态下的样本。这些视频随后被处理和剪辑,以提取面部视频帧,并使用OpenFace工具进行面部对齐。最终,数据集包含4658个醉酒面部视频和1769个清醒面部视频,每个视频时长为10秒。
使用方法
DIF 数据集的使用方法包括以下几个方面:首先,可以使用数据集中的面部视频进行面部动作和表情的分析,以检测酒精影响下的面部变化。其次,可以使用音频数据来分析醉酒状态下的语音特征,如音调、音量和强度等。此外,还可以使用数据集中的面部视频和音频数据进行深度学习模型的训练和验证,以提高酒精检测的准确性和鲁棒性。最后,可以使用数据集中的面部视频和音频数据进行跨模态融合,以进一步提高酒精检测的性能。
背景与挑战
背景概述
DIF数据集(Dataset of Perceived Intoxicated Faces)是一个音频视觉数据库,旨在帮助开发自动化的酒驾检测系统。该数据集由Vineet Mehta、Sai Srinadhu Katta、Devendra Pratap Yadav和Abhinav Dhall等人于2018年在印度理工学院罗帕尔创建。DIF数据集包含了来自在线资源的酒驾和清醒人群的音频视觉数据,是首个用于自动双模态非侵入式酒驾检测的数据集。该数据集的核心研究问题是通过分析人的面部表情和声音变化来检测是否酒驾,从而减少交通事故和相关经济损失。DIF数据集的创建对酒驾检测领域产生了深远的影响,为后续研究提供了宝贵的数据资源。
当前挑战
DIF数据集面临着一些挑战。首先,所解决的领域问题,即酒驾检测,具有复杂性和不确定性,需要更精确和鲁棒的模型。其次,在构建过程中,数据集的收集和标注存在一定的主观性和不确定性,可能会影响模型的泛化能力。此外,DIF数据集的规模相对较小,可能无法满足大规模模型的训练需求。为了克服这些挑战,研究人员需要进一步探索更精确的酒驾检测模型,改进数据集的收集和标注方法,以及扩大数据集的规模。
常用场景
经典使用场景
DIF数据集主要用于研究和开发非侵入式醉酒驾驶检测系统,通过分析醉酒与清醒状态下人们的面部视频和音频数据,实现对驾驶员是否醉酒的自动识别。该数据集包含了大量从在线资源获取的醉酒与清醒人群的音视频数据,为深度学习算法的训练提供了充足的数据基础。
解决学术问题
DIF数据集的提出解决了现有醉酒检测方法需要特殊设备如心电图、红外相机或呼吸分析仪的问题。通过行为分析,即检测酒精摄入后行为特征的变化,如面部表情、步态或语音,来实现醉酒检测。DIF数据集为自动双模态非侵入式醉酒检测提供了首个音视频数据库,使得基于深度学习的行为分析方法成为可能,为减少交通事故和相关经济损失提供了新的途径。
实际应用
DIF数据集在实际应用中,可以用于开发车载自动醉酒驾驶检测系统,通过分析驾驶员的面部视频和音频数据,实现对驾驶员是否醉酒的自动识别,从而减少交通事故的发生。此外,DIF数据集还可以用于开发基于智能手机的应用程序,通过分析用户的语音或视频数据,帮助用户自我检测是否醉酒,从而提高饮酒安全。
数据集最近研究
最新研究方向
DIF数据集为醉驾人员识别提供了一个新颖的音频视觉数据库,其中包含清醒和醉酒人员的音频视频数据。该数据集的提出标志着自动双模态非侵入性醉酒检测的第一个工作,旨在通过分析面部视频和音频信号来识别醉酒状态。在视觉分析方面,研究团队采用了CNN-RNN和3D CNN架构来提取时空特征。为了降低3D CNN的复杂性和参数数量,研究者们提出了一个基于在空间和时间通道之间引入非线性关系的3D卷积块的简单变体。音频分析则基于OpenSmile库提取的音频特征,并训练了深度神经网络和LSTM网络。最后,研究采用决策集成方法将视觉和音频模型融合,以提高醉酒检测的准确性。该研究不仅展示了从网络视频中检测醉酒状态的可能性,而且为未来的醉酒驾驶检测提供了有价值的参考。
相关研究论文
  • 1
    DIF : Dataset of Perceived Intoxicated Faces for Drunk Person Identification印度理工学院罗帕尔分校 · 2019年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作