five

EngageNet|用户参与度数据集|用户体验研究数据集

收藏
arXiv2023-08-17 更新2024-06-21 收录
用户参与度
用户体验研究
下载链接:
https://github.com/engagenet/engagenet_baselines
下载链接
链接失效反馈
资源简介:
EngageNet数据集是由印度理工学院罗帕尔分校创建的大型多维度用户参与度预测数据集。该数据集包含31小时的数据,涵盖127名参与者在不同光照条件下的行为和认知参与度。数据集通过设计一项研究收集,参与者观看三个刺激视频并通过网络互动平台回答相关问题。EngageNet旨在通过捕捉行为和认知方面的参与度,为开发真实世界条件下的参与度预测系统提供丰富的数据支持。该数据集的应用领域包括教育、用户体验研究和人类-机器人交互,旨在解决在线互动中的用户参与度问题。
提供机构:
印度理工学院罗帕尔分校
创建时间:
2023-02-01
AI搜集汇总
数据集介绍
main_image_url
构建方式
EngageNet数据集通过设计一个基于网络平台的实验来构建,参与者在观看三个刺激视频后回答相关问题。数据集包括31小时的视频数据,涵盖127名参与者,这些参与者在不同的光照条件下进行互动。数据集的构建不仅捕捉了行为层面的用户参与度,如头部姿势、眼神和面部表情,还通过问卷调查评估了认知层面的参与度。此外,数据集还引入了数字教师(虚拟头像)以研究其对用户参与度的影响。
使用方法
EngageNet数据集可用于开发和验证用户参与度预测模型。研究者可以利用数据集中的行为特征(如头部姿势、眼神和面部表情)和认知特征(如问卷回答)来训练和测试模型。数据集的公开代码和模型链接为研究者提供了便捷的实验平台,使其能够快速上手并进行相关研究。
背景与挑战
背景概述
EngageNet数据集由印度理工学院卢普尔分校和KDDI研究所的研究人员于2023年创建,旨在解决大规模用户参与度预测问题。该数据集包含了31小时的视频数据,涵盖了127名参与者在不同光照条件下的行为、认知和情感线索。通过设计一个基于网络的互动平台,研究人员记录了参与者观看刺激视频并回答相关问题的过程,从而捕捉了用户的多方面参与度。EngageNet的推出填补了现有数据集在多维度参与度记录方面的空白,并为未来的用户参与度检测技术提供了丰富的基准数据。
当前挑战
EngageNet数据集在构建过程中面临了多重挑战。首先,用户参与度的多维度特性要求数据集能够同时捕捉行为、认知和情感线索,这增加了数据采集和标注的复杂性。其次,数据集的多样性要求在不同光照条件和环境下的数据采集,确保了数据的广泛适用性。此外,数据集中的类别不平衡问题也是一个显著挑战,尤其是‘高度参与’类别的样本数量远超其他类别,可能导致模型在预测低参与度类别时表现不佳。未来研究需要探索解决类别不平衡问题的方法,如合成数据生成或加权损失函数。
常用场景
经典使用场景
EngageNet数据集的经典使用场景主要集中在用户参与度预测领域,尤其是在在线教育、虚拟会议和数字营销等场景中。通过分析用户在观看视频或与虚拟教师互动时的行为、认知和情感反应,研究者可以构建模型来预测用户的参与度。例如,在在线课堂中,教师可以通过检测学生的头部姿态、眼神注视和面部表情来判断学生的专注程度,从而调整教学策略以提高学生的参与感。
解决学术问题
EngageNet数据集解决了用户参与度预测中的多个学术问题,特别是在多模态数据融合和行为、认知、情感等多维度参与度分析方面。该数据集通过捕捉用户在自然环境中的行为数据,帮助研究者更好地理解用户在不同情境下的参与度变化。这不仅为参与度预测模型的开发提供了丰富的数据支持,还为跨学科研究(如人机交互、计算机视觉和心理学)提供了新的研究方向。
实际应用
EngageNet数据集在实际应用中具有广泛的潜力,尤其是在在线教育、数字营销和用户体验研究等领域。例如,在在线教育平台中,系统可以通过分析学生的参与度数据,自动调整教学内容或提醒学生保持专注。在数字营销中,广告商可以通过分析用户在观看广告时的参与度,优化广告策略以提高用户的兴趣和参与感。此外,该数据集还可用于开发智能机器人,使其能够根据用户的参与度动态调整交互方式。
数据集最近研究
最新研究方向
近年来,用户参与度预测在人机交互(HCI)领域引起了广泛关注,尤其是在在线教育和虚拟会议等场景中。EngageNet数据集通过捕捉用户在自然环境中的行为、认知和情感等多维度参与度,为这一领域的研究提供了丰富的资源。该数据集不仅涵盖了31小时的多模态数据,还引入了数字教师(虚拟头像)以探索其对用户参与度的影响。研究者们通过实验验证了该数据集在行为和认知参与度预测中的有效性,并提出了多种深度学习模型作为基准。此外,数据集的公开发布为未来的研究提供了基准,特别是在跨数据集验证和个性化用户体验设计方面,具有重要的研究价值和应用前景。
相关研究论文
  • 1
    Do I Have Your Attention: A Large Scale Engagement Prediction Dataset and Baselines印度理工学院罗帕尔分校 · 2023年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

NIH Chest X-rays

Over 112,000 Chest X-ray images from more than 30,000 unique patients

kaggle 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

中国区域地面气象要素驱动数据集 v2.0(1951-2020)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 70 年(1951~2020 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 70 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。CMFD 2.0 的数据内容与此前宣传的 CMFD 1.7 基本一致,仅对 1983 年 7 月以后的向下短/长波辐射通量数据进行了更新,以修正其长期趋势存在的问题。2021 年至 2024 年的 CMFD 数据正在制作中,计划于 2025 年上半年发布,从而使 CMFD 2.0 延伸至 2024 年底。

国家青藏高原科学数据中心 收录

糖尿病预测数据集

糖尿病相关的医学研究或者健康数据

AI_Studio 收录