five

DiversityOne

收藏
arXiv2025-02-06 更新2025-02-11 收录
下载链接:
https://livepeople.disi.unitn.it
下载链接
链接失效反馈
官方服务:
资源简介:
DiversityOne数据集是由多国研究机构合作创建的,包含来自八个国家(中国、丹麦、印度、意大利、墨西哥、蒙古、巴拉圭和英国)的782名大学生四周内的智能手机传感器数据及自我报告信息。该数据集整合了26种智能手机传感器的原始数据和350,000+条自我报告,是当前公开可用数据集中最大、最多样化的数据集之一。数据集覆盖了广泛的人口统计和心理社会调查数据,适用于研究移动计算、普遍计算和机器学习领域的行为识别、跨文化研究以及多模态时间序列建模等课题。

The DiversityOne dataset was collaboratively created by research institutions across multiple countries. It contains smartphone sensor data and self-reported information from 782 college students across eight countries (China, Denmark, India, Italy, Mexico, Mongolia, Paraguay, and the United Kingdom), collected over a four-week period. This dataset integrates raw data from 26 smartphone sensors and over 350,000 self-reported entries, making it one of the largest and most diverse publicly available datasets to date. It covers a wide range of demographic and psychosocial survey data, and is applicable to research topics including behavior recognition, cross-cultural studies, and multimodal time series modeling in the domains of mobile computing, pervasive computing, and machine learning.
提供机构:
多国合作研究机构
创建时间:
2025-02-06
搜集汇总
数据集介绍
main_image_url
构建方式
DiversityOne数据集的构建方法是通过在八个国家(中国、丹麦、印度、意大利、墨西哥、蒙古、巴拉圭和英国)招募782名大学生进行为期四周的数据收集。参与者被要求使用名为iLog的应用程序,该应用程序能够收集来自26种智能手机传感器的原始数据,包括加速度计、陀螺仪和GPS等。此外,参与者还提供了超过350,000个自我报告,包括时间日记,详细记录了他们的活动、位置、社交环境和情绪。数据集的设计考虑了不同国家和文化背景下的行为差异,以确保数据的多样性和代表性。
特点
DiversityOne数据集的特点在于其多样性和全面性。数据集跨越八个国家,包括来自不同文化背景的参与者,这使得研究者能够研究行为模式在国家和地区之间的差异。数据集包含了从26种智能手机传感器收集的原始数据,以及超过350,000个自我报告,这些报告提供了对参与者日常生活的深入了解。此外,数据集还包含了详细的调查数据,包括人口统计学和心理社会学变量,为研究提供了更多的维度。DiversityOne数据集是迄今为止最大的、最具地理多样性的公开数据集之一,为研究日常行为提供了宝贵的资源。
使用方法
DiversityOne数据集的使用方法是通过访问数据集目录,该目录提供了关于数据集内容、大小、格式和其他相关信息的元数据。研究人员可以根据自己的研究目的,选择单个传感器数据或数据集的子集。数据集以Parquet格式提供,这是一种高效的存储格式,具有高压缩率。为了获取数据,研究人员需要填写一个请求表格,说明他们的研究目的和数据需求。一旦请求被批准,研究人员将签署一份条款和许可协议,并收到下载数据集的说明。数据集的访问和使用遵循GDPR的规定,确保了个人隐私和数据安全。
背景与挑战
背景概述
DiversityOne数据集是针对日常行为建模的多国智能手机传感器数据集。该数据集由意大利特伦托大学、瑞士苏黎世联邦理工学院、丹麦哥本哈根信息技术大学、印度阿米塔维斯瓦维迪亚佩斯大学、中国吉林大学、墨西哥皮奥西诺科学和技术研究所、英国伦敦政治经济学院、蒙古国国立大学、巴拉圭天主教“圣母升天”大学等多国研究机构联合创建。数据集收集了来自八个国家782名大学生四周的数据,包括26种智能手机传感器模态和350K+自我报告。DiversityOne是目前可公开获取的最大、最具多样性的数据集之一,它具有广泛的人口统计学和心理社会调查数据。DiversityOne为研究无处不在的计算领域中的重要研究问题提供了可能性,特别是在域适应和跨国家泛化方面。
当前挑战
DiversityOne数据集面临的挑战包括:1)所解决的领域问题的挑战,即如何通过智能手机传感器和自我报告数据来理解和建模年轻人日常生活中的行为;2)构建过程中所遇到的挑战,包括跨文化差异、数据隐私保护、大规模数据收集的复杂性、参与者的招募和保持参与、技术基础设施和离线解决方案、以及标签质量等问题。
常用场景
经典使用场景
DiversityOne数据集主要用于研究年轻人日常生活中智能手机的使用行为,包括活动模式、社交互动、情绪状态、睡眠质量等方面。通过对来自八个国家(中国、丹麦、印度、意大利、墨西哥、蒙古、巴拿马和英国)的782名大学生的数据进行分析,可以探索不同文化背景下人类行为的差异性和相似性,为移动应用设计和数字健康干预提供支持。
实际应用
DiversityOne数据集在实际应用中可用于开发更精确和个性化的行为识别模型,这些模型可以应用于各种领域,如健康监测、行为分析和活动识别。通过对智能手机传感器数据的分析,可以推断用户的情绪状态、日常活动和社交互动,从而为用户提供实时的健康建议和行为反馈。此外,数据集还可以用于研究和开发适应不同文化背景的用户界面和交互设计,以提高移动应用的可用性和用户体验。
衍生相关工作
DiversityOne数据集的发布推动了多个相关领域的研究工作。例如,研究人员利用该数据集研究了情绪识别模型在不同国家之间的泛化能力,以及如何通过混合模型个性化来提高模型的准确性。此外,数据集还被用于探索多模态数据集成的高级技术,以及如何解决跨国家数据分布的挑战。这些研究成果为开发更精确、更鲁棒和更个性化的行为识别模型提供了重要的参考和指导。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作