five

MobileRec

收藏
arXiv2023-03-12 更新2024-06-21 收录
下载链接:
https://huggingface.co/datasets/recmeapp/mobilerec
下载链接
链接失效反馈
官方服务:
资源简介:
MobileRec是由中佛罗里达大学等机构创建的大规模数据集,专注于移动应用推荐。该数据集包含1930万用户与超过10000个独特应用的交互记录,涵盖48个类别,记录了70万用户的序列活动。每个用户至少与五个不同的应用交互,这与其他移动应用数据集不同。此外,MobileRec还包含用户评分和情感分析,以及每个应用的丰富元数据,如应用名称、类别、描述和总体评分等。该数据集旨在解决移动应用推荐系统研究中的数据稀缺问题,并为推荐算法提供基准测试。

MobileRec is a large-scale dataset dedicated to mobile application recommendation, developed by the University of Central Florida and other research institutions. It encompasses interaction records between 19.3 million users and over 10,000 unique applications across 48 categories, as well as sequential activity logs from 700,000 users. A key distinction that sets MobileRec apart from other mobile application datasets is that each user has interacted with at least five distinct applications. Additionally, MobileRec includes user ratings and sentiment analysis results, alongside comprehensive metadata for each application, such as the app's name, category, description, overall rating and other relevant information. This dataset aims to address the data scarcity problem in mobile application recommendation system research and provide a benchmark for evaluating recommendation algorithms.
提供机构:
中佛罗里达大学
创建时间:
2023-03-12
搜集汇总
数据集介绍
main_image_url
构建方式
MobileRec数据集的构建基于Google Play商店的用户活动数据。研究团队通过自动化工具Selenium WebDriver收集了所有直接可访问的应用程序包名称,并下载了相关的应用程序元数据。这些元数据包括应用程序的名称、开发者、类别和文本描述等详细信息。随后,团队通过访问每个应用程序的用户评论部分,递归地滚动页面并提取评论文本、用户评分、用户信息和时间戳,直到给定应用程序没有更多评论可用。为了确保数据质量,研究团队实施了一系列检查,以消除重复项、错误信息和在爬取过程中可能出现的其他错误。最终,他们创建了一个包含用户评论(即带时间戳的交互)的大型5-core数据集,为Google Play上可用的应用程序提供了宝贵的见解。
特点
MobileRec数据集具有以下特点:首先,它包含超过1930万次用户与应用程序的交互,跨越了超过1万个独特的应用程序,涵盖了48个类别。其次,每个用户至少与5个不同的应用程序进行了交互,这与之前的数据集形成了鲜明对比,之前的数据集只记录了每个用户的一次交互。此外,MobileRec还记录了用户的评分、对已安装应用程序的情感以及每个应用程序的丰富元数据,如应用程序名称、类别、描述和总体评分等。最后,数据集还提供了用户行为趋势分析,例如用户如何根据他们的评论交互从一个类别迁移到另一个类别,用户的行为如何随着应用程序定价的变化而演变,以及用户如何根据应用程序的内容评级从一个应用程序迁移到另一个应用程序。
使用方法
MobileRec数据集可以用于多种用途。首先,它是一个用于构建和评估应用程序推荐系统的宝贵资源。通过比较研究,研究团队展示了MobileRec如何作为应用程序推荐研究的实验平台,并建立了基准结果。其次,该数据集可以用于其他研究目的,如情感分析、应用程序开发和优化、市场研究以及欺诈检测。例如,它可以揭示用户行为模式,帮助开发者了解用户偏好,从而改进应用程序设计。此外,数据集的分析结果可以为企业提供市场洞察,帮助他们制定更有效的营销策略。最后,MobileRec还可以用于欺诈检测,通过分析用户交互模式,识别潜在的虚假评论和评分。
背景与挑战
背景概述
随着移动互联网的迅猛发展,移动应用市场已变得极为庞大且竞争激烈。用户在浩如烟海的应用中寻找符合个人需求的软件变得越来越困难,这催生了移动应用推荐系统的研究。MobileRec数据集应运而生,旨在为移动应用推荐系统的研究提供高质量的基准数据集。MobileRec数据集由美国中佛罗里达大学的M.H.Maqbool等人于2023年创建,收集了Google Play商店上的用户活动数据。该数据集包含了超过1930万条用户交互记录,涉及超过1万个独特的应用,跨越48个类别。MobileRec的创建填补了移动应用推荐系统研究领域中高质量基准数据集的空白,为研究者提供了宝贵的资源,推动了该领域的发展。
当前挑战
MobileRec数据集在解决移动应用推荐问题的同时,也面临着一些挑战。首先,移动应用推荐领域的问题在于如何有效地从海量的应用中为用户提供个性化的推荐。其次,在构建MobileRec数据集的过程中,研究者们面临了数据收集、清洗和处理的挑战。数据收集过程中需要确保数据的全面性和准确性,而在数据清洗和处理过程中则需要去除冗余和错误数据,确保数据质量。此外,移动应用市场的高度动态性也给推荐系统带来了挑战,用户兴趣和行为的快速变化使得推荐系统需要不断更新和调整以适应新的情况。
常用场景
经典使用场景
MobileRec数据集主要用于移动应用推荐系统的研究与开发。该数据集记录了用户在Google Play商店的活动,包括用户对应用的评论、评分、安装时间等。这些数据可以用于训练和测试各种推荐算法,帮助开发人员提高推荐系统的准确性和效率。例如,研究人员可以利用MobileRec数据集来评估不同推荐算法的性能,比如基于流行度的推荐、基于序列的推荐、基于会话的推荐等。此外,MobileRec数据集还可以用于研究用户行为,例如分析用户在应用商店中的迁移模式、用户对不同类别应用的偏好等。
解决学术问题
MobileRec数据集解决了移动应用推荐系统中缺乏高质量基准数据集的问题。现有的推荐数据集,如Amazon Product Reviews和MovieLens,虽然在各自的领域内极大地促进了推荐系统的研究与开发,但它们并不适用于移动应用推荐系统,因为移动应用的特性和用户行为与产品和电影等领域存在显著差异。MobileRec数据集提供了大规模、丰富且多样化的基准数据集,使得研究人员能够更好地理解和建模移动应用推荐问题。此外,MobileRec数据集还提供了用户对应用的评论、评分、安装时间等丰富的上下文信息,以及应用的元数据,如应用名称、类别、描述、总体评分等,这些信息对于研究和开发移动应用推荐系统具有重要的价值。
衍生相关工作
MobileRec数据集的发布推动了移动应用推荐系统的研究与开发。基于MobileRec数据集,研究人员开发了各种新的推荐算法和模型,例如基于序列的推荐、基于会话的推荐、基于图的推荐等。这些算法和模型在MobileRec数据集上的表现表明,它们能够有效地处理用户与应用的交互序列,提供更准确、个性化的推荐。此外,MobileRec数据集还促进了自然语言处理技术在移动应用推荐系统中的应用,例如使用预训练语言模型来提取用户评论中的语义信息,提高推荐系统的准确性和效率。MobileRec数据集的发布和应用,为移动应用推荐系统的研究与开发开辟了新的方向,推动了该领域的进步和发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作