A Dataset of Low-Rated Applications from the Amazon Appstore for User Feedback Analysis

Name: A Dataset of Low-Rated Applications from the Amazon Appstore for User Feedback Analysis
Creator: 北京工业大学; 赫特福德大学; CECOS IT与新兴科学大学; 西安理工大学; 大连理工大学
Published: 2026-01-06 21:32:49
License: 暂无描述

arXiv2026-01-06 更新2026-01-08 收录

下载链接：

https://data.mendeley.com/datasets/zztwrn36n8/1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由北京工业大学等机构联合创建，收录了亚马逊应用商店中64款低评分应用程序的79,821条用户评论，旨在揭示影响用户体验的常见问题。数据集包含原始评论和6,000条人工标注的子集，标注涉及用户界面、功能特性、兼容性、性能稳定性等六类问题。数据通过自动化网络爬虫采集，并经过严格的质量控制流程，适用于机器学习模型训练和用户反馈分析。该数据集主要应用于软件质量改进、用户体验研究和市场分析，帮助开发者识别和解决导致低评分的核心问题。

This dataset was jointly created by Beijing University of Technology and other institutions. It houses 79,821 user reviews of 64 low-rated applications from the Amazon Appstore, with the core objective of identifying common issues that undermine user experience. The dataset comprises both raw user reviews and a manually annotated subset of 6,000 entries, where annotations cover six categories of issues including user interface, functional features, compatibility, and performance stability, among others. Collected via automated web crawlers and validated through strict quality control workflows, this dataset is suitable for machine learning model training and user feedback analysis. It is primarily utilized in software quality improvement, user experience research, and market analysis, enabling developers to recognize and resolve the core issues that result in low application ratings.

提供机构：

北京工业大学; 赫特福德大学; CECOS IT与新兴科学大学; 西安理工大学; 大连理工大学

创建时间：

2026-01-06

搜集汇总

数据集介绍

构建方式

在移动应用生态系统的质量评估领域，该数据集通过系统化方法从亚马逊应用商店采集低评分应用的用户反馈。研究团队设定了明确的筛选标准：选择用户评分低于三星且拥有大量评论的应用，以确保数据反映普遍性问题而非个别观点。采用自动化网络爬虫工具Instant Data Scraper从应用商店页面提取评分、评论标题和完整评论文本，随后通过人工审核确保数据符合筛选条件。经过严格的数据清洗流程去除重复与不一致信息后，最终将64款涵盖14个类别的应用共79,821条评论整理为结构化表格，其中6,000条评论经过人工标注，划分为六大问题类别。

特点

该数据集的核心特征在于其专注于低评分应用的用户反馈，这为理解软件质量缺陷提供了独特视角。数据涵盖14个应用类别，包括商业、教育、游戏等主流领域，确保了样本的多样性。每条记录包含量化评分、评论标题、完整文本及人工标注的问题类型，其中问题分类体系覆盖用户界面体验、功能特性、兼容性、性能稳定性、客户支持及安全隐私六大维度。特别值得注意的是，数据集同时提供原始数据与标注数据，为机器学习模型训练与验证提供了双重支持。这种结构设计使得数据集既能支持细粒度的情感分析，又能服务于需求工程领域的自动化分类研究。

使用方法

该数据集为软件工程与自然语言处理研究提供了多层次的实践路径。研究者可利用标注数据训练监督学习模型，实现用户反馈的自动分类与问题识别；原始数据则适用于无监督学习方法，如潜在狄利克雷分配主题建模，以挖掘负面评价中的潜在模式。在应用层面，开发者可通过分析高频问题类型优先处理软件缺陷，教育机构可将其纳入需求工程课程，演示众包需求获取的实际案例。此外，数据集支持细粒度分析任务，包括讽刺检测、情感分析及多标签分类研究，为构建自动化客户服务系统提供数据基础。通过公开的GitHub与Mendeley存储库，用户可便捷获取数据并复现相关研究。

背景与挑战

背景概述

在数字应用市场竞争日益激烈的背景下，用户反馈分析已成为提升软件质量与用户体验的关键途径。由北京工业大学、赫特福德大学等机构的研究人员于2023年共同创建的《亚马逊应用商店低评分应用数据集》，聚焦于用户评分在三星及以下的64款应用，涵盖14个类别共计79,821条评论。该数据集的核心研究问题在于系统性地挖掘低评分应用中的常见缺陷，通过人工标注将6000条评论归类为界面体验、功能特性、兼容性、性能稳定性、客户支持及安全隐私六大问题类型，为基于机器学习的用户反馈自动分类提供了重要资源。其创新性在于填补了低评分应用分析的数据空白，推动了以用户为中心的软件演化研究，对软件工程、自然语言处理及用户体验设计领域产生了实质性影响。

当前挑战

该数据集旨在解决低评分应用中用户反馈的自动分类与根因分析问题，其核心挑战在于如何从非结构化的文本评论中准确识别并归类多维度的软件缺陷。具体而言，用户评论常包含复合性问题，例如同一评论同时涉及性能与安全议题，这要求模型具备多标签分类能力，而现有标注体系尚未充分支持此类复杂场景。在数据构建过程中，研究者面临亚马逊平台政策变更带来的数据获取限制，自动化爬虫工具仅能抓取每款应用的前10页评论，导致数据覆盖可能不完整，影响对长尾问题的捕捉。此外，数据集的泛化能力受限于单一应用商店，不同平台用户行为与反馈模式的差异使得结论迁移存在挑战；手动标注虽经多人校验以保证一致性，但仍存在主观判断的潜在偏差，对模型训练的可靠性构成考验。

常用场景

经典使用场景

在软件工程与用户体验研究领域，该数据集最经典的应用场景在于为基于机器学习的用户反馈自动分类提供训练与验证基础。其包含的六万条标注评论，涵盖了用户界面体验、功能特性、兼容性、性能稳定性、客户支持及安全隐私六大问题类别，为构建精准的分类模型提供了结构化标注数据。研究人员能够利用该数据集训练监督学习模型，实现对海量低评分应用评论的自动化问题识别与归类，显著提升了从非结构化文本中提取软件质量洞察的效率。

实际应用

在实际应用层面，该数据集为软件开发商和产品团队提供了直接的行动指南。通过分析数据集中揭示的常见问题模式，开发团队可以优先处理导致用户流失的关键缺陷，例如性能瓶颈或安全漏洞，从而进行有针对性的版本更新与功能优化。此外，该数据集支撑了自动化客户服务系统的开发，系统能够自动识别用户反馈中的问题类型并生成初步回复，提升了客户支持的效率与及时性。这有助于企业降低用户流失率，并基于客观数据制定更有效的软件迭代策略。

衍生相关工作

围绕该数据集已衍生出一系列经典研究工作，拓展了其在软件工程与自然语言处理交叉领域的应用边界。例如，有研究利用该数据集结合微调的机器学习与深度学习算法，深入挖掘应用商店中频繁出现的问题模式。另一项工作则探索使用ChatGPT等大型语言模型来识别用户评论中蕴含的复杂情感。此外，还有研究专注于从评论中检测与分类反讽表达，以提升情感分析的准确性。这些衍生工作共同推进了基于用户反馈的自动化软件分析技术，为软件演化与质量保障提供了更丰富的分析维度和方法论支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集