Amazon Product Reviews|产品评价数据集|电子商务数据集
收藏
- Amazon首次公开发布Amazon Product Reviews数据集,标志着大规模消费者评论数据的开放获取。
- Amazon Product Reviews数据集首次应用于情感分析研究,推动了自然语言处理领域的发展。
- 该数据集被广泛用于推荐系统研究,特别是在个性化推荐算法中的应用取得了显著成果。
- Amazon Product Reviews数据集成为机器学习和数据挖掘领域的重要基准数据集之一,促进了相关算法的发展。
- 随着数据隐私保护意识的增强,Amazon对数据集进行了更新,增加了匿名化处理,以符合新的数据保护法规。
- 1From Amateurs to Connoisseurs: Modeling the Evolution of User Expertise through Online ReviewsCornell University · 2013年
- 2Sentiment Analysis of Amazon Product Reviews Using Machine Learning TechniquesUniversity of California, Irvine · 2020年
- 3A Comparative Study of Sentiment Analysis Techniques on Amazon Product ReviewsUniversity of Waterloo · 2019年
- 4Exploring the Impact of Review Helpfulness on Product Sales Using Amazon Product ReviewsUniversity of Pennsylvania · 2018年
- 5Predicting Product Success Using Sentiment Analysis on Amazon ReviewsUniversity of Michigan · 2017年
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
QM9
该数据集名为QM9,包含了134,000个分子的信息,可用于生成点云的建模工作,同时也可应用于分子动力学的研究以及点云生成任务中。
arXiv 收录
PCLT20K
PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。
arXiv 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
BDD100K
数据集推动了视觉的进步,但现有的驾驶数据集在视觉内容和支持任务方面缺乏研究,以研究自动驾驶的多任务学习。研究人员通常只能在一个数据集上研究一小组问题,而现实世界的计算机视觉应用程序需要执行各种复杂的任务。我们构建了最大的驾驶视频数据集 BDD100K,包含 10 万个视频和 10 个任务,以评估图像识别算法在自动驾驶方面的令人兴奋的进展。该数据集具有地理、环境和天气的多样性,这对于训练不太可能对新条件感到惊讶的模型很有用。基于这个多样化的数据集,我们为异构多任务学习建立了一个基准,并研究了如何一起解决这些任务。我们的实验表明,现有模型需要特殊的训练策略来执行此类异构任务。 BDD100K 为未来在这个重要场所的学习打开了大门。更多详细信息请参见数据集主页。
OpenDataLab 收录
