reczoo/AmazonBeauty_m1
收藏Hugging Face2023-12-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/reczoo/AmazonBeauty_m1
下载链接
链接失效反馈官方服务:
资源简介:
# AmazonBeauty_m1
+ **Data format:**
user_id item1 item2 ...
+ **Download:** https://huggingface.co/datasets/reczoo/AmazonBeauty_m1/tree/main
+ **Repository:** https://github.com/reczoo/Datasets
+ **Used by papers:**
- Jianing Sun, Wei Guo, Dengcheng Zhang, Yingxue Zhang, Florence Regol, Yaochen Hu, Huifeng Guo, Ruiming Tang, Han Yuan, Xiuqiang He, Mark Coates. [A Framework for Recommending Accurate and Diverse Items Using Bayesian Graph Convolutional Neural Networks](https://hyclex.github.io/papers/paper_sun2019BGCN.pdf). In KDD 2020.
- Kelong Mao, Jieming Zhu, Jinpeng Wang, Quanyu Dai, Zhenhua Dong, Xi Xiao, Xiuqiang He. [SimpleX: A Simple and Strong Baseline for Collaborative Filterin](https://arxiv.org/abs/2109.12613). In CIKM 2021.
+ **Check the md5sum for data integrity:**
```bash
$ md5sum *.txt
66fb687136d55b51742905ece189da31 test.txt
53cc9d39bc79f13c9bd3e75bd5121d1d train.txt
```
# AmazonBeauty_m1 数据集
+ **数据格式:**
用户ID 物品1 物品2 ……
+ **下载地址:** https://huggingface.co/datasets/reczoo/AmazonBeauty_m1/tree/main
+ **代码仓库:** https://github.com/reczoo/Datasets
+ **被以下论文引用:**
- Jianing Sun, Wei Guo, Dengcheng Zhang, Yingxue Zhang, Florence Regol, Yaochen Hu, Huifeng Guo, Ruiming Tang, Han Yuan, Xiuqiang He, Mark Coates. [基于贝叶斯图卷积神经网络(Bayesian Graph Convolutional Neural Networks)的精准多样商品推荐框架](https://hyclex.github.io/papers/paper_sun2019BGCN.pdf). 收录于KDD 2020.
- Kelong Mao, Jieming Zhu, Jinpeng Wang, Quanyu Dai, Zhenhua Dong, Xi Xiao, Xiuqiang He. [SimpleX:面向协同过滤(Collaborative Filtering)的简单强基线模型](https://arxiv.org/abs/2109.12613). 收录于CIKM 2021.
+ **数据完整性MD5校验:**
bash
$ md5sum *.txt
66fb687136d55b51742905ece189da31 test.txt
53cc9d39bc79f13c9bd3e75bd5121d1d train.txt
提供机构:
reczoo
原始信息汇总
AmazonBeauty_m1 数据集概述
数据格式
- 格式描述: 每行数据包含用户ID和多个物品ID,格式为
user_id item1 item2 ...。
使用情况
- 被用于论文:
- Jianing Sun 等人的论文《A Framework for Recommending Accurate and Diverse Items Using Bayesian Graph Convolutional Neural Networks》,发表于 KDD 2020。
- Kelong Mao 等人的论文《SimpleX: A Simple and Strong Baseline for Collaborative Filtering》,发表于 CIKM 2021。
数据完整性校验
- MD5校验和: bash 66fb687136d55b51742905ece189da31 test.txt 53cc9d39bc79f13c9bd3e75bd5121d1d train.txt
搜集汇总
数据集介绍

构建方式
AmazonBeauty_m1数据集的构建,是基于用户在亚马逊美容产品上的交互行为。数据集采用用户与商品互动的列表形式,其中user_id代表用户唯一标识,后跟一个或多个item表示用户与之交互的商品。这种构建方式直接体现了用户行为与商品之间的关联性,为推荐系统的研究提供了直观的数据基础。
特点
该数据集显著的特点在于,它提供了一个真实世界的用户-商品交互场景,包含丰富的用户行为数据,有利于研究者深入探索用户偏好。此外,数据集的完整性较高,通过md5sum校验确保了数据的一致性和可靠性。AmazonBeauty_m1已被应用于多个学术研究中,证明了其研究价值和实用价值。
使用方法
使用AmazonBeauty_m1数据集时,研究者首先需要从HuggingFace平台下载数据集,并可通过提供的链接访问数据集的存储库以获取更多细节。数据集包含训练集和测试集,研究者可以依据自己的需求,利用这些数据对推荐算法进行训练和评估。同时,数据集的md5sum校验确保了数据的完整性,研究者在使用前应先进行校验以确保数据的准确性。
背景与挑战
背景概述
AmazonBeauty_m1数据集,诞生于推荐系统研究领域的深入探索之中,由知名研究机构与学者共同开发。该数据集旨在解决商品推荐中的准确性与多样性问题,其创建时间为近年,具体年份可追溯至使用该数据集的相关论文发表时间,如KDD 2020与CIKM 2021。主要研究人员包括Sun Jianing、Guo Wei等,他们的工作对推荐系统领域产生了显著影响,推动了基于图神经网络的推荐算法研究。数据集的核心研究问题是如何在推荐系统中实现准确性与多样性的平衡,这对于提升用户体验、增强商业效益具有重大意义。
当前挑战
在构建AmazonBeauty_m1数据集的过程中,研究人员面临着诸多挑战。首先,数据集的构建需确保数据的质量与完整性,这对于后续的模型训练与评估至关重要。其次,领域问题中的挑战包括如何处理用户行为的稀疏性,以及如何设计算法以同时捕捉用户的长短期兴趣。此外,构建过程中的技术挑战还包括数据预处理、特征工程以及大规模数据处理等,这些都是实现高效推荐系统必须克服的关键技术难题。
常用场景
经典使用场景
在推荐系统研究领域,reczoo/AmazonBeauty_m1数据集被广泛用于评估和训练模型,其经典使用场景在于通过用户的历史交互数据,预测用户对商品的偏好,进而实现个性化的商品推荐。
解决学术问题
该数据集解决了推荐系统中用户商品交互数据稀疏性、冷启动问题以及推荐结果的多样性和准确性平衡等常见学术问题,为研究提供了可靠的数据基础。
衍生相关工作
基于该数据集,研究者们衍生出了多项相关工作,如Sun等人提出的基于贝叶斯图卷积神经网络的推荐框架,以及Mao等人提出的SimpleX协同过滤基线模型,这些工作推动了推荐系统领域的研究进展。
以上内容由遇见数据集搜集并总结生成



