five

GANRS

收藏
arXiv2024-10-25 更新2024-10-29 收录
下载链接:
http://arxiv.org/abs/2410.17651v2
下载链接
链接失效反馈
官方服务:
资源简介:
GANRS数据集是由马德里理工大学开发的用于协同过滤推荐系统的生成数据集。该数据集通过生成对抗网络(GAN)从真实的电影、动漫等数据集中生成合成数据,旨在模拟真实数据集的内部模式和概率分布。生成的数据集包含不同数量的用户、项目和样本,用于测试和比较多种深度学习推荐模型的性能。GANRS数据集的应用领域主要集中在推荐系统中,旨在通过合成数据集来增强现有推荐模型的鲁棒性和准确性。

The GANRS dataset is a generated dataset developed by the Universidad Politécnica de Madrid for collaborative filtering recommendation systems. Using Generative Adversarial Networks (GANs), this dataset generates synthetic data from real-world datasets such as movies and anime, aiming to simulate the internal patterns and probability distributions of real datasets. The generated dataset includes varying numbers of users, items and samples, and is utilized to test and compare the performance of multiple deep learning-based recommendation models. The primary application scope of the GANRS dataset is recommendation systems, where it is designed to enhance the robustness and accuracy of existing recommendation models through synthetic datasets.
提供机构:
马德里理工大学
创建时间:
2024-10-23
搜集汇总
数据集介绍
main_image_url
构建方式
GANRS数据集的构建基于生成对抗网络(GAN)技术,专门用于协同过滤推荐系统。该数据集通过从三个不同的真实数据集(如Movielens、Netflix和MyAnimeList)中提取源数据,生成多个合成数据集。具体构建过程包括使用GANRS方法生成合成数据,这些数据在用户数量、项目数量和样本数量上有所变化。生成器从高斯随机噪声向量中创建协同过滤的假用户配置文件,而判别器则负责从训练批次中区分真实和假的用户配置文件。
特点
GANRS数据集的主要特点在于其能够模拟源数据集的内部模式和概率分布,特别是在深度学习生成处理中。生成的合成数据集在精度、召回率等质量指标上表现出与源数据集一致的行为。此外,GANRS允许灵活调整合成数据集的用户数量、项目数量和样本数量,从而能够测试推荐系统在不同场景下的性能。
使用方法
GANRS数据集适用于测试和验证各种协同过滤推荐系统的深度学习模型。用户可以通过提供的源代码生成自定义的合成数据集,并将其应用于现有的推荐系统模型,如DeepMF、VDeepMF、NCF等。通过比较这些模型在真实数据集和合成数据集上的表现,可以评估模型的鲁棒性和适应性。此外,GANRS数据集还可用于研究冷启动、数据不平衡和人口统计公平性等特定推荐系统场景。
背景与挑战
背景概述
GANRS数据集由Jesús Bobadilla和Abraham Gutiérrez在马德里理工大学信息系统系创建,旨在生成用于协同过滤推荐系统的合成数据集。该数据集的核心研究问题是如何利用生成对抗网络(GAN)生成能够模拟真实数据集模式和分布的合成数据,以测试和验证深度学习推荐系统模型的性能。GANRS的创建不仅推动了推荐系统领域的研究,还为深度学习模型在推荐系统中的应用提供了新的测试平台。
当前挑战
GANRS数据集面临的挑战主要集中在两个方面:一是如何确保生成的合成数据集能够准确模拟真实数据集的内部模式和概率分布,这涉及到生成对抗网络的训练和优化问题;二是如何在不同的参数设置下(如用户数量、物品数量和样本数量)保持合成数据集的质量和一致性,以适应不同的推荐系统测试场景。此外,未来的研究还需要解决冷启动场景、数据不平衡和人口统计公平性等问题。
常用场景
经典使用场景
GANRS数据集在协同过滤推荐系统中被广泛用于生成合成数据。其经典使用场景包括测试深度学习推荐系统模型在合成数据上的表现,通过生成与真实数据集相似的合成数据,研究人员能够评估和比较不同推荐模型的性能,特别是在用户数量、项目数量和样本数量变化的情况下。
衍生相关工作
基于GANRS数据集,研究者们开发了多种衍生工作,如CFGAN、IPGAN和RecGAN等,这些工作进一步扩展了生成对抗网络在推荐系统中的应用。CFGAN通过生成增强数据来强化真实购买数据,IPGAN则在输入数据中加入了负采样信息,而RecGAN结合了时间模式和生成对抗网络。这些衍生工作不仅提升了推荐系统的性能,还为解决推荐系统中的特定问题提供了新的思路和方法。
数据集最近研究
最新研究方向
在协同过滤推荐系统领域,GANRS数据集的最新研究方向主要集中在利用生成对抗网络(GAN)生成合成数据集,以测试和增强深度学习推荐模型的性能。研究者们通过GANRS方法生成了多个合成数据集,并将其应用于多种先进的协同过滤深度学习模型,如DeepMF、VDeepMF和NCF等,以评估这些模型在不同用户数量和样本数量下的表现。此外,研究还探讨了在冷启动场景、数据不平衡和人口统计公平性等复杂情况下的应用,旨在为推荐系统提供更全面和可靠的测试环境。
相关研究论文
  • 1
    Testing Deep Learning Recommender Systems Models on Synthetic GAN-Generated Datasets马德里理工大学 · 2024年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作