reczoo/Frappe_x1
收藏Hugging Face2023-12-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/reczoo/Frappe_x1
下载链接
链接失效反馈官方服务:
资源简介:
# Frappe_x1
+ **Dataset description:**
The Frappe dataset contains a context-aware app usage log, which comprises 96203 entries by 957 users for 4082 apps used in various contexts. It has 10 feature fields including user_id, item_id, daytime, weekday, isweekend, homework, cost, weather, country, city. The target value indicates whether the user has used the app under the context. Following the [AFN](https://ojs.aaai.org/index.php/AAAI/article/view/5768) work, we randomly split the data into 7:2:1 as the training set, validation set, and test set, respectively.
The dataset statistics are summarized as follows:
| Dataset Split | Total | #Train | #Validation | #Test |
| :--------: | :-----: |:-----: | :----------: | :----: |
| Frappe_x1 | 288,609 | 202,027 | 57,722 | 28,860 |
+ **Source:** https://www.baltrunas.info/context-aware
+ **Download:** https://huggingface.co/datasets/reczoo/Frappe_x1/tree/main
+ **Repository:** https://github.com/reczoo/Datasets
+ **Used by papers:**
- Weiyu Cheng, Yanyan Shen, Linpeng Huang. [Adaptive Factorization Network: Learning Adaptive-Order Feature Interactions](https://ojs.aaai.org/index.php/AAAI/article/view/5768). In AAAI 2020.
- Kelong Mao, Jieming Zhu, Liangcai Su, Guohao Cai, Yuru Li, Zhenhua Dong. [FinalMLP: An Enhanced Two-Stream MLP Model for CTR Prediction](https://arxiv.org/abs/2304.00902). In AAAI 2023.
- Jieming Zhu, Qinglin Jia, Guohao Cai, Quanyu Dai, Jingjie Li, Zhenhua Dong, Ruiming Tang, Rui Zhang. [FINAL: Factorized Interaction Layer for CTR Prediction](https://dl.acm.org/doi/10.1145/3539618.3591988). In SIGIR 2023.
+ **Check the md5sum for data integrity:**
```bash
$ md5sum train.csv valid.csv test.csv
ba7306e6c4fc19dd2cd84f2f0596d158 train.csv
88d51bf2173505436d3a8f78f2a59da8 valid.csv
3470f6d32713dc5f7715f198ca7c612a test.csv
```
# Frappe_x1
+ **数据集描述:**
Frappe数据集是一份上下文感知的应用使用日志,包含957位用户在各类场景下使用4082款应用产生的96203条记录。该数据集共包含10个特征字段,分别为用户ID(user_id)、物品ID(item_id)、时段(daytime)、星期几(weekday)、是否周末(isweekend)、学习场景(homework)、消费等级(cost)、天气(weather)、国家(country)以及城市(city)。目标值用于表征用户是否在当前场景下使用了对应应用。遵循自适应因子分解网络(Adaptive Factorization Network,简称AFN)的相关研究工作,我们将数据集按照7:2:1的比例随机划分为训练集、验证集与测试集。
数据集统计信息如下:
| 数据集划分 | 总样本数 | 训练集样本数 | 验证集样本数 | 测试集样本数 |
| :--------: | :-----: |:-----: | :----------: | :----: |
| Frappe_x1 | 288,609 | 202,027 | 57,722 | 28,860 |
+ **来源:** https://www.baltrunas.info/context-aware
+ **下载地址:** https://huggingface.co/datasets/reczoo/Frappe_x1/tree/main
+ **代码仓库:** https://github.com/reczoo/Datasets
+ **被引用论文:**
- 程伟宇, 沈妍妍, 黄麟鹏. 自适应因子分解网络:学习自适应阶数特征交互[C]//AAAI 2020. 2020.
- 毛科龙, 朱杰明, 苏良才, 蔡国浩, 李雨儒, 董振华. FinalMLP:面向点击率(Click-Through Rate,简称CTR)预测的增强双流MLP模型[C]//AAAI 2023. 2023.
- 朱杰明, 贾庆林, 蔡国浩, 戴全宇, 李静杰, 董振华, 唐瑞明, 张锐. FINAL:面向点击率(Click-Through Rate,简称CTR)预测的因子化交互层模型[C]//SIGIR 2023. 2023.
+ **数据完整性MD5校验:**
bash
$ md5sum train.csv valid.csv test.csv
ba7306e6c4fc19dd2cd84f2f0596d158 train.csv
88d51bf2173505436d3a8f78f2a59da8 valid.csv
3470f6d32713dc5f7715f198ca7c612a test.csv
提供机构:
reczoo
原始信息汇总
Frappe_x1 数据集概述
数据集描述
Frappe 数据集包含一个上下文感知的应用使用日志,共有 96203 条记录,涉及 957 名用户和 4082 个应用。数据集包含 10 个特征字段,包括 user_id、item_id、daytime、weekday、isweekend、homework、cost、weather、country、city。目标值表示用户在特定上下文中是否使用了该应用。根据 AFN 的研究,数据集被随机分为 7:2:1 的比例,分别作为训练集、验证集和测试集。
数据集统计
| 数据集划分 | 总数 | 训练集 | 验证集 | 测试集 |
|---|---|---|---|---|
| Frappe_x1 | 288,609 | 202,027 | 57,722 | 28,860 |
使用该数据集的论文
- Weiyu Cheng, Yanyan Shen, Linpeng Huang. Adaptive Factorization Network: Learning Adaptive-Order Feature Interactions. In AAAI 2020.
- Kelong Mao, Jieming Zhu, Liangcai Su, Guohao Cai, Yuru Li, Zhenhua Dong. FinalMLP: An Enhanced Two-Stream MLP Model for CTR Prediction. In AAAI 2023.
- Jieming Zhu, Qinglin Jia, Guohao Cai, Quanyu Dai, Jingjie Li, Zhenhua Dong, Ruiming Tang, Rui Zhang. FINAL: Factorized Interaction Layer for CTR Prediction. In SIGIR 2023.
数据完整性检查
bash $ md5sum train.csv valid.csv test.csv ba7306e6c4fc19dd2cd84f2f0596d158 train.csv 88d51bf2173505436d3a8f78f2a59da8 valid.csv 3470f6d32713dc5f7715f198ca7c612a test.csv
搜集汇总
数据集介绍

构建方式
Frappe_x1数据集的构建基于上下文的移动应用使用日志,涵盖957名用户对4082款应用的使用情况,总计96203条记录。数据集包含10个特征字段,如用户ID、项目ID、时间、星期几、是否为周末、是否有作业、成本、天气、国家和城市。数据集的构建遵循AFN工作,随机地将数据分为训练集、验证集和测试集,比例为7:2:1。
使用方法
使用Frappe_x1数据集时,用户可以访问HuggingFace提供的链接进行数据下载。数据集以CSV格式存储,可以直接用于机器学习模型的训练。为确保数据完整性,用户可通过提供的md5sum值进行校验。遵循AFN论文的指导,研究者可以此数据集为基础,开展上下文感知的应用使用模式预测等研究。
背景与挑战
背景概述
Frappe_x1数据集,作为一份深入探索上下文感知应用使用日志的宝贵资源,涵盖了957名用户在4082款应用中的96203条记录。该数据集的构建起始于对用户使用应用上下文的深入分析,其特征字段包含用户标识、应用标识、时间、星期、是否周末、作业情况、成本、天气、国家及城市等维度。目标值则揭示了用户在特定上下文中是否使用了应用。Frappe_x1数据集的创建,不仅沿袭了AFN工作的理念,而且其研究成果被广泛应用于诸如自适应因子分解网络等先进算法模型的训练中,对上下文感知推荐系统领域产生了显著影响。该数据集最早由Weiyu Cheng等人于AAAI 2020上发表相关研究,后续被多份学术论文引用,成为领域内的研究基石。
当前挑战
在Frappe_x1数据集的研究与应用过程中,研究人员面临着多项挑战。首先,如何准确捕捉和表征用户使用应用的上下文信息,以实现对用户行为的精准预测,是一个关键难题。其次,数据集构建过程中的数据隐私保护、数据平衡性以及特征工程等问题,也对研究人员提出了严峻考验。此外,数据集的高维度特性和大规模性,使得模型的训练与优化变得复杂,需要研究者开发出更为高效的算法来处理这些挑战。
常用场景
经典使用场景
在智能推荐系统研究领域,reczoo/Frappe_x1数据集以其丰富的上下文信息被广泛用于模型训练与评估。该数据集记录了用户在不同情境下的应用使用日志,包括时间、地点、用户行为等维度,为构建能够理解用户上下文行为的推荐算法提供了坚实基础。
解决学术问题
该数据集有效地解决了推荐系统中用户行为预测的难题,特别是在考虑用户上下文信息的情况下。它为学术研究提供了实验基础,验证了在推荐系统中融入上下文信息的可行性和效果,推动了相关算法的发展。
实际应用
在实际应用中,reczoo/Frappe_x1数据集的运用有助于提升推荐系统的准确性和用户体验。例如,通过分析用户的使用日志,可以为用户在特定时间、地点和情境下推荐最合适的应用,从而增强推荐的个性化程度。
数据集最近研究
最新研究方向
在智能推荐系统研究领域,reczoo/Frappe_x1数据集以其丰富的上下文信息而受到关注。近期研究集中于深度学习模型在上下文感知推荐中的应用,如自适应分解网络(Adaptive Factorization Network)的提出,该网络能够学习不同阶数的特征交互,提高了推荐的准确性。此外,FinalMLP和FINAL模型分别在AAAI 2023和SIGIR 2023会议上提出,它们通过优化特征交互层,进一步提升了点击率(CTR)预测的性能。这些研究不仅推动了推荐系统领域的理论进展,也对实际应用产生了深远影响,为个性化推荐服务提供了新的视角和技术路径。
以上内容由遇见数据集搜集并总结生成



