five

DonorsChoose.org Dataset

收藏
github2019-02-15 更新2024-05-31 收录
下载链接:
https://github.com/BeelGroup/Augmented-DonorsChoose.org-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了过去的捐赠记录,提供了大量且特征丰富的用户和项目数据。数据集旨在匹配捐赠者与他们可能感兴趣的项目,因此本质上是一个推荐系统。由于包含详细的物品、用户和交易特征,该数据集适合用于测试元学习方法。本研究旨在提供一个增强的数据集,供进一步的推荐系统研究测试和评估元学习方法。

This dataset comprises historical donation records, offering a wealth of feature-rich data on users and projects. The dataset is designed to match donors with projects they may find appealing, essentially functioning as a recommendation system. Given its detailed item, user, and transaction features, the dataset is well-suited for testing meta-learning methods. This study aims to provide an enhanced dataset for further research into recommendation systems and the evaluation of meta-learning approaches.
创建时间:
2018-07-24
原始信息汇总

数据集概述

数据集名称

  • Augmented DonorsChoose.org Dataset

数据集来源

  • DonorsChoose.org 提供的过去捐赠数据集。

数据集目的

  • 用于测试和评估推荐系统中的元学习方法。
  • 提供一个增强的数据集,包括元数据和统计信息,用于进一步的研究和评估。

数据集内容

  • 交易数据:包括捐赠ID、捐赠日期、捐赠者ID、项目ID等。
  • 用户数据:包括捐赠者状态、城市、邮编等。
  • 项目数据:包括学校ID、项目类别、资源类别等。
  • 学习子系统数据:包括协同过滤和基于内容的过滤技术的性能指标。
  • 统计数据:用户和交易的聚合统计。
  • 元学习系统数据:元学习算法的预测和性能指标。

数据集增强

  • 增加了协同过滤和基于内容的过滤技术的元数据。
  • 扩展了用户和交易的聚合统计。
  • 包含了一个示例元学习实验。

性能评估

  • 通过Top-N测试集中的推荐项目召回率来衡量学习子系统的性能。

数据集可用性

搜集汇总
数据集介绍
main_image_url
构建方式
DonorsChoose.org数据集的构建基于过去的捐赠记录,提供了一个庞大且特征丰富的用户和项目数据集。数据集通过匹配捐赠者可能感兴趣的项目,本质上是一个推荐系统。由于详细的项目、用户和交易特征可用,该数据集成为测试元学习方法的好候选。在构建过程中,引入了协同过滤和基于内容的过滤技术的元数据,扩展了用户和交易的聚合统计信息,并进行了示例元学习实验。
使用方法
使用该数据集时,首先需要理解其数据结构,包括交易、用户、项目等表的结构和字段含义。可以通过配置文件来调整学习子系统和元学习子系统的参数。数据集的使用包括数据预处理、模型训练、性能评估等步骤,需要利用提供的代码库来加载数据、训练模型并评估推荐系统的性能。
背景与挑战
背景概述
DonorsChoose.org数据集是一份记录了过往捐赠信息的丰富特征数据集,涉及用户和项目。该数据集旨在将捐赠者与可能感兴趣的项目匹配,其核心研究问题是推荐系统中的元学习算法应用。该数据集由ADAPT小组在都柏林圣三一学院的研究工作启发创建,并提供了详细的项目、用户和交易特征,适合用于测试元学习方法的推荐算法选择。它的创建时间为2018年,由BeelGroup在GitHub上发布,对推荐系统领域产生了重要影响。
当前挑战
DonorsChoose.org数据集面临的挑战包括:1)解决推荐领域中项目与捐赠者匹配的挑战,这需要准确捕捉用户偏好和项目特性;2)构建过程中的挑战,如如何处理数据集中的缺失值、异常值和重复记录,以及如何有效地整合协同过滤和基于内容的过滤技术。此外,元学习算法的设计和实现,以及性能评估也是构建过程中的关键挑战。
常用场景
经典使用场景
DonorsChoose.org数据集是一个关于捐赠者和项目的详尽数据集,其经典使用场景在于为推荐系统提供学习材料,以实现捐赠者与潜在感兴趣项目的匹配。该数据集通过丰富的用户和项目特征,支持元学习算法的测试与评估,从而在推荐算法选择上进行微级别优化。
解决学术问题
该数据集解决了推荐系统中算法选择的问题,通过提供详细的交易特征、用户特征和项目特征,使得研究者能够利用元学习算法来预测不同推荐算法的性能,进而选择最佳的推荐算法。这对于提高推荐系统的准确性和效率具有重要意义。
实际应用
在实际应用中,DonorsChoose.org数据集可以帮助慈善网站或捐赠平台优化推荐策略,通过分析用户捐赠行为和项目特点,为用户推荐最合适的项目,提高捐赠匹配的效率和成功率。
数据集最近研究
最新研究方向
DonorsChoose.org数据集最新的研究方向聚焦于元学习算法在推荐系统中的应用,特别是在推荐算法选择的小范围内。该研究灵感来源于ADAPT小组在都柏林圣三一学院的工作,尤其是关于元学习推荐系统的论文。研究目标是利用DonorsChoose.org数据集提供的用户和项目特征,测试和评估元学习算法。该数据集经过扩展,包含了协同过滤和基于内容的过滤技术,以及用户和交易的聚合统计信息,旨在为推荐系统研究提供一个增强的语料库。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作