SNAP Delicious
收藏snap.stanford.edu2024-11-02 收录
下载链接:
http://snap.stanford.edu/data/index.html
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了用户在Delicious社交书签服务上的书签记录,包括用户ID、书签URL、书签标签和书签时间戳等信息。数据集用于研究社交书签系统、用户行为分析和推荐系统等领域。
This dataset contains bookmark records from users on the Delicious social bookmarking service, including information such as user ID, bookmark URL, bookmark tags, and bookmark timestamps. It is used for research in fields such as social bookmarking systems, user behavior analysis, and recommendation systems.
提供机构:
snap.stanford.edu
搜集汇总
数据集介绍

构建方式
SNAP Delicious数据集源自于Delicious社交书签服务,通过收集用户在平台上标记的网页书签及其相关标签构建而成。该数据集涵盖了从2003年至2007年间的用户活动,包括超过10万用户和50万条书签记录。构建过程中,数据集不仅记录了书签的URL和标签,还包含了时间戳和用户ID,以确保数据的完整性和可追溯性。
特点
SNAP Delicious数据集以其大规模和多样性著称,包含了丰富的用户行为数据和标签信息,为研究用户兴趣和社交网络提供了宝贵的资源。其特点在于数据的实时性和动态性,反映了用户在不同时间点的兴趣变化。此外,数据集的标签系统允许进行多维度的分析,如标签共现和用户群体划分,从而支持复杂的社会网络分析和推荐系统研究。
使用方法
SNAP Delicious数据集适用于多种研究场景,包括但不限于用户行为分析、社交网络建模和推荐系统开发。研究者可以通过分析书签和标签的关联性,探索用户的兴趣模式和社交网络结构。此外,数据集的时间戳信息可用于研究用户兴趣的动态变化。在实际应用中,该数据集可用于训练和验证推荐算法,提升个性化服务的准确性和用户满意度。
背景与挑战
背景概述
SNAP Delicious数据集,由斯坦福网络分析项目(SNAP)于2003年创建,主要研究人员包括Jure Leskovec和Andrej Krevl。该数据集的核心研究问题集中在社会网络分析和用户行为预测上,特别是通过分析用户在Delicious书签服务中的标签使用情况,揭示用户兴趣和社交网络结构。SNAP Delicious数据集对信息检索、推荐系统和社交网络分析领域产生了深远影响,为研究人员提供了丰富的用户行为数据,促进了相关算法和模型的开发与优化。
当前挑战
SNAP Delicious数据集在构建过程中面临多重挑战。首先,数据集的规模庞大,包含数百万条书签记录和标签,如何高效地存储和处理这些数据成为一个技术难题。其次,用户行为的多样性和动态性使得数据集的标签分布不均,增加了模型训练的复杂性。此外,随着时间的推移,用户兴趣和社交网络结构的变化也对数据集的实时更新和维护提出了高要求。这些挑战不仅影响了数据集的可用性,也对相关研究领域的算法设计和性能优化提出了新的要求。
发展历史
创建时间与更新
SNAP Delicious数据集由斯坦福网络分析项目(SNAP)于2003年创建,旨在收集和分析用户在Delicious社交书签服务中的书签数据。该数据集定期更新,最新版本发布于2011年,涵盖了从2003年至2011年的用户书签记录。
重要里程碑
SNAP Delicious数据集的一个重要里程碑是其在2007年的扩展,当时数据集包含了超过100万用户的书签记录,极大地丰富了研究者对用户行为和社会网络分析的理解。此外,2009年,该数据集被广泛应用于多个研究领域,包括信息检索、推荐系统和社交网络分析,成为这些领域的重要基准数据集。
当前发展情况
目前,SNAP Delicious数据集已成为社交网络分析和信息检索领域的基础资源之一。尽管Delicious服务在2017年停止运营,但该数据集的历史数据仍然被广泛用于学术研究和实际应用中。研究者利用这些数据进行用户行为模式分析、社交网络结构研究以及推荐算法优化,为相关领域的理论和实践发展提供了宝贵的数据支持。
发展历程
- Delicious社交书签服务正式上线,用户开始分享和保存网页链接。
- Yahoo!收购Delicious,进一步扩展其社交书签服务的影响力。
- Delicious被出售给AVOS Systems,服务继续运营并进行技术升级。
- Delicious被Science Inc.收购,继续提供书签服务并优化用户体验。
- SNAP Delicious数据集首次公开发布,包含Delicious用户分享的网页链接和标签数据,为研究社交网络和用户行为提供了宝贵的资源。
常用场景
经典使用场景
在社交网络分析领域,SNAP Delicious数据集以其丰富的用户标签数据而著称。该数据集记录了用户对网页的标签行为,为研究用户兴趣和信息检索提供了宝贵的资源。通过分析这些标签数据,研究者能够深入理解用户的兴趣分布、标签的语义关联以及社交网络中的信息传播模式。
实际应用
在实际应用中,SNAP Delicious数据集被广泛用于开发和优化个性化推荐系统。通过分析用户的标签行为,企业能够更精准地推送内容,提升用户体验。同时,该数据集也为搜索引擎的改进提供了数据支持,帮助提高搜索结果的相关性和准确性。此外,社交网络平台利用这些数据来增强用户互动和社区建设。
衍生相关工作
基于SNAP Delicious数据集,许多经典研究工作得以展开。例如,研究者们开发了多种标签推荐算法,以提高用户标签的准确性和多样性。此外,该数据集还催生了关于社交网络中信息传播和用户行为模式的研究,推动了社交网络分析领域的发展。这些研究不仅丰富了理论知识,也为实际应用提供了技术支持。
以上内容由遇见数据集搜集并总结生成



