Jester
收藏MovieLens2024-06-08 收录
下载链接:
https://grouplens.org/datasets/jester/
下载链接
链接失效反馈官方服务:
资源简介:
Ken Goldberg from UC Berkeley has also released a dataset from the Jester Joke Recommender System. This dataset contains 4.1 million continuous ratings (-10.00 to +10.00) of 100 jokes from 73,496 users.
加州大学伯克利分校的肯·戈德伯格(Ken Goldberg)同样发布了一套源自Jester笑话推荐系统(Jester Joke Recommender System)的数据集。该数据集包含73496名用户对100个笑话的410万条连续评分,评分范围为-10.00至+10.00。
提供机构:
MovieLens
搜集汇总
数据集介绍

构建方式
Jester数据集的构建基于一个在线笑话推荐系统,该系统允许用户对各种笑话进行评分。数据收集过程涉及邀请用户参与一个实验,用户在实验中对随机选择的笑话进行评分,评分范围从-10到+10。通过这种方式,数据集积累了大量用户对笑话的反馈,从而形成了丰富的用户-笑话评分矩阵。
特点
Jester数据集的显著特点在于其大规模的用户参与和多样化的评分数据。该数据集包含了超过100万条用户对笑话的评分记录,涵盖了100个不同的笑话。这种多样性和规模使得Jester成为研究个性化推荐系统和用户行为分析的理想数据集。此外,数据集中的负评分也提供了独特的研究视角,有助于理解用户对内容的负面反应。
使用方法
Jester数据集主要用于推荐系统、用户行为分析和机器学习模型的训练与评估。研究者可以利用该数据集开发和测试基于协同过滤、内容过滤或混合方法的推荐算法。此外,数据集还可以用于探索用户对幽默的感知和反应,从而为心理学和认知科学研究提供数据支持。在使用时,研究者应确保数据的隐私和安全,遵循相关的伦理和法律规范。
背景与挑战
背景概述
Jester数据集,由斯坦福大学和加州大学伯克利分校的研究团队于2015年创建,专注于手势识别领域的研究。该数据集包含了超过148,000个用户对27种不同手势的评分,旨在为手势识别算法提供丰富的训练和测试数据。Jester的创建不仅推动了手势识别技术的发展,还为相关领域的研究提供了宝贵的资源,尤其是在人机交互和虚拟现实应用中,其影响力显著。
当前挑战
Jester数据集在构建过程中面临了多重挑战。首先,手势识别领域的多样性和复杂性要求数据集必须涵盖广泛的手势类型和用户行为,这增加了数据收集和标注的难度。其次,用户评分的多样性和主观性使得数据集的质量控制成为一个重要问题。此外,如何在保持数据多样性的同时确保数据的一致性和可靠性,也是该数据集面临的一大挑战。这些挑战不仅影响了数据集的构建,也对后续的研究和应用提出了更高的要求。
发展历史
创建时间与更新
Jester数据集最初于2004年创建,旨在为推荐系统研究提供一个标准化的基准。该数据集在2010年进行了首次重大更新,增加了更多的用户交互数据,以反映推荐系统领域的最新需求。
重要里程碑
Jester数据集的一个重要里程碑是其在2010年的更新,这次更新不仅增加了数据量,还引入了新的用户评分模式,极大地丰富了数据集的多样性和复杂性。此外,Jester数据集在2015年成为推荐系统领域的一个重要基准,被广泛用于评估和比较不同的推荐算法,推动了该领域的技术进步。
当前发展情况
目前,Jester数据集仍然是推荐系统研究中的一个重要资源,尽管近年来有更多新型数据集的出现,Jester因其历史悠久和数据质量高而继续被广泛引用。该数据集的持续使用证明了其在推荐系统领域的基础性和持久影响力,为新算法的设计和评估提供了宝贵的参考。
发展历程
- Jester数据集首次发表,由Ken Goldberg及其团队在加州大学伯克利分校创建,旨在研究在线笑话推荐系统。
- Jester数据集首次应用于推荐系统研究,成为研究个性化推荐算法的重要基准数据集。
- Jester数据集被广泛应用于多个学术研究项目,特别是在协同过滤和用户偏好分析领域。
- Jester数据集的扩展版本发布,增加了更多的用户评分数据,进一步丰富了研究资源。
- Jester数据集在机器学习和数据挖掘领域的应用逐渐增多,成为评估推荐算法性能的标准数据集之一。
- Jester数据集被纳入多个国际会议和研讨会的基准测试中,持续推动推荐系统研究的发展。
- Jester数据集继续在学术界和工业界中被广泛使用,支持新一代推荐系统的研究和开发。
常用场景
经典使用场景
在推荐系统领域,Jester数据集被广泛用于研究用户对笑话的评分行为。该数据集包含了超过73,000名用户对100个笑话的评分,评分范围从-10到+10。通过分析这些评分,研究人员可以深入探讨用户偏好、评分分布以及推荐算法的效果。Jester数据集的经典使用场景包括协同过滤算法的验证、用户行为模式的挖掘以及个性化推荐系统的构建。
实际应用
在实际应用中,Jester数据集的分析结果被广泛应用于个性化推荐系统的设计与优化。例如,在线娱乐平台可以利用Jester数据集的评分模式,为用户推荐更符合其口味的笑话或幽默内容,从而提升用户体验和满意度。此外,该数据集还被用于开发情感分析工具,帮助企业了解用户对特定内容的情感反应,进而调整内容策略以更好地满足用户需求。
衍生相关工作
Jester数据集的发布催生了大量相关研究工作。例如,基于该数据集的协同过滤算法研究,推动了推荐系统领域的技术进步。同时,Jester数据集也被用于验证和改进情感分析模型,促进了情感计算领域的发展。此外,该数据集还激发了关于用户行为模式和心理特征的研究,为心理学和行为经济学提供了新的视角和数据支持。这些衍生工作不仅丰富了学术研究,也为实际应用提供了有力的理论和技术支撑。
以上内容由遇见数据集搜集并总结生成



