Taobao Serendipity Dataset

github2024-05-02 更新2024-05-31 收录

下载链接：

https://github.com/greenblue96/Taobao-Serendipity-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含11,383名用户通过用户调查提供的反馈，具体包括九个问题，用于评估用户对推荐商品的感知，如相关性、新颖性、多样性、意外性和购买意向等。

This dataset comprises feedback from 11,383 users collected through user surveys, specifically including nine questions designed to assess users' perceptions of recommended products, such as relevance, novelty, diversity, serendipity, and purchase intention.

创建时间：

2020-06-11

原始信息汇总

数据集概述

数据集名称

Taobao Serendipity Dataset

数据收集

时间范围：始于2017年12月21日至2018年3月17日。
平台：在中国流行的移动电商平台“Mobile Taobao”上进行用户调查。
参与用户：共收到13,741名用户的反馈，经过筛选后保留11,383名用户的记录。
数据内容：用户对推荐产品的反馈，包括产品名称、图像、简短描述、价格，以及用户对推荐的主观评价。

用户反馈评价

评价问题：共9个问题，涉及推荐的关联性、新颖性、多样性、意外性、及时性、用户满意度及购买意向等。
评价方式：使用5点Likert量表，从“强烈不同意”到“强烈同意”。

数据集使用

已用于研究：数据集或其部分已被用于[3]和[4]的研究分析。

数据文件结构

文件名：umap2020_TSD_Wang.csv
字段：共34个字段，包括用户ID、项目ID、类别ID、点击和购买状态，以及用户对推荐的主观评价等。
编码：UTF-8。

伦理考虑

参与者知情：参与者在调查前通过同意书了解数据收集目的。
伦理审查：用户调查已获得阿里巴巴搜索与推荐平台的批准。
参与者同意：参与者需确认同意书，明确数据收集和使用目的。

引用信息

参考文献：使用数据集的研究应引用Wang et al. 2020和Chen et al. 2019。

搜集汇总

数据集介绍

构建方式

该数据集通过在中国流行的移动电商平台（*Mobile Taobao*）上进行用户调查构建而成。自2017年12月21日起，用户在登录系统后可访问调查链接，自愿参与调查。每位参与者首先会收到一个由测试算法生成的推荐商品，涵盖商品名称、图片、简短描述和价格等信息。随后，用户需完成一份问卷，评估其对推荐商品的即时反馈，并填写关于好奇心和五大人格特质的心理测试问卷。最终，经过严格筛选和剔除无效答案，保留了11,383名用户的有效反馈数据。

特点

该数据集具有多维度的用户反馈信息，涵盖了用户对推荐商品的感知评估，如相关性、新颖性、意外性等，以及用户的心理特征，包括好奇心和五大人格特质。此外，数据集还包含了用户的点击和购买行为，提供了丰富的用户行为数据。这些多层次的数据为研究用户对推荐系统的感知和行为提供了全面的视角。

使用方法

该数据集可用于研究推荐系统中的用户感知和行为，特别是关于意外性和满意度的影响。用户可以通过分析不同用户特征（如好奇心和人格特质）对推荐效果的影响，优化推荐算法。数据集的使用需遵循特定的许可条件，包括不得声明或暗示任何来自淘宝、香港浸会大学或相关研究人员的背书，且必须在相关出版物中引用数据集。

背景与挑战

背景概述

淘宝意外发现数据集（Taobao Serendipity Dataset）是由香港浸会大学与阿里巴巴合作，于2017年12月21日至2018年3月17日期间，通过在中国流行的移动电商平台（*Mobile Taobao*）上进行用户调查而创建的。该数据集的核心研究问题集中在用户对推荐系统中意外发现的感知及其对用户满意度的影响。研究团队通过向用户展示由算法生成的推荐商品，并收集用户对这些推荐的反馈，评估了推荐的相关性、新颖性、多样性、意外性及用户满意度等多个维度。最终，数据集包含了11,383名用户的反馈记录，这些数据为推荐系统中的意外发现研究提供了宝贵的实证支持，并对个性化推荐领域的进一步发展产生了深远影响。

当前挑战

淘宝意外发现数据集在构建过程中面临了多项挑战。首先，如何确保推荐商品的意外性与用户兴趣的匹配度是一个关键问题，因为过度的意外性可能导致用户的不满，而缺乏意外性则无法实现推荐系统的创新目标。其次，数据收集过程中需要处理大量用户反馈，并确保数据的准确性和有效性，例如剔除无效回答和重复响应。此外，如何在保护用户隐私的同时，获取足够的心理学和行为学数据，以深入分析用户特征对推荐感知的影响，也是一项重要的挑战。最后，数据集的使用需遵守严格的伦理规范，确保用户知情同意，并避免数据被滥用或误用。

常用场景

经典使用场景

淘宝意外发现数据集（Taobao Serendipity Dataset）主要用于研究推荐系统中的意外发现（serendipity）现象。该数据集通过收集用户对推荐商品的反馈，评估推荐商品的相关性、新颖性、多样性、意外性以及用户满意度等多个维度。经典的使用场景包括分析用户对推荐商品的感知，探索如何通过算法优化提升用户的意外发现体验，以及研究用户特征与推荐商品属性之间的关联性。

实际应用

在实际应用中，淘宝意外发现数据集可用于优化电商平台的推荐算法，提升用户的购物体验。通过分析用户对推荐商品的反馈，平台可以调整推荐策略，增加推荐商品的多样性和新颖性，从而提高用户的满意度和购买转化率。此外，该数据集还可用于个性化推荐系统的开发，帮助平台更好地理解用户需求，提供更精准的商品推荐。

衍生相关工作

基于淘宝意外发现数据集，研究者们开展了多项相关工作，包括探索用户特征与推荐商品属性之间的关系、分析意外发现对用户满意度的影响，以及开发新的推荐算法以提升用户的意外发现体验。这些研究不仅推动了推荐系统领域的发展，还为个性化推荐、用户行为分析等领域的研究提供了宝贵的数据支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集