mercari-us/merrec
收藏Hugging Face2025-07-21 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/mercari-us/merrec
下载链接
链接失效反馈官方服务:
资源简介:
MerRec是一个大规模多用途的Mercari消费者对消费者推荐系统数据集,包含来自Mercari电商平台的商品互动事件序列数据子集。数据集经过彻底匿名化处理,旨在为研究者提供一个研究推荐相关任务的丰富C2C环境,其中包含数百万用户和产品,覆盖2023年的6个月时间。数据集不仅包括标准的用户ID、商品ID和会话ID等特征,还包含了时间戳动作类型、产品分类和文本产品属性等独特元素。
MerRec is a large-scale multipurpose Mercari Consumer-to-Consumer recommendation system dataset, containing a subset of item interaction event sequence data from Mercari, the C2C marketplace e-commerce platform. The dataset is thoroughly anonymized and designed to provide researchers with a rich C2C environment for studying recommendation-related tasks, including millions of users and products, covering 6 months in 2023. The dataset not only includes standard features such as user_id, item_id, and session_id but also unique elements such as timestamped action types, product taxonomy, and textual product attributes.
提供机构:
mercari-us
原始信息汇总
MerRec: A Large-scale Multipurpose Mercari Dataset for Consumer-to-Consumer Recommendation Systems
概述
MerRec数据集是一个大规模、高度多样化的匿名化子集,源自Mercari C2C市场电子商务平台的商品交互事件序列数据。该数据集旨在供研究人员在丰富的C2C环境中研究与推荐相关的任务,并包含许多商品特征。
基本统计数据如下:
- 唯一用户数:超过500万
- 唯一商品数:超过8000万
- 唯一事件数:超过10亿
- 唯一会话数:超过2亿
- 商品标题文本标记数:超过80亿
文件组织
MerRec数据集分为6个目录,每个目录包含2023年某个月的约300个Parquet分片。
许可证
数据集许可证:CC BY-NC 4.0 International
搜集汇总
数据集介绍

背景与挑战
背景概述
mercari-us/merrec是一个大规模、多样化的C2C电子商务推荐数据集,包含超过10亿个商品交互事件和数百万用户及商品。该数据集特别适用于研究推荐系统任务,提供了丰富的商品特征和用户行为数据。
以上内容由遇见数据集搜集并总结生成



