five

mercari-us/merrec

收藏
Hugging Face2025-07-21 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/mercari-us/merrec
下载链接
链接失效反馈
官方服务:
资源简介:
MerRec是一个大规模多用途的Mercari消费者对消费者推荐系统数据集,包含来自Mercari电商平台的商品互动事件序列数据子集。数据集经过彻底匿名化处理,旨在为研究者提供一个研究推荐相关任务的丰富C2C环境,其中包含数百万用户和产品,覆盖2023年的6个月时间。数据集不仅包括标准的用户ID、商品ID和会话ID等特征,还包含了时间戳动作类型、产品分类和文本产品属性等独特元素。

MerRec is a large-scale multipurpose Mercari Consumer-to-Consumer recommendation system dataset, containing a subset of item interaction event sequence data from Mercari, the C2C marketplace e-commerce platform. The dataset is thoroughly anonymized and designed to provide researchers with a rich C2C environment for studying recommendation-related tasks, including millions of users and products, covering 6 months in 2023. The dataset not only includes standard features such as user_id, item_id, and session_id but also unique elements such as timestamped action types, product taxonomy, and textual product attributes.
提供机构:
mercari-us
原始信息汇总

MerRec: A Large-scale Multipurpose Mercari Dataset for Consumer-to-Consumer Recommendation Systems

概述

MerRec数据集是一个大规模、高度多样化的匿名化子集,源自Mercari C2C市场电子商务平台的商品交互事件序列数据。该数据集旨在供研究人员在丰富的C2C环境中研究与推荐相关的任务,并包含许多商品特征。

基本统计数据如下:

  • 唯一用户数:超过500万
  • 唯一商品数:超过8000万
  • 唯一事件数:超过10亿
  • 唯一会话数:超过2亿
  • 商品标题文本标记数:超过80亿

文件组织

MerRec数据集分为6个目录,每个目录包含2023年某个月的约300个Parquet分片。

许可证

数据集许可证:CC BY-NC 4.0 International

搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
mercari-us/merrec是一个大规模、多样化的C2C电子商务推荐数据集,包含超过10亿个商品交互事件和数百万用户及商品。该数据集特别适用于研究推荐系统任务,提供了丰富的商品特征和用户行为数据。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作