Wouter01/RecSys_demo
收藏Hugging Face2024-06-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Wouter01/RecSys_demo
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要部分:文章(articles)、用户行为(behaviors)和历史记录(history)。文章部分包含文章的ID、标题、副标题、发布时间、主题、类别和情感评分等信息;用户行为部分记录了用户的印象ID、印象时间、阅读时间、浏览的文章ID、点击的文章ID、用户ID和会话ID;历史记录部分则包括用户ID、固定的印象时间、滚动百分比、固定的文章ID和固定的阅读时间。这些数据可能用于分析用户阅读行为、文章推荐系统等应用。
该数据集包含三个主要部分:文章(articles)、用户行为(behaviors)和历史记录(history)。文章部分包含文章的ID、标题、副标题、发布时间、主题、类别和情感评分等信息;用户行为部分记录了用户的印象ID、印象时间、阅读时间、浏览的文章ID、点击的文章ID、用户ID和会话ID;历史记录部分则包括用户ID、固定的印象时间、滚动百分比、固定的文章ID和固定的阅读时间。这些数据可能用于分析用户阅读行为、文章推荐系统等应用。
提供机构:
Wouter01
原始信息汇总
数据集概述
数据集1: articles
- 配置名称: articles
- 特征:
- article_id: int32
- title: string
- subtitle: string
- published_time: timestamp[us]
- topics: sequence: string
- category_str: string
- sentiment_score: float32
- sentiment_label: string
- 分割:
- train:
- num_examples: 11777
- num_bytes: 3095747
- train:
- 下载大小: 1665497
- 数据集大小: 3095747
数据集2: behaviors
- 配置名称: behaviors
- 特征:
- impression_id: uint32
- impression_time: timestamp[us]
- read_time: float32
- article_ids_inview: sequence: int32
- article_ids_clicked: sequence: int32
- user_id: uint32
- session_id: uint32
- 分割:
- train:
- num_examples: 24724
- num_bytes: 2003276
- validation:
- num_examples: 25356
- num_bytes: 2133072
- train:
- 下载大小: 2455134
- 数据集大小: 4136348
数据集3: history
- 配置名称: history
- 特征:
- user_id: uint32
- impression_time_fixed: sequence: timestamp[us]
- scroll_percentage_fixed: sequence: float32
- article_id_fixed: sequence: int32
- read_time_fixed: sequence: float32
- 分割:
- train:
- num_examples: 1590
- num_bytes: 345509
- compare:
- num_examples: 1590
- num_bytes: 5230450
- validation:
- num_examples: 1562
- num_bytes: 339616
- train:
- 下载大小: 9629769
- 数据集大小: 5915575



