five

reczoo/Criteo_x1

收藏
Hugging Face2023-12-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/reczoo/Criteo_x1
下载链接
链接失效反馈
官方服务:
资源简介:
Criteo_x1数据集是一个广泛使用的CTR预测基准数据集,包含约一周的点击数据,用于展示广告。数据集包含13个数值特征和26个类别特征,按7:2:1的比例随机分为训练集、验证集和测试集。数据集总大小为45,840,617条记录,其中训练集33,003,326条,验证集8,250,124条,测试集4,587,167条。

Criteo_x1数据集是一个广泛使用的CTR预测基准数据集,包含约一周的点击数据,用于展示广告。数据集包含13个数值特征和26个类别特征,按7:2:1的比例随机分为训练集、验证集和测试集。数据集总大小为45,840,617条记录,其中训练集33,003,326条,验证集8,250,124条,测试集4,587,167条。
提供机构:
reczoo
原始信息汇总

Criteo_x1

数据集描述

Criteo数据集是一个广泛使用的CTR预测基准数据集,包含大约一周的展示广告点击数据。该数据集包含13个数值特征字段和26个类别特征字段。根据AFN的研究,我们将数据随机分为7:2:1的比例,分别作为训练集、验证集和测试集。

数据集统计

数据集划分 总计 训练集 验证集 测试集
Criteo_x1 45,840,617 33,003,326 8,250,124 4,587,167

数据完整性校验

bash $ md5sum train.csv valid.csv test.csv 30b89c1c7213013b92df52ec44f52dc5 train.csv f73c71fb3c4f66b6ebdfa032646bea72 valid.csv 2c48b26e84c04a69b948082edae46f8c test.csv

搜集汇总
背景与挑战
背景概述
Criteo_x1是一个用于CTR预测的基准数据集,包含约一周的广告点击数据,具有13个数值特征和26个类别特征。数据集按7:2:1的比例随机分割为训练集、验证集和测试集,总记录数超过4500万条,适用于展示广告领域的模型训练和评估。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作