reczoo/Criteo_x1
收藏Hugging Face2023-12-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/reczoo/Criteo_x1
下载链接
链接失效反馈官方服务:
资源简介:
Criteo_x1数据集是一个广泛使用的CTR预测基准数据集,包含约一周的点击数据,用于展示广告。数据集包含13个数值特征和26个类别特征,按7:2:1的比例随机分为训练集、验证集和测试集。数据集总大小为45,840,617条记录,其中训练集33,003,326条,验证集8,250,124条,测试集4,587,167条。
Criteo_x1数据集是一个广泛使用的CTR预测基准数据集,包含约一周的点击数据,用于展示广告。数据集包含13个数值特征和26个类别特征,按7:2:1的比例随机分为训练集、验证集和测试集。数据集总大小为45,840,617条记录,其中训练集33,003,326条,验证集8,250,124条,测试集4,587,167条。
提供机构:
reczoo
原始信息汇总
Criteo_x1
数据集描述
Criteo数据集是一个广泛使用的CTR预测基准数据集,包含大约一周的展示广告点击数据。该数据集包含13个数值特征字段和26个类别特征字段。根据AFN的研究,我们将数据随机分为7:2:1的比例,分别作为训练集、验证集和测试集。
数据集统计
| 数据集划分 | 总计 | 训练集 | 验证集 | 测试集 |
|---|---|---|---|---|
| Criteo_x1 | 45,840,617 | 33,003,326 | 8,250,124 | 4,587,167 |
数据完整性校验
bash $ md5sum train.csv valid.csv test.csv 30b89c1c7213013b92df52ec44f52dc5 train.csv f73c71fb3c4f66b6ebdfa032646bea72 valid.csv 2c48b26e84c04a69b948082edae46f8c test.csv
搜集汇总
背景与挑战
背景概述
Criteo_x1是一个用于CTR预测的基准数据集,包含约一周的广告点击数据,具有13个数值特征和26个类别特征。数据集按7:2:1的比例随机分割为训练集、验证集和测试集,总记录数超过4500万条,适用于展示广告领域的模型训练和评估。
以上内容由遇见数据集搜集并总结生成



