MT-LIFT|食品配送数据集|营销分析数据集
收藏数据集概述
MT-LIFT 是一个大规模且无偏的数据集,源自美团App中两个月的食品配送优惠营销场景。该数据集通过随机控制试验收集,确保治疗组(优惠券)与对照组之间的潜在分布一致,以消除混杂因素对提升建模的影响。数据集采用了匿名化和去敏感化技术以保护数据隐私。
数据集特点
- 无偏收集:数据集通过随机分配优惠券,确保治疗组与对照组间潜在分布的一致性。
- 丰富特征:包含99个特征,提供大量信息以供提取。
- 多重治疗:支持探索不同干预措施的效果。
- 全面链信息:从展示空间收集,包含点击和转换的全面链信息,便于准确分析用户响应。
数据集应用
- 点击率(CTR)预测
- 转化率(CVR)预测
- 联合建模
- 提升建模
数据集统计
- 数据量:5,541,842条记录
- 特征数量:99个特征
- 平均点击率:33.49%
- 平均转化率:6.82%
- 相对平均点击提升:56.81%
- 平均点击提升:13.49%
- 相对平均转化提升:169.23%
- 平均转化提升:5.19%
数据集结构
shell MT-LIFT ├── train.csv └── test.csv
数据字段
- click:点击标签
- conversion:转化标签
- treatment:治疗标签,范围[0, 4]
- f0-f98:特征字段

OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
CHARLS
中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。
charls.pku.edu.cn 收录
典型分布式光伏出力预测数据集
光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。
国家基础学科公共科学数据中心 收录
全国景区数据
中华人民共和国旅游景区质量等级共分为五级,从高到低依次为AAAAA、AAAA、AAA、AA、A级五级。5A级景区代表着中国的世界级精品旅游风景区等级。 CnOpenData汇总整理了全国31个省份及直辖市的景区信息,涵盖了景区名称、省份、景区级别、地址、经纬度、简介等字段,为相关研究助力!
CnOpenData 收录