five

Categorical Feature Encoding Challenge分类特征编码挑战

收藏
阿里云天池2026-05-26 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/89812
下载链接
链接失效反馈
官方服务:
资源简介:
数据包含二进制特征(bin_*),名义特征(nom_*),序数特征(ord_*)以及(day一周中的)(可能是周期性的)month特征。字符串序数特征ord_{3-5}根据依词法排序string.ascii_letters。

The dataset includes binary features (bin_*), nominal features (nom_*), ordinal features (ord_*), as well as month features, where "day" refers to the day of the week and these features may be periodic. The string-based ordinal features ord_{3–5} are sorted lexicographically according to string.ascii_letters.
提供机构:
阿里云天池
创建时间:
2021-02-01
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集来自天池平台的分类特征编码挑战,专注于二元分类任务,所有特征均为分类类型,包括二进制、名义、序数和周期性特征。数据集设计用于探索和比较不同的编码策略,且不包含缺失值或未见特征值。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务