five

ECSI dataset

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/wufanyou/KDD-Cup-2022-Amazon
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为ECSI,包含三个表格:产品目录、训练集和测试集。其中,测试集进一步细分为公开和私有两部分。该数据集为理解电商环境中的产品查询及其相关标签提供了一种结构化的方法。此外,数据集还包含了产品目录信息、训练集和测试集,这些集合的标签分布各不相同。该数据集突显了一些问题,例如数据泄露以及私有测试集中的独特产品条目。规模方面,数据集包含了多个产品条目,其标签分布各有差异。该数据集的任务是利用自然语言处理方法,提升电商搜索结果的准确性。

This dataset is named ECSI, which consists of three tables: product catalog, training set, and test set. The test set is further subdivided into public and private subsets. It provides a structured methodology for comprehending product queries and their corresponding tags in e-commerce environments. Additionally, the dataset includes product catalog information, training set and test set, with distinct label distributions across these sets. This dataset highlights issues such as data leakage and unique product entries in the private test set. In terms of scale, the dataset contains multiple product entries with varying label distributions. The task of this dataset is to enhance the accuracy of e-commerce search results using natural language processing methods.
提供机构:
Amazon KDD Cup 2022
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作