LuminaAI/RCL-Ecommerce-Product-Descriptions
收藏Ecommerce Product Descriptions Dataset
概述
该数据集包含各种电子商务产品的描述。每个样本存储在单独的文本文件中,特征以空格分隔,存储在单行中。数据集结构与Lumina AI的随机对比学习(RCL)算法兼容,可通过PrismRCL应用程序或API使用。
数据集结构
数据集按以下结构组织:
Ecommerce_Product_Descriptions/ train_data/ category_1/ sample_0.txt sample_1.txt ... category_2/ sample_0.txt sample_1.txt ... test_data/ category_1/ sample_0.txt sample_1.txt ... category_2/ sample_0.txt sample_1.txt ...
注意:所有文本文件名在所有类别文件夹中必须是唯一的。
特征
- 表格数据:每个文本文件包含以空格分隔的值,表示样本的特征。
- 类别:有多个类别,每个类别根据产品类型由单独的文件夹表示。
使用
以下是使用PrismRCL加载数据集的示例:
bash C:PrismRCLPrismRCL.exe chisquared rclticks=10 boxdown=0 data=C:path oEcommerce_Product_Descriptions rain_data testdata=C:path oEcommerce_Product_Descriptions est_data savemodel=C:path omodelsmymodel.classify log=C:path olog_files stopwhendone
许可证
该数据集根据知识共享署名4.0国际许可协议授权。有关更多详细信息,请参阅LICENSE文件。
原始来源
该数据集最初来源于Kaggle数据集仓库。如果在研究或应用中使用此数据集,请引用原始来源。



