ksabeh/openbrand|商品分类数据集|市场分析数据集
收藏数据集概述
特征信息
- category: 类型为字符串
- title: 类型为字符串
- brand: 类型为字符串
- asin: 类型为字符串
- imageURL: 类型为字符串
- position_index: 类型为整数
- num_tokens: 类型为整数
- title_length: 类型为整数
- title_category: 类型为字符串
数据分割
- train: 字节数为68007488,样本数为181551
- test: 字节数为18875793,样本数为50432
- automotive: 字节数为4523220,样本数为12891
- cellphones: 字节数为51882096,样本数为78478
- clothes: 字节数为37489496,样本数为85052
- electronics: 字节数为4820108,样本数为9568
- grocery: 字节数为1567047,样本数为4475
- new_cat: 字节数为93547671,样本数为174381
- pets: 字节数为4175961,样本数为10851
- sports: 字节数为3804172,样本数为10841
- toys: 字节数为4161246,样本数为12657
- val: 字节数为7583420,样本数为20172
数据集大小
- 下载大小: 110231234字节
- 数据集大小: 300437718字节

Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录
猫狗图像数据集
该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。
github 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录