coop-ch-products
收藏Hugging Face2025-08-23 更新2025-08-24 收录
下载链接:
https://huggingface.co/datasets/Yelinz/coop-ch-products
下载链接
链接失效反馈官方服务:
资源简介:
瑞士Coop商店产品数据集包含了瑞士Coop商店全部线上目录中的产品和相关信息。这些信息包括产品名称、价格、价格文本、产品单位、单价、是否打折、折扣信息、产品类别、图片链接和产品链接。
创建时间:
2025-08-22
原始信息汇总
Coop CH Products 数据集概述
数据集基本信息
- 许可证:CC BY 4.0
- 任务类别:文本分类
- 语言:德语
- 标签:价格、杂货、瑞士
- 正式名称:Coop CH Products
数据内容
- 来源:瑞士Coop超市全部在线目录产品
- 涵盖信息:
- 产品名称
- 价格
- 价格文本
- 产品单位
- 单位价格
- 折扣状态
- 折扣信息
- 产品类别
- 图片URL
- 产品URL
相关数据集
- https://huggingface.co/datasets/Yelinz/lidl-ch-products
- https://huggingface.co/datasets/Yelinz/migros-ch-products
- https://huggingface.co/datasets/Yelinz/denner-ch-products
搜集汇总
数据集介绍

构建方式
在零售数据分析领域,Coop CH Products数据集通过系统化爬取瑞士Coop超市的在线商品目录构建而成。该方法确保了产品信息的全面性与实时性,涵盖了名称、价格、折扣信息、产品类别及图像链接等关键字段,为消费者行为研究提供了结构化数据基础。
特点
该数据集以德语标注,聚焦瑞士零售市场,包含价格文本、单位定价和折扣状态等多维度信息。其突出特点在于完整覆盖Coop线上商品生态,并与Migros、Lidl等超市数据集形成互补,为跨平台比价分析和区域经济研究创造了独特价值。
使用方法
研究者可借助该数据集训练文本分类模型,解析商品描述与价格策略的关联性。实际应用中,需通过产品URL字段动态追踪数据更新,结合图像URL实现多模态分析,同时遵循CC-BY-4.0协议规范数据引用,确保学术应用的合规性。
背景与挑战
背景概述
在数字化零售业蓬勃发展的背景下,Coop CH Products数据集由瑞士研究机构于近年构建,旨在系统收录Coop瑞士线上商城的全品类商品信息。该数据集涵盖了产品名称、价格结构、折扣详情、分类体系及图像链接等多维度数据,为消费者行为分析、动态定价策略和跨平台比价系统提供了关键数据支撑,显著推动了零售数据科学在德语区市场的实证研究进展。
当前挑战
该数据集核心挑战在于解决多语言环境下零售商品标准化分类的复杂性,尤其是德语商品描述中的复合词解析和单位统一性问题。构建过程中需克服电商平台反爬虫机制对数据完整性的影响,同时确保价格时序动态与折扣逻辑的精确捕获,此外还需处理图像URL失效和跨品类商品边界模糊等技术难题。
常用场景
经典使用场景
在零售业数据分析领域,Coop CH Products数据集为研究瑞士消费品市场提供了详实的商品信息基础。该数据集最经典的使用场景包括商品价格趋势分析、消费者行为建模以及跨超市比价系统的开发,研究者能够基于实际商品数据构建动态定价模型和市场需求预测系统。
实际应用
实际应用中,该数据集支撑了智能购物助手程序的开发,帮助消费者进行最优采购决策。零售企业可依据数据优化库存管理和定价策略,市场分析机构则利用其监测瑞士生活成本变化,为经济政策制定提供数据支撑。
衍生相关工作
该数据集衍生了多个经典研究方向,包括基于跨超市数据对比的竞争分析框架、多语言商品信息匹配算法,以及结合图像与文本的多模态商品识别系统。相关工作还拓展至消费者价格指数计算的自动化方法和区域购买力平价研究。
以上内容由遇见数据集搜集并总结生成



