migros-ch-products
收藏Hugging Face2025-08-23 更新2025-08-24 收录
下载链接:
https://huggingface.co/datasets/Yelinz/migros-ch-products
下载链接
链接失效反馈官方服务:
资源简介:
Migros瑞士产品数据集包含了Migros Switzerland苏黎世地区的部分产品信息。该数据集适用于文本分类任务,数据集语言为德语。每条产品信息包括产品名称、价格、价格文本、单位、单位价格、折扣情况、折扣信息、产品类别、图片链接和产品链接。
创建时间:
2025-08-23
原始信息汇总
Migros Switzerland Products 数据集概述
数据集基本信息
- 许可证类型:CC BY 4.0
- 任务类别:文本分类
- 支持语言:德语
- 标签:价格、杂货、瑞士
- 数据集名称:Migros CH Products
数据内容与范围
- 数据来源:Migros Switzerland(瑞士Migros超市)的产品信息
- 覆盖范围:仅包含Migros苏黎世地区的所有产品
- 数据限制:未包含其他地区产品或在线目录产品
产品信息字段
- 产品名称
- 价格
- 价格文本
- 产品单位
- 单位价格
- 折扣标识
- 折扣信息
- 产品类别
- 图片URL
- 产品URL
相关数据集
- Lidl瑞士产品数据集:https://huggingface.co/datasets/Yelinz/lidl-ch-products
- Coop瑞士产品数据集:https://huggingface.co/datasets/Yelinz/coop-ch-products
- Denner瑞士产品数据集:https://huggingface.co/datasets/Yelinz/denner-ch-products
搜集汇总
数据集介绍

构建方式
在零售业数字化转型背景下,该数据集通过自动化网络爬取技术系统性地采集了瑞士Migros苏黎世区域线上商城的商品信息。数据收集过程严格遵循地域限定原则,仅涵盖该区域全部上架商品,未纳入其他地区或线上目录商品,确保了数据来源的时空一致性。采集字段涵盖商品名称、价格结构、计量单位、促销状态等核心商业属性,形成了结构化的零售商品观测样本。
特点
数据集呈现瑞士德语区零售商品的典型特征,包含价格文本与数值的双重记录、折扣状态的布尔标识、产品分类层级等多维属性。其独特价值在于完整保留了欧洲零售业特有的价格表示规范与单位计量体系,且通过图像URL与商品URL实现了实体商品与数字信息的双向映射。作为瑞士德语区零售数据的重要组成部分,该数据集与同类超市数据集构成互补关系,为跨零售商比较研究提供了基础。
使用方法
研究者可借助该数据集开展零售价格分析、商品分类模型训练、跨区域商品对比等实证研究。使用时应通过产品URL字段验证数据时效性,结合图像URL构建多模态商品识别系统。对于计量单位字段需注意瑞士特有的计量标准,价格分析需区分标准价格与折扣价格的逻辑关联。建议与同类超市数据集进行联合分析,以揭示瑞士零售市场的整体特征与竞争格局。
背景与挑战
背景概述
Migros CH Products数据集由瑞士零售研究机构于2023年构建,聚焦于德语区零售商品信息结构化领域。该数据集收录Migros苏黎世区域的全品类商品数据,涵盖价格、折扣、品类等多维度信息,为零售定价分析、商品推荐算法及跨区域市场比较研究提供关键数据支撑。其构建延续了瑞士连锁超市数据开源项目体系,与Lidl、Coop等超市数据集形成互补,推动了欧洲零售数字化研究的进程。
当前挑战
该数据集核心挑战在于解决零售商品动态定价与跨区域可比性分析问题。商品价格频繁波动、折扣策略复杂多变对价格预测模型构成显著挑战;构建过程中受限于Migros目录层级结构,仅能爬取苏黎世区域数据,存在区域覆盖不全导致的样本偏差。此外多语言商品描述单元标准化、折扣信息异构性等问题亦增加了数据清洗与标注难度。
常用场景
经典使用场景
在零售数据分析领域,Migros CH Products数据集为研究人员提供了瑞士苏黎世地区Migros超市产品的结构化信息。该数据集常被用于商品价格趋势分析、消费者行为研究以及零售市场策略优化。通过整合产品名称、价格、折扣信息及分类数据,学者能够深入探究区域零售动态与消费者偏好模式。
解决学术问题
该数据集有效解决了零售经济学中价格弹性建模、促销效果评估以及区域市场差异分析等核心问题。其提供的详细定价与折扣数据支持学者构建精准的需求预测模型,同时为跨区域零售比较研究提供了标准化数据基础,显著提升了零售实证研究的可靠性与可重复性。
衍生相关工作
该数据集催生了多项零售数据分析领域的创新研究,包括基于迁移学习的跨超市价格预测模型、多语言商品分类系统开发,以及瑞士零售市场集中度研究。相关工作还拓展至可持续消费模式分析,通过产品单元数据测算包装浪费与环境影响评估。
以上内容由遇见数据集搜集并总结生成



