DBQ/Burberry.Product.prices.China
收藏Hugging Face2023-11-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DBQ/Burberry.Product.prices.China
下载链接
链接失效反馈官方服务:
资源简介:
---
annotations_creators:
- other
language_creators:
- other
language:
- en
license:
- unknown
multilinguality:
- monolingual
source_datasets:
- original
task_categories:
- text-classification
- image-classification
- feature-extraction
- image-segmentation
- image-to-image
- image-to-text
- object-detection
- summarization
- zero-shot-image-classification
pretty_name: China - Burberry - Product-level price list
tags:
- webscraping
- ecommerce
- Burberry
- fashion
- fashion product
- image
- fashion image
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
dataset_info:
features:
- name: website_name
dtype: string
- name: competence_date
dtype: string
- name: country_code
dtype: string
- name: currency_code
dtype: string
- name: brand
dtype: string
- name: category1_code
dtype: string
- name: category2_code
dtype: string
- name: category3_code
dtype: string
- name: product_code
dtype: int64
- name: title
dtype: string
- name: itemurl
dtype: string
- name: imageurl
dtype: string
- name: full_price
dtype: float64
- name: price
dtype: float64
- name: full_price_eur
dtype: float64
- name: price_eur
dtype: float64
- name: flg_discount
dtype: int64
splits:
- name: train
num_bytes: 638473
num_examples: 2014
download_size: 190988
dataset_size: 638473
---
# Burberry web scraped data
## About the website
The **luxury fashion industry** in the Asia Pacific region, particularly in **China**, has seen a significant shift towards digitalization. **Online shopping**, fuelled by the growth of **Ecommerce**, has become a major sales channel for high-end labels like **Burberry**. This growth in online sales has outpaced that of the offline sector, making e-commerce a key driver for the luxury fashion sector. Chinese consumption of luxury goods is turning towards **e-commerce platforms**, which acts as a crucial bridge connecting luxury fashion powerhouses and customers. The dataset examined contains **Ecommerce product-list page (PLP) data** on **Burberry** within the **Chinese market**.
## Link to **dataset**
[China - Burberry - Product-level price list dataset](https://www.databoutique.com/buy-data-page/Burberry%20Product-prices%20China/r/rec8WRWvzC4DWfhsL)
注释创建者:
- 其他
语言创建者:
- 其他
语言:
- 英语
许可证:
- 未知
多语言属性:
- 单语言
源数据集:
- 原创数据集
任务类别:
- 文本分类
- 图像分类
- 特征提取
- 图像分割
- 图像到图像
- 图像到文本
- 目标检测
- 文本摘要
- 零样本图像分类
友好名称:中国 - 博柏利(Burberry)产品级价目表
标签:
- 网页抓取
- 电子商务
- 博柏利(Burberry)
- 时尚
- 时尚产品
- 图片
- 时尚图片
配置项:
- 配置名称:默认
数据文件:
- 拆分集:训练集
路径:data/train-*
数据集信息:
特征字段:
- 字段名:网站名称
数据类型:字符串
- 字段名:数据生效日期
数据类型:字符串
- 字段名:国家代码
数据类型:字符串
- 字段名:货币代码
数据类型:字符串
- 字段名:品牌
数据类型:字符串
- 字段名:一级分类代码
数据类型:字符串
- 字段名:二级分类代码
数据类型:字符串
- 字段名:三级分类代码
数据类型:字符串
- 字段名:产品代码
数据类型:64位整数
- 字段名:商品标题
数据类型:字符串
- 字段名:商品链接
数据类型:字符串
- 字段名:图片链接
数据类型:字符串
- 字段名:原价
数据类型:64位浮点数
- 字段名:现价
数据类型:64位浮点数
- 字段名:欧元原价
数据类型:64位浮点数
- 字段名:欧元现价
数据类型:64位浮点数
- 字段名:折扣标记
数据类型:64位整数
数据拆分:
- 拆分名称:训练集
字节数:638473
样本数量:2014
下载大小:190988字节
数据集大小:638473字节
# 博柏利(Burberry)网页抓取数据
## 关于该网站
亚太地区奢侈品时尚行业,尤其是中国市场,正经历显著的数字化转型。在电子商务(Ecommerce)的增长推动下,线上购物已成为博柏利(Burberry)这类高端时尚品牌的核心销售渠道。线上销售增速远超线下,成为奢侈品时尚行业的关键增长引擎。中国奢侈品消费正加速转向电子商务平台,该平台成为连接奢侈品时尚巨头与消费者的重要桥梁。本数据集收录了中国市场范围内博柏利(Burberry)的电子商务产品列表页(PLP, Product List Page)数据。
## 数据集链接
[中国 - 博柏利(Burberry)产品级价目表数据集](https://www.databoutique.com/buy-data-page/Burberry%20Product-prices%20China/r/rec8WRWvzC4DWfhsL)
提供机构:
DBQ
原始信息汇总
数据集概述
基本信息
- 数据集名称: China - Burberry - Product-level price list
- 标签: webscraping, ecommerce, Burberry, fashion, fashion product, image, fashion image
- 配置: default
语言和许可
- 语言: 英语 (en)
- 许可: 未知
多语言性
- 多语言性: 单语种 (monolingual)
任务类别
- 文本分类
- 图像分类
- 特征提取
- 图像分割
- 图像到图像
- 图像到文本
- 目标检测
- 摘要生成
- 零样本图像分类
数据文件
- 训练集: 路径为
data/train-*
数据集信息
- 特征:
website_name: 字符串competence_date: 字符串country_code: 字符串currency_code: 字符串brand: 字符串category1_code: 字符串category2_code: 字符串category3_code: 字符串product_code: 整数 (int64)title: 字符串itemurl: 字符串imageurl: 字符串full_price: 浮点数 (float64)price: 浮点数 (float64)full_price_eur: 浮点数 (float64)price_eur: 浮点数 (float64)flg_discount: 整数 (int64)
数据分割
- 训练集:
- 字节数: 638473
- 样本数: 2014
数据集大小
- 下载大小: 190988 字节
- 数据集大小: 638473 字节
搜集汇总
数据集介绍

构建方式
在时尚奢侈品行业数字化转型的背景下,该数据集通过网页抓取技术构建而成,聚焦于中国市场的Burberry品牌产品。数据来源于电子商务平台的产品列表页面,系统性地采集了包括产品标题、价格、图像链接及分类信息在内的多维度字段。构建过程确保了数据的时效性与完整性,为研究奢侈品在线市场提供了结构化基础。
特点
该数据集以英文呈现,涵盖2014个产品实例,具有丰富的特征维度,如品牌、分类代码、价格及折扣标志等。其独特性在于整合了产品图像与文本信息,支持图像分类、目标检测及文本分类等多任务研究。数据集中于单一品牌与中国市场,为分析奢侈品电商定价策略和消费行为提供了高度聚焦的样本。
使用方法
研究人员可利用该数据集进行奢侈品市场的多模态分析,例如通过图像与文本特征联合建模,探索产品定价与视觉呈现的关联。在机器学习任务中,数据适用于训练分类模型以预测折扣行为,或进行跨模态检索实验。使用前需注意数据许可未知,建议结合领域知识验证数据一致性,以保障研究的可靠性。
背景与挑战
背景概述
在亚太地区,特别是中国市场,奢侈品时尚产业正经历着深刻的数字化转型浪潮。随着电子商务的迅猛发展,在线购物已成为博柏利等高端品牌的核心销售渠道,其增长势头已超越传统线下零售,成为驱动奢侈品行业的关键力量。DBQ/Burberry.Product.prices.China数据集由数据采集机构于近年构建,专注于捕捉中国市场中博柏利产品的电子商务列表页数据,涵盖产品编码、标题、图像链接及多层级价格信息。该数据集旨在为时尚电商分析、价格动态监测及消费者行为研究提供结构化基础,助力学术界与产业界深入理解奢侈品在数字化环境中的市场表现与定价策略。
当前挑战
该数据集致力于应对奢侈品电商领域的产品识别与价格分析挑战,尤其在多模态数据融合方面存在难点,例如如何精准关联文本描述与产品图像以实现细粒度分类。在构建过程中,挑战主要源于网络爬取技术的复杂性:奢侈品网站常采用动态内容加载及反爬虫机制,导致数据获取的完整性与时效性受限;同时,产品信息的非结构化特性要求对多层级分类体系进行标准化处理,而价格货币转换与折扣标识的准确性亦需跨域验证,这些因素共同增加了数据集构建与维护的难度。
常用场景
经典使用场景
在时尚电子商务与奢侈品市场分析领域,DBQ/Burberry.Product.prices.China数据集为研究者提供了宝贵的结构化数据资源。该数据集通过爬取Burberry在中国市场的产品列表页信息,整合了产品标题、图像链接、价格及折扣标志等多维度特征,经典使用场景集中于时尚产品的多模态分析。研究者可借助其文本与图像数据,训练模型进行产品分类、价格预测或视觉特征提取,从而深入探索奢侈品在线销售中的定价策略与消费者行为模式。
实际应用
在实际应用层面,该数据集为时尚行业与电子商务平台提供了直接的数据洞察。品牌管理者可利用其分析Burberry在中国市场的产品布局与价格区间,优化库存管理与营销活动。电商平台则可基于产品图像与文本数据,开发更精准的视觉搜索与推荐引擎,提升用户体验。此外,市场分析师能够借助价格趋势与折扣模式,评估奢侈品在线销售的市场竞争力,为商业决策提供数据驱动的参考依据。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作。在时尚计算领域,研究者利用其多模态数据开发了基于深度学习的时尚产品分类与检索模型,如结合卷积神经网络与文本嵌入的跨模态匹配系统。在经济学与市场学方面,学者通过分析价格与折扣动态,探讨了奢侈品在线定价对消费者购买意愿的影响。这些工作不仅拓展了数据集的学术价值,也促进了时尚人工智能与数字化营销研究的交叉融合。
以上内容由遇见数据集搜集并总结生成



