five

Mango&ZaraFacts

收藏
NIAID Data Ecosystem2026-03-12 收录
下载链接:
https://zenodo.org/record/4681989
下载链接
链接失效反馈
官方服务:
资源简介:
Los datos que tenemos disponibles en la base de datos diseñada será un conjunto relacionado con la oferta de moda proporcionada a la población a nivel nacional. Se podría diferenciar los datos en un par de subconjuntos:  Información de la prenda: características disponibles para la compra de la prenda: tallas, colores, precios, etc. Cuidado y material de la prenda: conjunto de información que detallará los cuidados requeridos y los materiales de confección, así como el lugar de fabricación  de las prendas: lavado, secado, blanqueantes, etc.  conjunto de datos disponibles en el dataset será: Referencia (id): cadena de caracteres alfanumérico que utiliza cada página para identificar el producto. Grupo (group): conjunto del que forma parte el producto. Las posibilidades son: Hombre, Mujer, Niño o Niña. Categoría (category): tipo de prenda a la que pertenece. Las posibilidades son: Camisa, Camiseta, Pantalones, Vaqueros. Imágenes (images): cantidad de imágenes proporcionadas de la prenda. Tallas (size): Rango de tallas disponible. Algunos ejemplos serían: XS-XL, S-M-L, 34-46, 6 años (116 cm)-13-14 años (164 cm). Variedad de colores (colour): número de colores distintos disponibles del producto. Temporada (season): la moda se distribuye por distintas temporadas acorde al momento del año. Se podrán definir dos temporadas: primavera - verano u otoño - invierno. Precio (price): coste del producto Fabricado (made_in): Información del país dónde se ha creado el producto. Algunos ejemplos son: Portugal, Turquía o China.  Cuidado de la ropa (clothes_care): el campo contiene información sobre los cuidados que debe tener el producto. La información se encontrará bajo el mismo campo, separada por guiones. En concreto, la información que podemos  Fabricado(made_in): información del origen de confección del producto. Temperatura máxima para el lavado (temp_max_washing): temperatura máxima indicada para el cuidado de la prenda acorde al lavado. Centrifugado (spin): indica si el tiempo de centrifugado debe ser nulo, corto o indiferente.  Blanqueante (whitening): si o no acorde a la posibilidad de utilizar productos blanqueantes, como la lejía, sobre el producto. Temperatura máxima del planchado (temp_max_iron): temperatura máxima indicada para el cuidado de la prenda acorde al planchado. Limpieza en seco (dry_wash): posibilidad de limpiar la prenda en seco. Secadora (drying_machine): posibilidad de usar la secadora para la prenda. Cadena (brand): al extraer información desde dos páginas distintas, se diferenciarán en dos marcas: Zara o Mango.  Además, para la marca Mango estará el código pre-preparado para la extracción de la información relacionada a ofertas y materiales. Está disponible la llamada para la extracción de dicha información, sólo se deberá ajustar el código para la generación del CSV para la creación de este campo. Las temporadas en la moda es un punto muy relevante y que determina el estilo y variedad de productos que encontraremos. En concreto, cómo estamos evaluando las páginas españolas, la colección de otoño-invierno suele haber una gran variedad de abrigos, mientras que en la de primavera-verano hay más cantidad de camisetas.  Por ello, este script obtendrá la información acorde a la época en la que se ejecute el código: de enero a junio será temporada primavera-verano y de julio a diciembre la temporada otoño-invierno.   El dataset presentado, se corresponde a la colección de primavera-verano, ya que se ha extraido la información durante los meses de Marzo a Abril.   Para la recogida de la información, se han analizado las páginas de www.zara.com/es/  y https://shop.mango.es/shop/ . Dentro de cada una de ellas, se ha validado, en una primera instancia, que no existiera ningún robot.txt.  Con esta información observada, se realiza una navegación profunda por la página para buscar la localización de los datos requeridos y, de este modo, poder obtenerlos finalmente en el dataset generado.
创建时间:
2021-04-13
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作