Competitor Raw Data
收藏NIAID Data Ecosystem2026-03-12 收录
下载链接:
https://zenodo.org/record/4679325
下载链接
链接失效反馈官方服务:
资源简介:
El dataset contiene una línea por cada producto publicado en el sitio web de muebles en cuestión al momento de la extracción. Por cada ítem se obtendrán los siguientes datos:
Title: Nombre del producto.
Price: Precio del producto.
Category_path: categoría a la cual pertenece el producto.
Rating: el rating es el promedio de las calificaciones recibidas por parte de los compradores del producto.
Qty_califications: cantidad de calificaciones recibidas.
Features_JSON_format: se guarda en un solo campo y en formato JSON las medidas y/o características del producto. Se elige este formato por dos razones principales:
Cada producto puede tener diferentes características de acuerdo a su categoría que hacen que tengan n posibles features y medidas, por ej, podemos tener una lata de barniz con una única característica como ser la capacidad en litros, hasta una cama donde podemos tener el ancho, largo, altura, el tipo de madera, etc.
Al ser esta info extraída via web scraping y al considerarla raw data creemos que como primer stage del dato es válida conservarla de esta manera. Podrán ser parseados estos en etapas posteriores según sea necesario y según la categoría del producto.
Image_Url: url de la primera imagen del producto en la publicación.
Item_Url: url del producto dentro del sitio web.
创建时间:
2021-04-11



