five

open-prices

收藏
Hugging Face2024-11-30 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/openfoodfacts/open-prices
下载链接
链接失效反馈
官方服务:
资源简介:
Open Prices数据集是一个全球产品价格收集和共享的项目。该数据集由Open Food Facts开发和维护,并根据开放数据库许可证(ODbL)公开提供。数据集以Parquet格式存储,每日更新,包含产品ID、条码、类别、标签、产地、价格、货币、位置详情和证明信息等列。其目的是通过开放许可证收集和共享产品价格,从而实现价格数据的民主化访问。
创建时间:
2024-11-19
原始信息汇总

Open Prices Dataset

数据集描述

概述

  • 名称: Open Prices Dataset
  • 许可证: Open Database License (ODbL)
  • 标签:
    • price
    • food
  • 数据量: 10K < n < 100K

数据文件

  • 配置名称: default
  • 数据文件:
    • 分割: prices
    • 路径: prices.parquet

数据列描述

  • id: 价格在数据库中的ID
  • product_code: 产品的条形码,如果是“原始”产品(如水果、蔬菜等)则为空
  • category_tag: 产品的类别,仅适用于“原始”产品,遵循Open Food Facts类别分类法
  • labels_tags: 产品的标签,仅适用于“原始”产品,遵循Open Food Facts标签分类法
  • origins_tags: 产品的来源,仅适用于“原始”产品,遵循Open Food Facts来源分类法
  • price: 产品的价格,如有折扣则包含折扣
  • price_is_discounted: 价格是否为折扣价
  • price_without_discount: 产品无折扣的价格,如无折扣则为空
  • price_per: 价格对应的单位(如“千克”、“单位”)
  • currency: 价格的货币单位
  • location_osm_id: 记录价格的地点的OpenStreetMap ID
  • location_osm_type: OpenStreetMap地点的类型(如“节点”、“路径”)
  • location_id: 地点在Open Prices数据库中的ID
  • date: 价格记录的日期
  • proof_id: 价格证明在Open Prices数据库中的ID
  • owner: 价格的拥有者的哈希值,用于隐私保护
  • created: 价格在Open Prices数据库中创建的日期
  • updated: 价格在Open Prices数据库中最后更新的日期
  • proof_file_path: 价格证明文件在Open Prices数据库中的路径
  • proof_type: 证明的类型,可能的值包括RECEIPTPRICE_TAGGDPR_REQUESTSHOP_IMPORT
  • proof_date: 证明的日期
  • proof_currency: 证明的货币单位,应与价格货币相同
  • proof_created: 证明在Open Prices数据库中创建的日期时间
  • proof_updated: 证明在Open Prices数据库中最后更新的日期时间
  • location_osm_display_name: OpenStreetMap地点的显示名称
  • location_osm_address_city: OpenStreetMap地点的城市
  • location_osm_address_postcode: OpenStreetMap地点的邮政编码

图像访问

  • 图像基础URL: https://prices.openfoodfacts.org/img/
  • 图像路径: 通过将proof_file_path列与基础URL拼接,获取图像的完整URL

贡献方式

搜集汇总
数据集介绍
main_image_url
构建方式
Open Prices数据集通过收集全球各地产品的价格信息构建而成,其数据来源于Open Food Facts项目。该数据集以Parquet格式存储,每日更新,确保数据的时效性。数据集的构建过程中,采用了开放数据库许可证(ODbL),使得数据可以自由使用,只需注明来源并分享任何修改。此外,数据集中的价格信息通过OpenStreetMap进行地理位置的唯一标识,确保了数据的准确性和可追溯性。
使用方法
使用Open Prices数据集时,用户可以通过访问数据集的官方网站或使用Open Food Facts移动应用来获取最新的价格信息。数据集以Parquet格式提供,便于高效的数据读取和处理。用户可以根据需要提取特定的列数据,如产品代码、价格、货币类型等,进行深入分析。此外,数据集中的图像证据可以通过拼接`proof_file_path`列与基础URL来获取,进一步验证数据的准确性。
背景与挑战
背景概述
Open Prices数据集是由Open Food Facts开发和维护的一个项目,旨在收集并共享全球范围内的产品价格信息。该数据集的核心研究问题在于如何通过开放许可的方式,使价格数据民主化,从而打破少数公司对价格数据库的垄断。Open Prices数据集的创建时间虽未明确提及,但其背后的主要研究机构Open Food Facts是一个致力于食品数据开放的非营利组织。该数据集的发布对价格数据的研究和分析领域产生了深远影响,尤其是在食品价格透明化和市场分析方面,为研究人员和公众提供了宝贵的资源。
当前挑战
Open Prices数据集在构建过程中面临多个挑战。首先,价格数据的收集涉及全球范围内的多样性,包括不同货币、计量单位和市场环境,这增加了数据标准化和处理的复杂性。其次,确保数据的真实性和准确性也是一个重要挑战,尤其是在处理用户提交的价格证明时,需验证其合法性和一致性。此外,数据隐私和安全问题也不容忽视,尤其是在处理用户提交的个人信息时,需采取有效的匿名化措施。最后,数据集的持续更新和维护也是一个长期挑战,需确保数据的实时性和完整性。
常用场景
经典使用场景
Open Prices数据集的经典使用场景主要集中在价格分析与市场研究领域。研究者可以利用该数据集进行全球范围内商品价格的比较分析,揭示不同地区、不同时间点的价格波动趋势。此外,该数据集还可用于消费者行为研究,通过分析价格变化对消费者购买决策的影响,帮助企业优化定价策略。
解决学术问题
Open Prices数据集解决了价格数据获取困难这一常见的学术研究问题。传统上,价格数据多为私有,且获取成本高昂,限制了相关研究的广泛开展。该数据集通过开放共享,使得研究者能够自由获取和分析价格信息,推动了市场经济学、消费者行为学等领域的研究进展,具有重要的学术意义。
实际应用
在实际应用中,Open Prices数据集被广泛用于零售业的价格策略制定与优化。企业可以通过分析不同地区的价格差异,调整其市场定位和定价策略,以提高竞争力。此外,政府和非营利组织也可利用该数据集监控市场价格波动,确保市场公平与透明,维护消费者权益。
数据集最近研究
最新研究方向
在价格数据日益成为全球经济研究核心资源的背景下,Open Prices数据集凭借其开放性和实时更新的特性,正逐渐成为经济学、市场分析和消费者行为研究的重要工具。该数据集不仅提供了丰富的产品价格信息,还通过整合OpenStreetMap的地理数据,为研究者提供了价格与地理位置的关联分析可能性。当前,前沿研究方向主要集中在利用机器学习算法对价格波动进行预测,以及通过大数据分析揭示价格与市场供需、消费者偏好之间的复杂关系。此外,Open Prices的开放许可模式也为跨学科研究提供了便利,尤其是在食品安全、可持续消费和公平贸易等领域,其数据的应用潜力正在被广泛探索。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作