Australian grocery price database
收藏github2024-07-20 更新2024-07-21 收录
下载链接:
https://github.com/tjhowse/aus_grocery_price_database
下载链接
链接失效反馈官方服务:
资源简介:
此数据集收集自Woolworths网站的澳大利亚杂货价格,并存储在一个时间序列数据库中。未来可能扩展到其他澳大利亚杂货商。
This dataset contains Australian grocery price data collected from the Woolworths website and stored in a time-series database. It may be expanded to cover other Australian grocery retailers in the future.
创建时间:
2024-07-16
原始信息汇总
澳大利亚杂货价格数据库
概述
该数据集从Woolworths网站收集杂货价格,并将其存储到InfluxDB时间序列数据库中。未来可能会扩展到其他澳大利亚杂货商,具体取决于时间、动机等因素。
需求
- 需要帮助:希望有人能协助开发一个定制的前端界面,用于可视化收集的数据。
- 资金支持:考虑通过GitHub赞助来支持项目的运营成本。
托管
该数据集的托管设置在fly.io上,尽管使用的是盈利性服务,但托管过程相对简单。未来可能会通过Docker Compose使其更具平台独立性。
搜集汇总
数据集介绍

构建方式
该数据集的构建方式基于对澳大利亚两大主要超市Woolworths和Coles的网站进行实时价格数据抓取。通过使用Golang编写的应用程序,系统能够高效地从这些超市的API中提取价格信息,并将其流式传输至InfluxDB时间序列数据库中。此数据库被设计用于高效存储带有标签的数值信息,并内置基本的数据探索和绘图功能。此外,Grafana作为更强大的绘图和仪表盘应用,能够与时间序列数据库无缝对接,提供更为复杂的数据可视化功能。
特点
该数据集的主要特点在于其能够实时追踪和记录澳大利亚超市商品的价格变动,从而为消费者提供长期的价格趋势分析。通过这种方式,用户可以更有效地进行购买决策,并监督超市的价格调整行为。此外,数据集的设计注重低成本和高效率,采用Docker容器化技术,确保各应用组件的独立性和可扩展性。尽管目前依赖于特定的托管服务,但其架构设计使得平台独立性易于实现。
使用方法
使用该数据集时,用户可以通过Grafana实例访问公开的仪表盘,进行数据探索和价格趋势分析。未来,若能开发定制的前端界面,用户将能更直观地比较不同超市的商品价格,并根据历史数据预测未来的价格波动。此外,数据集还计划支持通过条形码扫描获取特定商品的价格历史,进一步提升用户体验。对于开发者而言,可以通过调整Docker容器版本和简单的部署命令,轻松更新和维护数据集的运行环境。
背景与挑战
背景概述
澳大利亚杂货价格数据库(Australian grocery price database)是一个开放的数据库,旨在追踪澳大利亚杂货价格的长期趋势,以帮助消费者做出明智的购买决策,并促使杂货店对价格上涨负责。该数据集由主要研究人员或机构创建,其核心研究问题集中在价格趋势的监测与分析上。通过从Woolworths和Coles等主要杂货店的网站上获取价格数据,并存储于InfluxDB时间序列数据库中,该数据集为消费者提供了宝贵的市场信息,对零售业的价格透明度产生了积极影响。
当前挑战
澳大利亚杂货价格数据库在构建过程中面临多项挑战。首先,数据来源的多样性和不一致性,如不同杂货店提供的产品信息格式差异,增加了数据清洗和标准化的难度。其次,产品名称的复杂性和重复性,如'40% Salt Reduced'和'Alva Baby Starry Sky Print Reusable Cloth Nappy',使得产品差异化的处理变得复杂。此外,尽管当前使用Grafana进行数据可视化,但定制前端的缺乏限制了用户体验的优化。未来,扩展到更多杂货店的数据源以及实现低成本、高效率的维护和更新,也是该数据集需要克服的重要挑战。
常用场景
经典使用场景
在澳大利亚的日常消费领域,Australian grocery price database数据集的经典使用场景主要集中在价格趋势分析和消费者决策支持上。通过收集和分析Woolworths和Coles等主要超市的商品价格数据,该数据集能够揭示商品价格的长期波动趋势,帮助消费者识别最佳购买时机,避免被虚假促销所误导。此外,数据集还支持跨超市的价格比较,使消费者能够做出更为经济的选择。
实际应用
在实际应用中,Australian grocery price database数据集被广泛用于消费者价格监控和市场分析工具的开发。例如,一些消费者应用程序利用该数据集提供实时价格比较和历史价格查询功能,帮助用户在购物时做出更明智的决策。此外,零售商和市场分析师也利用这些数据来优化库存管理和定价策略,从而提高市场竞争力。
衍生相关工作
基于Australian grocery price database数据集,已经衍生出多项相关研究和工作。例如,一些研究团队开发了基于机器学习的预测模型,用于预测未来商品价格的波动趋势。此外,该数据集还启发了类似项目,如德国的Heisse Preise,这些项目在全球范围内推广了价格透明化的理念。学术界和工业界的多项研究也基于此数据集展开,进一步推动了价格分析和消费者行为研究的发展。
以上内容由遇见数据集搜集并总结生成



