five

Firstbloom Data

收藏
github2023-12-23 更新2024-05-31 收录
下载链接:
https://github.com/alexcaza/firstbloom-data
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个在Firstbloom运营期间建立的咖啡数据集合,包含有关咖啡烘焙商拥有的咖啡种类、咖啡包含的品种、咖啡的品尝笔记以及它们在世界上的来源地的CSV文件。自2021年1月应用正式关闭以来,这些数据已被用于个人项目和一本书中,是目前已知的最大的消费者特色咖啡数据集。

This is a coffee dataset established during the operation of Firstbloom, containing CSV files about the types of coffee owned by coffee roasters, the varieties included in the coffee, tasting notes of the coffee, and their origins around the world. Since the official closure of the application in January 2021, these data have been used in personal projects and a book, and it is currently known as the largest consumer specialty coffee dataset.
创建时间:
2023-12-21
原始信息汇总

Firstbloom Data 数据集概述

数据集内容

  • 数据类型: 包含CSV格式的数据文件。
  • 数据内容: 涉及咖啡烘焙商拥有的咖啡种类、咖啡包含的品种、咖啡的品鉴笔记以及咖啡的全球来源地。

数据集来源

  • 来源: 该数据集是在Firstbloom应用运营期间收集的。
  • 应用历史: Firstbloom于2017年底启动,旨在为特色咖啡爱好者提供一个咖啡评价平台,类似于Vivino和Untappd,但专注于咖啡。该应用于2018年初上线,至2021年1月正式关闭。

数据集使用

  • 使用许可: 数据集根据CC BY 4.0许可开放源代码,允许自由使用,但需适当引用原作者。
  • 使用案例: 数据已被用于《The Physics of Filter Coffee》一书,并被认为是目前最大的消费者特色咖啡数据集。

贡献者

  • 主要贡献者:
    • Stefanie Viens (联合创始人)
    • Vithu Namasivayam (联合创始人)
    • Sami Jaber (技术志愿者/用户)
    • Sean Winikoff (数据收集志愿者/用户)
    • Max Roderbourg (数据收集志愿者/用户)

数据集许可

  • 许可详情: 根据CC BY 4.0许可,使用时需注明原作者Alex Caza。
搜集汇总
数据集介绍
main_image_url
构建方式
Firstbloom Data数据集的构建源于Firstbloom应用在运营期间收集的咖啡相关数据。该数据集包含了咖啡烘焙商所拥有的咖啡种类、咖啡品种、品鉴笔记以及咖啡的全球来源地等关键信息。这些数据通过用户在应用中的互动和反馈逐步积累,最终形成了这一独特的咖啡数据资源。
特点
Firstbloom Data数据集的显著特点在于其涵盖了丰富的咖啡相关信息,包括咖啡的品种、品鉴笔记和来源地,使其成为消费者级专业咖啡数据集中的佼佼者。此外,该数据集的开放性和可访问性,以及其基于CC BY 4.0的许可协议,使得研究者和爱好者能够自由使用和分享这些数据,从而推动咖啡文化的进一步发展。
使用方法
使用Firstbloom Data数据集时,用户可以通过下载CSV文件来访问和分析数据。该数据集适用于多种用途,如咖啡品鉴研究、咖啡文化传播以及咖啡市场的分析等。使用者需遵守CC BY 4.0许可协议,确保在项目中适当提及数据来源,以尊重原始数据收集者的贡献。
背景与挑战
背景概述
Firstbloom Data数据集是由Alex Caza及其团队在Firstbloom应用运营期间收集的咖啡相关数据集合。该数据集创建于2017年末,旨在为咖啡爱好者提供一个平台,让他们能够对所饮用的咖啡进行评价,类似于Vivino和Untappd在葡萄酒和啤酒领域的应用。尽管Firstbloom应用在2021年1月正式关闭,但其收集的数据集已成为消费者级特种咖啡领域中最大的数据集之一,并已被用于Jonathan Gagné的《The Physics of Filter Coffee》一书中。该数据集的核心研究问题围绕咖啡的品种、风味、来源地等关键信息,对咖啡科学研究和市场分析具有重要影响。
当前挑战
Firstbloom Data数据集在构建过程中面临的主要挑战包括数据收集的复杂性和数据质量的保证。由于咖啡的品种、风味和来源地等信息需要精确记录,数据收集过程需要高度的专业知识和细致的操作。此外,数据集的规模和多样性也带来了数据管理和分析的挑战,特别是在处理大量用户生成的内容时,确保数据的准确性和一致性是一个重要问题。尽管如此,该数据集的开放性和广泛应用潜力为咖啡行业的进一步研究和发展提供了宝贵的资源。
常用场景
经典使用场景
Firstbloom Data数据集的经典使用场景主要集中在咖啡行业的分析与研究领域。该数据集包含了咖啡豆的品种、产地、风味特征以及消费者的品鉴笔记,为研究人员提供了丰富的信息资源。通过分析这些数据,研究者可以深入探讨不同咖啡品种的风味差异、产地对咖啡品质的影响,以及消费者对不同咖啡的偏好,从而为咖啡产业链的优化提供科学依据。
实际应用
在实际应用中,Firstbloom Data数据集被广泛用于咖啡行业的多个领域。例如,咖啡生产商可以利用该数据集优化咖啡豆的种植和加工流程,以提升咖啡的品质和市场竞争力。咖啡零售商则可以通过分析消费者偏好,调整产品线,满足市场需求。此外,该数据集还被用于开发咖啡风味预测模型,帮助咖啡爱好者选择符合个人口味偏好的咖啡产品。
衍生相关工作
Firstbloom Data数据集的开放激发了众多相关研究工作。例如,Jonathan Gagné在其著作《The Physics of Filter Coffee》中使用了该数据集,深入探讨了咖啡的物理特性与风味之间的关系。此外,该数据集还启发了多个机器学习项目,用于预测咖啡的风味特征和消费者偏好。这些衍生工作不仅丰富了咖啡科学的研究内容,也为咖啡行业的技术创新提供了新的思路。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作