iba_dataset_json
收藏github2020-07-20 更新2024-05-31 收录
下载链接:
https://github.com/lmc2179/iba_dataset_json
下载链接
链接失效反馈官方服务:
资源简介:
一个从国际调酒师协会网站上抓取并清洗的数据集,包含每个鸡尾酒的JSON条目。目前包含两个文件:recipes.json - 一个JSON关联数组列表,每个数组代表一个鸡尾酒的配方,所有测量单位为厘升;ingredients_strength.json - 一个补充文件,将每个成分映射到一个表示其酒精体积百分比的小数。
A dataset scraped and cleaned from the International Bartenders Association website, containing JSON entries for each cocktail. It currently includes two files: recipes.json - a list of JSON associative arrays, each representing a cocktail recipe with all measurements in centiliters; ingredients_strength.json - a supplementary file mapping each ingredient to a decimal representing its alcohol by volume percentage.
创建时间:
2015-08-25
原始信息汇总
iba_dataset_json 数据集概述
数据集内容
- recipes.json:包含一系列JSON关联数组,每个数组代表一种鸡尾酒的配方。所有测量单位为厘升。示例数据包括鸡尾酒名称、成分及其数量、鸡尾酒类型。
- ingredients_strength.json:补充文件,将每种成分映射到一个表示其酒精体积百分比(ABV)的小数。
数据集结构
-
recipes.json 结构示例:
{ "name": "RUSTY NAIL", "ingredients": [ { "name": "scotch whisky", "quantity": 4.5 }, { "name": "drambuie", "quantity": 2.5 } ], "type": "After Dinner Cocktail" }
-
ingredients_strength.json 结构未提供具体示例,但描述为将成分与其ABV值关联。
搜集汇总
数据集介绍

构建方式
该数据集通过从国际调酒师协会(International Bartenders Association)网站抓取并清洗数据构建而成,主要包含鸡尾酒配方的JSON条目。数据集由两个文件组成:recipes.json和ingredients_strength.json。recipes.json文件以JSON关联数组的形式存储了每款鸡尾酒的配方,所有计量单位均以厘升(centilitres)表示;ingredients_strength.json则作为补充文件,将每种原料与其酒精含量(ABV)进行映射。
特点
该数据集的特点在于其结构化的JSON格式,便于程序化处理与分析。recipes.json文件详细记录了每款鸡尾酒的名称、原料及其用量,并分类标注了鸡尾酒的类型,如餐后鸡尾酒等。ingredients_strength.json文件则提供了原料的酒精含量信息,为研究鸡尾酒的酒精浓度提供了重要参考。数据的标准化和完整性使其成为调酒研究、配方分析及酒精含量计算的理想资源。
使用方法
该数据集的使用方法灵活多样,适用于多种场景。研究人员可通过解析recipes.json文件,提取鸡尾酒配方信息,进行配方相似性分析或鸡尾酒分类研究。结合ingredients_strength.json文件,用户可计算鸡尾酒的总酒精含量,评估其酒精度。开发者还可利用该数据集构建鸡尾酒推荐系统或配方生成工具,为调酒爱好者提供个性化服务。数据集的JSON格式使其易于集成到各类应用程序中,支持进一步的数据挖掘与创新应用。
背景与挑战
背景概述
iba_dataset_json数据集由国际调酒师协会(International Bartenders Association, IBA)网站上的信息整理而成,主要包含鸡尾酒配方的JSON格式数据。该数据集由匿名研究人员或团队于近年创建,旨在为调酒师、鸡尾酒爱好者以及相关研究人员提供一个结构化的鸡尾酒配方数据库。数据集的核心研究问题在于如何通过标准化的数据格式,促进鸡尾酒配方的共享与研究,同时为调酒领域的自动化工具开发提供支持。该数据集的出现对调酒文化的传播、调酒技术的标准化以及相关算法的开发具有重要意义。
当前挑战
iba_dataset_json数据集在解决鸡尾酒配方标准化问题的同时,也面临若干挑战。首先,鸡尾酒配方涉及多种原料及其用量,如何确保数据的准确性与完整性是一个关键问题。其次,数据集中的酒精含量信息(ABV)依赖于外部补充文件,可能存在数据不一致或缺失的情况。此外,鸡尾酒分类的多样性与复杂性也对数据集的构建提出了更高的要求,例如如何准确划分鸡尾酒的类型(如餐后鸡尾酒、餐前鸡尾酒等)。这些挑战不仅影响数据集的实用性,也为后续的研究与应用带来了不确定性。
常用场景
经典使用场景
在调酒学和饮料配方研究中,iba_dataset_json数据集为研究人员提供了一个标准化的鸡尾酒配方数据库。通过该数据集,研究者可以分析不同鸡尾酒的成分比例、酒精含量及其分类,进而探索调酒艺术中的科学规律。
解决学术问题
该数据集解决了调酒学研究中配方数据分散、格式不统一的问题。通过提供结构化的JSON格式数据,研究者可以更高效地进行数据分析和模型训练,从而推动调酒配方的优化和创新。
衍生相关工作
基于iba_dataset_json数据集,许多经典工作得以衍生,例如基于机器学习的鸡尾酒配方生成模型和饮料分类算法。这些研究不仅丰富了调酒学的理论体系,还为饮料行业的智能化发展提供了技术支持。
以上内容由遇见数据集搜集并总结生成



