five

iba_dataset_json|鸡尾酒数据集|酒精成分分析数据集

收藏
github2020-07-20 更新2024-05-31 收录
鸡尾酒
酒精成分分析
下载链接:
https://github.com/lmc2179/iba_dataset_json
下载链接
链接失效反馈
资源简介:
一个从国际调酒师协会网站上抓取并清洗的数据集,包含每个鸡尾酒的JSON条目。目前包含两个文件:recipes.json - 一个JSON关联数组列表,每个数组代表一个鸡尾酒的配方,所有测量单位为厘升;ingredients_strength.json - 一个补充文件,将每个成分映射到一个表示其酒精体积百分比的小数。

A dataset scraped and cleaned from the International Bartenders Association website, containing JSON entries for each cocktail. It currently includes two files: recipes.json - a list of JSON associative arrays, each representing a cocktail recipe with all measurements in centiliters; ingredients_strength.json - a supplementary file mapping each ingredient to a decimal representing its alcohol by volume percentage.
创建时间:
2015-08-25
原始信息汇总

iba_dataset_json 数据集概述

数据集内容

  • recipes.json:包含一系列JSON关联数组,每个数组代表一种鸡尾酒的配方。所有测量单位为厘升。示例数据包括鸡尾酒名称、成分及其数量、鸡尾酒类型。
  • ingredients_strength.json:补充文件,将每种成分映射到一个表示其酒精体积百分比(ABV)的小数。

数据集结构

  • recipes.json 结构示例:

    { "name": "RUSTY NAIL", "ingredients": [ { "name": "scotch whisky", "quantity": 4.5 }, { "name": "drambuie", "quantity": 2.5 } ], "type": "After Dinner Cocktail" }

  • ingredients_strength.json 结构未提供具体示例,但描述为将成分与其ABV值关联。

AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过从国际调酒师协会(International Bartenders Association)网站抓取并清洗数据构建而成,主要包含鸡尾酒配方的JSON条目。数据集由两个文件组成:recipes.json和ingredients_strength.json。recipes.json文件以JSON关联数组的形式存储了每款鸡尾酒的配方,所有计量单位均以厘升(centilitres)表示;ingredients_strength.json则作为补充文件,将每种原料与其酒精含量(ABV)进行映射。
特点
该数据集的特点在于其结构化的JSON格式,便于程序化处理与分析。recipes.json文件详细记录了每款鸡尾酒的名称、原料及其用量,并分类标注了鸡尾酒的类型,如餐后鸡尾酒等。ingredients_strength.json文件则提供了原料的酒精含量信息,为研究鸡尾酒的酒精浓度提供了重要参考。数据的标准化和完整性使其成为调酒研究、配方分析及酒精含量计算的理想资源。
使用方法
该数据集的使用方法灵活多样,适用于多种场景。研究人员可通过解析recipes.json文件,提取鸡尾酒配方信息,进行配方相似性分析或鸡尾酒分类研究。结合ingredients_strength.json文件,用户可计算鸡尾酒的总酒精含量,评估其酒精度。开发者还可利用该数据集构建鸡尾酒推荐系统或配方生成工具,为调酒爱好者提供个性化服务。数据集的JSON格式使其易于集成到各类应用程序中,支持进一步的数据挖掘与创新应用。
背景与挑战
背景概述
iba_dataset_json数据集由国际调酒师协会(International Bartenders Association, IBA)网站上的信息整理而成,主要包含鸡尾酒配方的JSON格式数据。该数据集由匿名研究人员或团队于近年创建,旨在为调酒师、鸡尾酒爱好者以及相关研究人员提供一个结构化的鸡尾酒配方数据库。数据集的核心研究问题在于如何通过标准化的数据格式,促进鸡尾酒配方的共享与研究,同时为调酒领域的自动化工具开发提供支持。该数据集的出现对调酒文化的传播、调酒技术的标准化以及相关算法的开发具有重要意义。
当前挑战
iba_dataset_json数据集在解决鸡尾酒配方标准化问题的同时,也面临若干挑战。首先,鸡尾酒配方涉及多种原料及其用量,如何确保数据的准确性与完整性是一个关键问题。其次,数据集中的酒精含量信息(ABV)依赖于外部补充文件,可能存在数据不一致或缺失的情况。此外,鸡尾酒分类的多样性与复杂性也对数据集的构建提出了更高的要求,例如如何准确划分鸡尾酒的类型(如餐后鸡尾酒、餐前鸡尾酒等)。这些挑战不仅影响数据集的实用性,也为后续的研究与应用带来了不确定性。
常用场景
经典使用场景
在调酒学和饮料配方研究中,iba_dataset_json数据集为研究人员提供了一个标准化的鸡尾酒配方数据库。通过该数据集,研究者可以分析不同鸡尾酒的成分比例、酒精含量及其分类,进而探索调酒艺术中的科学规律。
解决学术问题
该数据集解决了调酒学研究中配方数据分散、格式不统一的问题。通过提供结构化的JSON格式数据,研究者可以更高效地进行数据分析和模型训练,从而推动调酒配方的优化和创新。
衍生相关工作
基于iba_dataset_json数据集,许多经典工作得以衍生,例如基于机器学习的鸡尾酒配方生成模型和饮料分类算法。这些研究不仅丰富了调酒学的理论体系,还为饮料行业的智能化发展提供了技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

HIT-UAV

HIT-UAV数据集包含2898张红外热成像图像,这些图像从43,470帧无人机拍摄的画面中提取。数据集涵盖了多种场景,如学校、停车场、道路和游乐场,在不同的光照条件下,包括白天和夜晚。

github 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录