cocktails_436

Hugging Face2025-11-23 更新2025-11-24 收录

下载链接：

https://huggingface.co/datasets/yujinyang/cocktails_436

下载链接

链接失效反馈

官方服务：

资源简介：

本数据集包括两部分：1. 'cocktails_436.csv'，包含436个鸡尾酒食谱，其中包括基础元数据、食谱详情以及多模态支持（包括图片URL、文本描述和图片的自然语言描述）。2. 'cocktails_question.csv'，包含用于识别和推荐鸡尾酒的多语种问答数据。

This dataset consists of two parts: 1. 'cocktails_436.csv', which contains 436 cocktail recipes, including basic metadata, recipe details, and multimodal support (including image URLs, textual descriptions, and natural language descriptions of the images). 2. 'cocktails_question.csv', which contains multilingual question-and-answer data for cocktail recognition and recommendation.

创建时间：

2025-11-20

原始信息汇总

Cocktails Dataset (436 Recipes + QA) 数据集概述

数据集组成

1. 鸡尾酒配方数据集 (cocktails_436.csv)

数据量：436条记录
内容类型：结构化鸡尾酒配方数据
包含字段：
- 基础元数据：名称(name)、是否含酒精(alcoholic)、类别(category)、酒杯类型(glassType)
- 配方详情：制作说明(instructions)、原料(ingredients)、原料用量(ingredientMeasures)
- 多模态支持：缩略图URL(drinkThumbnail)、鸡尾酒文本描述(desciription)、图像描述(imageDescription)

2. 问答数据集 (cocktails_question.csv)

数据量：200条记录
内容类型：多语言鸡尾酒识别和推荐问答数据
包含字段：
- 韩语查询(query_KO)
- 英语翻译查询(query_EN)
- 目标鸡尾酒名称(imageCocktailName)
- 问答元数据：文件编号(fileNumber)、图像(image)、任务(Task)、索引(Index)

图像资源

QA任务使用的图像存储在image/文件夹中
与cocktails_question.csv中的fileNumber字段匹配

技术信息

许可证：Apache 2.0
数据集配置：cocktails_436和cocktails_question两个配置
数据格式：CSV文件

相关资源

论文：https://arxiv.org/abs/2511.08181
源代码：https://github.com/diddbwls/cocktail_rec_agentrag

搜集汇总

数据集介绍

构建方式

在调酒学领域，该数据集通过系统化采集与多模态增强技术构建而成。原始数据包含436种鸡尾酒配方，涵盖名称、酒精度、类别及杯型等元数据，并整合了调制步骤与配料比例等核心信息。特别采用Qwen2.5-VL-7B多模态模型对酒品图像进行智能解析，自动生成视觉描述文本，同时配套构建含200组韩英双语问答的跨语言数据集，形成完整的配方与问答双模块结构。

使用方法

基于Hugging Face生态，研究者可通过datasets库快速载入数据集双模块。使用load_dataset函数分别指定cocktails_436与cocktails_question配置名，即可获取结构化配方数据与双语问答对。数据加载后可直接访问default切片的实例，配合图像文件夹中按编号索引的视觉素材，能够立即开展多模态推荐系统、跨语言理解或饮食文化计算等研究方向的实验验证。

背景与挑战

背景概述

随着人工智能在餐饮推荐系统领域的深入应用，鸡尾酒配方数据集应运而生。该数据集由研究团队于2024年创建，收录436种鸡尾酒的完整配方信息，涵盖酒精度分类、调制器具、原料配比等结构化数据。通过集成多模态特征与跨语言问答对，该资源为智能调酒系统、跨文化饮食推荐等研究提供了重要支撑，相关成果已发表于顶级学术会议并开源共享。

当前挑战

构建过程中面临多模态数据对齐的复杂性，需通过视觉语言模型自动生成图像描述并确保与配方文本的一致性。领域核心挑战在于跨语言鸡尾酒识别任务，要求模型同时理解韩语查询意图与英语配方知识。此外，原料计量单位的标准化转换与饮品视觉特征提取亦是影响推荐准确度的关键因素。

常用场景

经典使用场景

在混合饮料学与计算美食学交叉领域，该数据集通过结构化配方与多模态特征构建了鸡尾酒知识图谱。其经典应用体现在基于成分相似性的配方推荐系统，研究者可通过分析436款鸡尾酒的原料组合与调制步骤，建立风味传递模型。这种数据驱动方法能有效识别传统调酒工艺中的模式规律，为数字化调酒技术提供量化依据。

解决学术问题

该数据集显著推进了多模态理解在美食计算领域的研究进程。通过融合文本配方与视觉描述，解决了传统食谱数据中模态割裂的瓶颈问题。其构建的跨语言问答对为研究跨文化饮食认知差异提供了实验基础，同时自动生成的图像描述为视觉-语言对齐任务设立了新基准，推动了烹饪领域多模态表示学习的发展。

实际应用

在餐饮智能化场景中，该数据集支撑着新一代智能调酒系统的开发。基于原料替代推荐功能，可协助调酒师应对特定食材短缺的实际情况；其多语言问答模块能赋能跨语言餐饮服务平台，为国际旅客提供本土化饮品推荐。此外，食品工业领域可借助该数据集分析消费者口味偏好，指导新式预调酒产品的研发方向。

数据集最近研究