Starbucks Nutritional dataset|食品营养数据集|星巴克数据集
收藏Starbucks Nutritional Dataset Overview
Dataset Description
- Source: Official Starbucks Nutritional dataset derived from the 22-page pdf titled Starbucks Coffee Company Beverage Nutrition Information.
- Modifications: Omitted data on steamed milk.
Data Structure
Columns
- Product_Name: Name of the item.
- Size: Size of the cup (short, tall, grande, venti).
- Milk: Type of milk used (none, nonfat, 2%, soy, coconut, whole).
- Whip: Presence of whip cream (none, whip).
- Serving_Size_mL: Quantity of beverage in mL, varying by cup size.
- Calories: Total calories for the beverage.
- Total_Fat_g: Total fat in grams.
- Saturated_Fat_g: Saturated fat in grams.
- Trans_Fat_g: Trans fat in grams.
- Cholesterol_mg: Amount of cholesterol in milligrams.
- Sodium_mg: Sodium content in milligrams.
- Total_Carbs_g: Total carbohydrates in grams.
- Fibre_g: Fibre content in grams.
- Sugar_g: Amount of sugar in grams.
- Caffeine_mg: Amount of caffeine in milligrams (for tea beverages, the highest value from a range is recorded).
Omitted Columns
- Protein_g
- Vitamin_A
- Calcium
- Iron

中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
CosyVoice 2
CosyVoice 2是由阿里巴巴集团开发的多语言语音合成数据集,旨在通过大规模多语言数据集训练,实现高质量的流式语音合成。数据集通过有限标量量化技术改进语音令牌的利用率,并结合预训练的大型语言模型作为骨干,支持流式和非流式合成。数据集的创建过程包括文本令牌化、监督语义语音令牌化、统一文本-语音语言模型和块感知流匹配模型等步骤。该数据集主要应用于语音合成领域,旨在解决高延迟和低自然度的问题,提供接近人类水平的语音合成质量。
arXiv 收录
Breast Ultrasound Images (BUSI)
小型(约500×500像素)超声图像,适用于良性和恶性病变的分类和分割任务。
github 收录
UAVDT
UAVDT数据集由中国科学院大学等机构创建,包含约80,000帧从10小时无人机拍摄视频中精选的图像,覆盖多种复杂城市环境。数据集主要关注车辆目标,每帧均标注了边界框及多达14种属性,如天气条件、飞行高度、相机视角等。该数据集旨在推动无人机视觉技术在不受限制场景下的研究,解决高密度、小目标、相机运动等挑战,适用于物体检测、单目标跟踪和多目标跟踪等基础视觉任务。
arXiv 收录
ChemBL
ChemBL是一个化学信息学数据库,包含大量生物活性数据,涵盖了药物发现和开发过程中的各种化学实体。数据集包括化合物的结构信息、生物活性数据、靶点信息等。
www.ebi.ac.uk 收录