product-database|食品数据数据集|营养分析数据集
收藏Open Food Facts Product Database
概述
- 名称: Open Food Facts Product Database
- 语言:
- 英语 (en)
- 法语 (fr)
- 德语 (de)
- 西班牙语 (es)
- 意大利语 (it)
- 荷兰语 (nl)
- 波兰语 (pl)
- 葡萄牙语 (pt)
- 瑞典语 (sv)
- 保加利亚语 (bg)
- 罗马尼亚语 (ro)
- 芬兰语 (fi)
- 俄语 (ru)
- 挪威语 (nb)
- 捷克语 (cs)
- 泰语 (th)
- 丹麦语 (da)
- 克罗地亚语 (hr)
- 匈牙利语 (hu)
- 阿拉伯语 (ar)
- 希腊语 (el)
- 日语 (ja)
- 加泰罗尼亚语 (ca)
- 塞尔维亚语 (sr)
- 斯洛文尼亚语 (sl)
- 斯洛伐克语 (sk)
- 土耳其语 (tr)
- 立陶宛语 (lt)
- 中文 (zh)
- 爱沙尼亚语 (et)
- 拉脱维亚语 (lv)
- 未知语言 (xx)
- 乌克兰语 (uk)
- 印度尼西亚语 (id)
- 希伯来语 (he)
- 越南语 (vi)
- 冰岛语 (is)
- 拉丁语 (la)
- 印度语 (in)
- 韩语 (ko)
- 阿尔巴尼亚语 (sq)
- 希伯来语 (iw)
- 格鲁吉亚语 (ka)
- 马来语 (ms)
- 波斯尼亚语 (bs)
- 波斯语 (fa)
- 孟加拉语 (bn)
- 加利西亚语 (gl)
- 哈萨克语 (kk)
- 马其顿语 (mk)
- 挪威尼诺斯克语 (nn)
- 印地语 (hi)
- 阿法尔语 (aa)
- 乌兹别克语 (uz)
- 索马里语 (so)
- 南非荷兰语 (af)
- 巴斯克语 (eu)
- 许可证:
- AGPL-3.0
- ODbL
- 数据量: 1M<n<10M
数据集信息
- 配置名称: default
- 数据文件:
- 分割: main
- 路径: products.parquet
数据集描述
Open Food Facts 是一个包含食品产品成分、过敏原、营养成分以及产品标签上所有信息的食品数据库。该数据库由志愿者维护,包含来自150个国家的170多万种产品。
数据集格式
该数据集是从 Open Food Facts 组织每日提供的 JSONL 数据 转换为 Parquet 格式的清洁版本。
数据处理
原始 JSONL 数据通过 DuckDB 处理。
数据重用条件
Open Food Facts 数据库在开放数据库许可证下可用。数据库内容在数据库内容许可证下可用。产品图像在知识共享署名共享许可证下可用。
数据重用反馈
Open Food Facts 团队对数据的使用情况非常感兴趣,欢迎用户分享其数据重用情况。

中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录