five

CompreHensive European Food Safety (CHEFS) database

收藏
arXiv2025-07-18 更新2025-08-15 收录
下载链接:
https://github.com/WFSRDataScience/CHEFS
下载链接
链接失效反馈
官方服务:
资源简介:
CHEFS数据库是一个综合的欧洲食品安全监测数据集,它汇集了来自欧洲食品安全局(EFSA)的监测数据,包括农药残留、兽药残留和化学污染物的数据。该数据集包含了超过1520万个样本的3920万个分析结果,覆盖了4000多种不同的食品产品。数据集的创建旨在解决现有EFSA数据分散且难以分析的问题,通过整合和结构化数据,使其更易于访问和分析。CHEFS数据库不仅可以作为食品安全监测数据的集中来源,还可以作为指导食品安全政策、研究和监管的战略工具。

The CHEFS database is a comprehensive European food safety monitoring dataset. It aggregates monitoring data from the European Food Safety Authority (EFSA), including data on pesticide residues, veterinary drug residues, and chemical contaminants. This dataset contains 39.2 million analytical results from over 15.2 million samples, covering more than 4,000 different food products. The dataset was developed to address the issue of scattered and poorly analyzable existing EFSA data, by integrating and structuring the data to make it more accessible and analyzable. The CHEFS database can not only serve as a centralized source for food safety monitoring data, but also act as a strategic tool to guide food safety policy-making, research, and regulation.
提供机构:
瓦赫宁根食品安全研究, 瓦赫宁根, 荷兰
创建时间:
2025-07-18
搜集汇总
数据集介绍
main_image_url
构建方式
CHEFS数据库的构建基于欧洲食品安全局(EFSA)在Zenodo平台上发布的官方监测数据,涵盖了2000至2024年间来自35个欧洲国家的39200万条分析结果。研究团队通过自动化脚本下载并整合了分散在约1000个CSV文件中的原始数据,这些文件按成员国、年份和危害类别分类。数据处理包括格式标准化、唯一标识符识别、缺失值处理以及重复数据删除。针对农药残留、化学污染物和兽药残留三大危害类别,团队开发了专门的数据处理流程,并构建了PostgreSQL关系型数据库,采用"核心-辅助"表结构设计以优化稀疏数据存储。数据库通过链接EFSA的标准参考目录(如SSD2)实现了元数据标准化,并经过严格验证确保数据完整性。
特点
CHEFS数据库作为目前最全面的欧洲食品安全监测数据集,其核心价值体现在三个方面:时空维度上,覆盖了25年跨度的纵向监测数据,并包含235个原产国的地理信息;内容广度上,整合了4035种食品产品和4170种污染物检测结果,其中包含3180种独特污染物标识;数据结构上,采用关系型数据库设计,支持复杂查询与分析。特别值得注意的是,该数据集揭示了不同危害类别的监测特征差异:化学污染物的平均每样本检测次数为4.8次,农药残留达34.9次,而兽药残留为14.8次。数据集还完整保留了采样策略元数据(随机采样占53.1%,风险导向采样占23.4%),为研究监测策略有效性提供了独特视角。
使用方法
使用CHEFS数据库需通过PostgreSQL接口进行查询,研究团队提供了Python自动化脚本简化数据提取流程。典型应用场景包括三类分析:时间趋势分析可通过按年份、危害类别分组统计检测结果数量及其超标率;污染物-食品关联分析可利用预构建的食品分类体系(如将4035种产品ID归类为23个逻辑组)研究特定污染物的高风险载体;国家差异分析则结合原产国和采样国信息评估区域风险分布。对于高级应用,建议先提取预定义的数据子集(如特定国家/年份组合),再结合EFSA的参数本体进行语义分析。所有分析需注意采样策略的异质性可能带来的偏差,对于贸易流分析建议排除"未知"原产国的样本。
背景与挑战
背景概述
CompreHensive European Food Safety (CHEFS) database是由荷兰瓦赫宁根食品安全研究中心(Wageningen Food Safety Research)联合欧洲多国研究机构共同构建的大型食品安全监测数据库,发布于2025年。该数据库整合了欧洲食品安全局(EFSA)自2000年至2024年间来自35个欧洲国家的39200万条检测数据,覆盖4000余种食品中的农药残留、兽药残留及化学污染物监测结果。作为首个标准化整合EFSA分散数据的资源,CHEFS通过统一异构数据格式(如SSD2标准)和构建关系型数据库,解决了原始数据分散于近千个文件(总量超400GB)导致的访问与分析难题,为人工智能驱动的食品安全趋势预测、危害早期预警系统开发提供了基础设施支撑。其核心研究问题聚焦于通过跨时空数据分析揭示欧洲食品安全监测动态,支撑欧盟食品安全政策的科学决策。
当前挑战
CHEFS数据库面临双重挑战:在领域问题层面,需解决多类型污染物(如重金属、霉菌毒素)在复杂食品供应链中的动态风险评估难题,尤其需提升对非合规样本(仅占0.025%)的预测灵敏度;在构建过程中,需克服原始数据的高度异构性——包括跨年度术语差异(如FoodEx与FoodEx2分类体系切换)、样本元数据缺失(如18%样本缺少原产国信息),以及不同成员国检测策略差异(风险抽样占比23.4% vs 随机抽样53.1%)导致的数据可比性问题。此外,数据库需持续应对EFSA数据模型更新与新兴污染物监测需求的扩展性挑战。
常用场景
经典使用场景
CHEFS数据库作为欧洲食品安全监测数据的统一资源,广泛应用于食品安全趋势分析、风险评估和政策制定。研究人员利用该数据库追踪农药残留、兽药残留和化学污染物在食品中的分布情况,识别高风险食品和污染物组合。例如,通过分析2000-2024年的数据,揭示了重金属(如铅、镉)和霉菌毒素(如黄曲霉毒素B1)在动物肉类和坚果中的污染趋势,为针对性监测提供科学依据。
衍生相关工作
基于CHEFS数据的经典研究包括:Liu等(2021)构建塞尔维亚玉米霉菌预测模型,Tarazona等(2022)将氯吡啶监测数据与人体生物监测关联评估暴露风险,Wang等(2023)采用贝叶斯网络优化二恶英监测方案。数据库还催生了欧盟HOLiFOOD等项目,开发AI驱动的食品安全早期预警系统。
数据集最近研究
最新研究方向
近年来,CompreHensive European Food Safety (CHEFS) 数据库在食品安全监测领域的研究方向主要集中在以下几个方面:首先,利用人工智能技术分析食品污染物趋势,预测潜在危害,并支持早期预警系统的开发。其次,通过整合欧洲食品安全局(EFSA)的监测数据,CHEFS数据库为研究人员提供了一个统一且结构化的数据集,便于进行跨年份、跨国家和跨食品类别的趋势分析。此外,该数据库还被用于探索不同国家的监测模式和结果差异,以及识别食品和污染物之间的关联。这些研究不仅为食品安全政策制定提供了科学依据,还为全球食品安全监测系统的优化和预测模型的开发提供了重要支持。
相关研究论文
  • 1
    Food safety trends across Europe: insights from the 392-million-entry CompreHensive European Food Safety (CHEFS) database瓦赫宁根食品安全研究, 瓦赫宁根, 荷兰 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作