five

中国化妆品用植物原料成分生物信息数据

收藏
广东省数据知识产权存证登记平台2026-04-29 更新2026-05-11 收录
下载链接:
https://data.gpic.gd.cn/dataStorage/credentialInfo.jhtml?no=20260444000002405
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集为植物天然产物成分与生物靶点关联数据库,旨在系统化收录化学成分与蛋白质靶点之间的调控关系及置信度评估,为天然产物活性筛选与药物靶点发现提供结构化数据支撑。数据集以矩阵宽表形式存储,行对应成分英文名称,列对应靶点名称,交叉单元格数值为综合文献证据计算得出的关联置信度得分,取值范围0.00至100.00。数据采集基于国内外公开发表的学术文献,利用SciSpacy生物医学NLP模型识别摘要中的蛋白质实体,经预定义映射表标准化,基于正则表达式匹配调控关键词并过滤否定句,统计句子级调控频次。置信度得分综合证据质量权重、数量效应非线性奖励、方向一致性及混合惩罚、对数调节项计算得出。全部处理步骤固化于自动化脚本,确保可重复追溯。本数据集可为天然产物活性筛选、药物靶点发现等应用场景提供数据参考。
提供机构:
佛山市康伲爱伦生物技术有限公司
创建时间:
2026-04-29
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个植物天然产物成分与生物靶点关联的置信度矩阵,系统收录了化学成分与蛋白质靶点之间的调控关系及证据强度。数据基于学术文献,利用自然语言处理技术提取和标准化成分-靶点关联,并以矩阵宽表形式存储,单元格数值(-100至+100)表示调控方向与置信度。该数据集主要用于化妆品行业的功效原料智能筛选、产品功效科学论证、配方协同增效设计以及市场趋势研判,为化妆品原料开发提供结构化、可量化的数据支撑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作