five

cannlytics/cannabis_analytes

收藏
Hugging Face2023-10-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cannlytics/cannabis_analytes
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了大麻中常见分析物的数据,涵盖了多种测试类型,如大麻素、萜烯、农药等。数据集被划分为多个子集,每个子集对应不同类型的测试。数据集中包含每个分析物的唯一ID、描述、名称、科学名称、类型、维基百科链接、降解产物、前体物质、子类型、CAS编号、化学式、摩尔质量、密度、沸点、图像链接和化学式图像链接等信息。数据集的使用方法、数据字段、数据分割、数据收集和标准化过程、已知限制、数据集策展人、许可证和贡献者等信息也在README中进行了详细说明。
提供机构:
cannlytics
原始信息汇总

大麻分析物数据集

数据集概述

该数据集包含用于大麻中常规测试的各种分析物的数据。数据集分为多个子数据集,每个子数据集对应一种测试类型,以及包含所有分析物的子数据集。

数据集结构

数据集被划分为18个子集,每个州一个子集,以及一个综合子集。

代码 状态
全部 all
大麻素 cannabinoids
萜烯 terpenes
农药 pesticides ⏳ 即将推出
微生物 microbes ⏳ 即将推出
重金属 heavy_metals ⏳ 即将推出
残留溶剂 residual_solvents ⏳ 即将推出
其他 other ⏳ 即将推出

数据字段

以下是用于标准化各种数据的字段列表,您可能会在每个观测值中找到以下字段:

字段 示例 描述
key "thca" 每个分析物的唯一ID。
description "Δ-9-四氢大麻酚是一种大麻素..." 分析物的简要描述或摘要。
name "THC" 分析物的通用名称。
scientific_name "Δ-9-四氢大麻酚" 分析物的科学名称或IUPAC名称。
type "cannabinoid" 分析物的类型或分类(例如,萜烯、大麻素)。
wikipedia_url "https://en.wikipedia.org/wiki/Tetrahydrocannabinol" 有关分析物的详细信息的Wikipedia URL。
degrades_to ["cannabinol"] 分析物降解成的化学物质或物质列表。
precursors ["thca"] 与分析物相关的先驱化学物质或物质列表。
subtype "psychoactive" 分析物类型的子分类或附加详细信息。
cas_number "1972-08-3" 化学文摘服务(CAS)注册号,是化学物质的唯一标识符。
chemical_formula "C21H30O2" 分析物的化学式。
molar_mass "314.5 g/mol" 分析物的摩尔质量。
density "1.0±0.1 g/cm3" 分析物的密度。
boiling_point "383.5±42.0 °C" 分析物的沸点。
image_url "https://example.com/image.jpg" 代表分析物的图像URL。
chemical_formula_image_url "https://example.com/formula_image.jpg" 代表分析物化学式的图像URL。

数据分割

数据按分析类型分割成子集。您可以通过请求all子集来检索所有分析物。

数据集理由

该数据集为大麻测试提供了一套标准的分析物数据。

数据收集和标准化

使用get_cannabis_analytes.py程序来标准化从Wikipedia收集的值。

已知限制

数据集不完整,可能包含不准确的信息。

数据集许可证

该数据集的文件根据知识共享署名4.0国际许可协议进行许可。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作