cannlytics/cannabis_analytes
收藏Hugging Face2023-10-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cannlytics/cannabis_analytes
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了大麻中常见分析物的数据,涵盖了多种测试类型,如大麻素、萜烯、农药等。数据集被划分为多个子集,每个子集对应不同类型的测试。数据集中包含每个分析物的唯一ID、描述、名称、科学名称、类型、维基百科链接、降解产物、前体物质、子类型、CAS编号、化学式、摩尔质量、密度、沸点、图像链接和化学式图像链接等信息。数据集的使用方法、数据字段、数据分割、数据收集和标准化过程、已知限制、数据集策展人、许可证和贡献者等信息也在README中进行了详细说明。
提供机构:
cannlytics
原始信息汇总
大麻分析物数据集
数据集概述
该数据集包含用于大麻中常规测试的各种分析物的数据。数据集分为多个子数据集,每个子数据集对应一种测试类型,以及包含所有分析物的子数据集。
数据集结构
数据集被划分为18个子集,每个州一个子集,以及一个综合子集。
| 州 | 代码 | 状态 |
|---|---|---|
| 全部 | all |
✅ |
| 大麻素 | cannabinoids |
✅ |
| 萜烯 | terpenes |
✅ |
| 农药 | pesticides |
⏳ 即将推出 |
| 微生物 | microbes |
⏳ 即将推出 |
| 重金属 | heavy_metals |
⏳ 即将推出 |
| 残留溶剂 | residual_solvents |
⏳ 即将推出 |
| 其他 | other |
⏳ 即将推出 |
数据字段
以下是用于标准化各种数据的字段列表,您可能会在每个观测值中找到以下字段:
| 字段 | 示例 | 描述 |
|---|---|---|
key |
"thca" |
每个分析物的唯一ID。 |
description |
"Δ-9-四氢大麻酚是一种大麻素..." |
分析物的简要描述或摘要。 |
name |
"THC" |
分析物的通用名称。 |
scientific_name |
"Δ-9-四氢大麻酚" |
分析物的科学名称或IUPAC名称。 |
type |
"cannabinoid" |
分析物的类型或分类(例如,萜烯、大麻素)。 |
wikipedia_url |
"https://en.wikipedia.org/wiki/Tetrahydrocannabinol" |
有关分析物的详细信息的Wikipedia URL。 |
degrades_to |
["cannabinol"] |
分析物降解成的化学物质或物质列表。 |
precursors |
["thca"] |
与分析物相关的先驱化学物质或物质列表。 |
subtype |
"psychoactive" |
分析物类型的子分类或附加详细信息。 |
cas_number |
"1972-08-3" |
化学文摘服务(CAS)注册号,是化学物质的唯一标识符。 |
chemical_formula |
"C21H30O2" |
分析物的化学式。 |
molar_mass |
"314.5 g/mol" |
分析物的摩尔质量。 |
density |
"1.0±0.1 g/cm3" |
分析物的密度。 |
boiling_point |
"383.5±42.0 °C" |
分析物的沸点。 |
image_url |
"https://example.com/image.jpg" |
代表分析物的图像URL。 |
chemical_formula_image_url |
"https://example.com/formula_image.jpg" |
代表分析物化学式的图像URL。 |
数据分割
数据按分析类型分割成子集。您可以通过请求all子集来检索所有分析物。
数据集理由
该数据集为大麻测试提供了一套标准的分析物数据。
数据收集和标准化
使用get_cannabis_analytes.py程序来标准化从Wikipedia收集的值。
已知限制
数据集不完整,可能包含不准确的信息。
数据集许可证
该数据集的文件根据知识共享署名4.0国际许可协议进行许可。



