alxfgh/PubChem10M_SELFIES_Tokenized
收藏Hugging Face2023-04-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alxfgh/PubChem10M_SELFIES_Tokenized
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为PubChem10M_Selfies_Tokenized,是一个基于PubChem10M数据集的自定义cl100k标记化版本。数据集大小在1M到10M之间,涉及化学、分子、selfies和smiles等标签。
提供机构:
alxfgh
原始信息汇总
数据集概述
数据集名称
- 名称: PubChem10M_Selfies_Tokenized
数据集大小
- 大小范围: 1M<n<10M
数据来源
- 来源: PubChem10M
标签
- 标签:
- chemistry
- molecules
- selfies
- smiles
数据处理
- 处理方式: Custom cl100k tokenized version of PubChem10M_SELFIES



