five

LLMcompe-Team-Watanabe/ChemData700K_preprocess

收藏
Hugging Face2025-08-08 更新2025-08-09 收录
下载链接:
https://hf-mirror.com/datasets/LLMcompe-Team-Watanabe/ChemData700K_preprocess
下载链接
链接失效反馈
官方服务:
资源简介:
ChemData700K预处理的化学数据集,它是AI4Chem/ChemData700K数据集的预处理版本。该数据集通过过滤掉对话部分和顶层指令的样本、格式化输出列、重命名输入和输出列以及移除其他列进行了预处理。最终数据集包含问题和答案两列,并且仅提供了训练集,大小为373,928条记录。

ChemData700K Preprocessed is a preprocessed version of the AI4Chem/ChemData700K dataset. It has been processed by filtering out samples that are part of a conversation or have a top-level instruction, formatting the output column, renaming the input and output columns, and pruning other columns. The final dataset includes question and answer columns, and only provides a training split with a size of 373,928 entries.
提供机构:
LLMcompe-Team-Watanabe
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作