camel-ai/chemistry
收藏CAMEL Chemistry 数据集概述
数据集总结
CAMEL Chemistry 数据集包含 20,000 个问题-解决方案对,这些对是通过使用 GPT-4 生成的。数据集中的问题-解决方案对来自 25 个化学主题,每个主题有 25 个子主题,每个“主题,子主题”对有 32 个问题。
数据集文件位于 chemistry.zip 中。
数据字段
chemistry.zip 文件中的数据字段如下:
role_1: 助手角色topic: 化学主题sub_topic: 属于主题的化学子主题message_1: 指助手被要求解决的问题message_2: 指助手提供的解决方案
下载方法
python from huggingface_hub import hf_hub_download hf_hub_download(repo_id="camel-ai/chemistry", repo_type="dataset", filename="chemistry.zip", local_dir="datasets/", local_dir_use_symlinks=False)
引用
@misc{li2023camel, title={CAMEL: Communicative Agents for "Mind" Exploration of Large Scale Language Model Society}, author={Guohao Li and Hasan Abed Al Kader Hammoud and Hani Itani and Dmitrii Khizbullin and Bernard Ghanem}, year={2023}, eprint={2303.17760}, archivePrefix={arXiv}, primaryClass={cs.AI} }
免责声明
该数据集是由 GPT-4 合成生成的,可能包含不正确的信息。数据集仅用于研究目的。




