camel-ai/math
收藏数据集概述
数据集名称
CAMEL Math
数据集描述
CAMEL Math 数据集包含50,000个问题-解答对,这些问题和解答是通过GPT-4生成的。数据集涵盖了25个数学主题,每个主题下有25个子主题,每个“主题-子主题”对下有80个问题。
数据集结构
数据集文件为 math50k.zip,包含以下字段:
role_1: 助手角色topic: 数学主题sub_topic: 属于主题的数学子主题message_1: 助手需要解决的问题message_2: 助手提供的解答
文件命名格式为 {topic_index}_{subtopic_index}_{problem_number}。
许可证
数据集遵循 CC-BY-NC-4.0 许可证。
使用声明
使用此数据集需遵守以下声明:仅用于研究目的,数据集可能包含因通过ChatGPT人工生成的错误信息。
下载方式
可通过以下Python代码从Hugging Face Hub下载数据集: python from huggingface_hub import hf_hub_download hf_hub_download(repo_id="camel-ai/math", repo_type="dataset", filename="math50k.zip", local_dir="datasets/", local_dir_use_symlinks=False)
引用信息
@misc{li2023camel, title={CAMEL: Communicative Agents for "Mind" Exploration of Large Scale Language Model Society}, author={Guohao Li and Hasan Abed Al Kader Hammoud and Hani Itani and Dmitrii Khizbullin and Bernard Ghanem}, year={2023}, eprint={2303.17760}, archivePrefix={arXiv}, primaryClass={cs.AI} }




