Samantha_sft
收藏数据集概述
基本信息
- 数据集名称: CAMEL Physics
- 数据集地址: https://huggingface.co/datasets/pzanna/Samantha_sft
- 许可协议: CC BY-NC 4.0
- 主要语言: 英语
- 相关论文: https://arxiv.org/abs/2303.17760
- GitHub仓库: https://github.com/lightaime/camel
- 项目网站: https://www.camel-ai.org/
数据集简介
该数据集是CAMEL项目的一部分,专注于物理学领域。数据集包含20,000个问题-解决方案对,这些数据由GPT-4生成。数据覆盖了25个物理学主题,每个主题下包含25个子主题,每个“主题-子主题”组合下生成了32个问题。
数据内容与结构
数据文件为 physics.zip。其包含的数据字段如下:
role_1: 助手角色topic: 物理学主题sub_topic: 属于该主题的物理学子主题message_1: 助手被要求解决的问题message_2: 助手提供的解决方案
使用方式
可通过以下Python代码下载数据: python from huggingface_hub import hf_hub_download hf_hub_download(repo_id="camel-ai/physics", repo_type="dataset", filename="physics.zip", local_dir="datasets/", local_dir_use_symlinks=False)
重要声明
此数据由GPT-4合成生成,可能包含不准确的信息。该数据集仅供研究使用。使用者需承诺仅将数据用于研究目的,并遵守数据集的使用条款和条件。
引用
如需引用,请使用以下BibTeX条目:
@misc{li2023camel, title={CAMEL: Communicative Agents for "Mind" Exploration of Large Scale Language Model Society}, author={Guohao Li and Hasan Abed Al Kader Hammoud and Hani Itani and Dmitrii Khizbullin and Bernard Ghanem}, year={2023}, eprint={2303.17760}, archivePrefix={arXiv}, primaryClass={cs.AI} }




