five

botbot-ai/chemistry-ptbr

收藏
Hugging Face2024-03-04 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/botbot-ai/chemistry-ptbr
下载链接
链接失效反馈
官方服务:
资源简介:
CAMEL Chemistry PTBR数据集是对CAMEL Chemistry数据集的葡萄牙语(PT-BR)翻译,使用了NLLB 3.3b模型。该数据集由20K个问题-解决方案对组成,这些对是从25个化学主题、每个主题的25个子主题以及每个“主题,子主题”对的32个问题中生成的。数据字段包括角色、主题、子主题、问题和解决方案。该数据集由GPT4合成生成,可能包含不正确的信息,仅用于研究目的。

CAMEL Chemistry PTBR数据集是对CAMEL Chemistry数据集的葡萄牙语(PT-BR)翻译,使用了NLLB 3.3b模型。该数据集由20K个问题-解决方案对组成,这些对是从25个化学主题、每个主题的25个子主题以及每个“主题,子主题”对的32个问题中生成的。数据字段包括角色、主题、子主题、问题和解决方案。该数据集由GPT4合成生成,可能包含不正确的信息,仅用于研究目的。
提供机构:
botbot-ai
原始信息汇总

数据集概述

数据集简介

CAMEL Chemistry PTBR 数据集包含 20,000 个问题-解答对,这些对是通过使用 gpt-4 从 25 个化学主题及其 25 个子主题中生成的。每个“主题,子主题”对包含 32 个问题。

数据字段

数据集文件 chemistry.zip 包含以下字段:

  • role_1: 助手角色
  • topic: 化学主题
  • sub_topic: 属于主题的化学子主题
  • message_1: 助手被要求解决的问题
  • message_2: 助手提供的解答

下载方式

python from huggingface_hub import hf_hub_download hf_hub_download(repo_id="camel-ai/chemistry", repo_type="dataset", filename="chemistry.zip", local_dir="datasets/", local_dir_use_symlinks=False)

引用

@misc{li2023camel, title={CAMEL: Communicative Agents for "Mind" Exploration of Large Scale Language Model Society}, author={Guohao Li and Hasan Abed Al Kader Hammoud and Hani Itani and Dmitrii Khizbullin and Bernard Ghanem}, year={2023}, eprint={2303.17760}, archivePrefix={arXiv}, primaryClass={cs.AI} }

免责声明

该数据集是使用 GPT4 合成生成的,可能包含不准确的信息。数据集仅用于研究目的。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作