five

lgaalves/camel-ai-physics

收藏
Hugging Face2023-10-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lgaalves/camel-ai-physics
下载链接
链接失效反馈
官方服务:
资源简介:
CAMEL Physics数据集包含20000个问题-解答对,这些问题和解答涉及25个物理主题及其下的25个子主题。每个问题-解答对详细记录了问题(message_1)和解答(message_2),以及相关的物理主题(topic)和子主题(sub_topic)。数据集主要用于文本生成任务,特别适用于指令微调,旨在通过模拟对话来探索大规模语言模型。

CAMEL Physics数据集包含20000个问题-解答对,这些问题和解答涉及25个物理主题及其下的25个子主题。每个问题-解答对详细记录了问题(message_1)和解答(message_2),以及相关的物理主题(topic)和子主题(sub_topic)。数据集主要用于文本生成任务,特别适用于指令微调,旨在通过模拟对话来探索大规模语言模型。
提供机构:
lgaalves
原始信息汇总

数据集概述

数据集简介

CAMEL Physics数据集包含20,000个问题-解决方案对,这些对是通过使用GPT-4从25个物理主题、每个主题25个子主题以及每个“主题,子主题”对32个问题生成的。

数据字段

数据集包含以下字段:

  • role_1: 助手角色
  • topic: 物理主题
  • sub_topic: 属于主题的物理子主题
  • message_1: 指助手被要求解决的问题
  • message_2: 指助手提供的解决方案

数据分割

数据集分为训练集,包含20,000个样本,总大小为51,650,490字节。

下载大小

数据集的下载大小为23,872,398字节。

许可

数据集遵循cc-by-nc-4.0许可协议。

语言

数据集主要包含英语内容。

标签

数据集标签包括:

  • instruction-finetuning

任务类别

数据集适用于文本生成任务。

额外声明

使用此数据集时,用户需同意仅将其用于研究目的,并认识到由于数据是通过ChatGPT人工生成的,可能包含不准确信息。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作