lgaalves/camel-ai-physics
收藏Hugging Face2023-10-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lgaalves/camel-ai-physics
下载链接
链接失效反馈官方服务:
资源简介:
CAMEL Physics数据集包含20000个问题-解答对,这些问题和解答涉及25个物理主题及其下的25个子主题。每个问题-解答对详细记录了问题(message_1)和解答(message_2),以及相关的物理主题(topic)和子主题(sub_topic)。数据集主要用于文本生成任务,特别适用于指令微调,旨在通过模拟对话来探索大规模语言模型。
CAMEL Physics数据集包含20000个问题-解答对,这些问题和解答涉及25个物理主题及其下的25个子主题。每个问题-解答对详细记录了问题(message_1)和解答(message_2),以及相关的物理主题(topic)和子主题(sub_topic)。数据集主要用于文本生成任务,特别适用于指令微调,旨在通过模拟对话来探索大规模语言模型。
提供机构:
lgaalves
原始信息汇总
数据集概述
数据集简介
CAMEL Physics数据集包含20,000个问题-解决方案对,这些对是通过使用GPT-4从25个物理主题、每个主题25个子主题以及每个“主题,子主题”对32个问题生成的。
数据字段
数据集包含以下字段:
role_1: 助手角色topic: 物理主题sub_topic: 属于主题的物理子主题message_1: 指助手被要求解决的问题message_2: 指助手提供的解决方案
数据分割
数据集分为训练集,包含20,000个样本,总大小为51,650,490字节。
下载大小
数据集的下载大小为23,872,398字节。
许可
数据集遵循cc-by-nc-4.0许可协议。
语言
数据集主要包含英语内容。
标签
数据集标签包括:
- instruction-finetuning
任务类别
数据集适用于文本生成任务。
额外声明
使用此数据集时,用户需同意仅将其用于研究目的,并认识到由于数据是通过ChatGPT人工生成的,可能包含不准确信息。



