Locutusque/OpenCerebrum-2.0-SFT
收藏Hugging Face2024-04-13 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/Locutusque/OpenCerebrum-2.0-SFT
下载链接
链接失效反馈官方服务:
资源简介:
OpenCerebrum SFT子集是一个包含约6,400个示例的开源数据集,专注于文本生成和问答任务。该数据集使用英语,涵盖代码、数学、化学和生物学领域。通过Cognitive Computations开发的内部精选技术,数据集被压缩至1K到10K的大小。
OpenCerebrum SFT子集是一个包含约6,400个示例的开源数据集,专注于文本生成和问答任务。该数据集使用英语,涵盖代码、数学、化学和生物学领域。通过Cognitive Computations开发的内部精选技术,数据集被压缩至1K到10K的大小。
提供机构:
Locutusque
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别:
- 文本生成
- 问答
- 语言: 英语
- 标签:
- 代码
- 数学
- 化学
- 生物学
- 大小类别: 1K<n<10K
数据集详情
- 名称: OpenCerebrum SFT subset
- 描述: 该数据集是Aether Research的Cerebrum数据集的开源版本,包含约6,400个示例。通过Cognitive Computations开发的内部精选技术进行压缩。
- 精选技术: 使用Cognitive Computations开发的内部技术进行数据精选。
- 数据源: 数据源信息即将提供,可在数据集的"source"列中查看初步信息。



