botp/CodeChat
收藏Hugging Face2024-04-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/botp/CodeChat
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个比较轻量的小数据集,可用于针对性提升模型的数理逻辑推理、代码问答能力。样本从shareAI/ShareGPT-Chinese-English-90k、garage-bAInd/Open-Platypus等数据集中抽取并组合,整理成了统一的多轮对话格式。主要包含逻辑推理、代码问答、代码生成相关语料样本,可以配合LoRA用于轻量微调训练快速激活你的模型在代码QA这方面的能力。推荐使用firefly框架,可以快速开箱即用使用该数据格式的加载。
该数据集是一个比较轻量的小数据集,可用于针对性提升模型的数理逻辑推理、代码问答能力。样本从shareAI/ShareGPT-Chinese-English-90k、garage-bAInd/Open-Platypus等数据集中抽取并组合,整理成了统一的多轮对话格式。主要包含逻辑推理、代码问答、代码生成相关语料样本,可以配合LoRA用于轻量微调训练快速激活你的模型在代码QA这方面的能力。推荐使用firefly框架,可以快速开箱即用使用该数据格式的加载。
提供机构:
botp
原始信息汇总
CodeChat 数据集概述
数据集描述
- 名称: CodeChat 数据集
- 规模: 轻量级小数据集
- 用途: 提升模型的数理逻辑推理、代码问答能力
数据来源
- 样本来源于多个数据集,包括但不限于:
- shareAI/ShareGPT-Chinese-English-90k
- garage-bAInd/Open-Platypus
数据内容
- 主要包含以下类型的语料样本:
- 逻辑推理
- 代码问答
- 代码生成
数据格式
- 整理为统一的多轮对话格式
推荐使用
- 推荐使用firefly框架进行数据加载和处理,该框架支持快速开箱即用该数据格式。
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



