five

botp/CodeChat

收藏
Hugging Face2024-04-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/botp/CodeChat
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个比较轻量的小数据集,可用于针对性提升模型的数理逻辑推理、代码问答能力。样本从shareAI/ShareGPT-Chinese-English-90k、garage-bAInd/Open-Platypus等数据集中抽取并组合,整理成了统一的多轮对话格式。主要包含逻辑推理、代码问答、代码生成相关语料样本,可以配合LoRA用于轻量微调训练快速激活你的模型在代码QA这方面的能力。推荐使用firefly框架,可以快速开箱即用使用该数据格式的加载。

该数据集是一个比较轻量的小数据集,可用于针对性提升模型的数理逻辑推理、代码问答能力。样本从shareAI/ShareGPT-Chinese-English-90k、garage-bAInd/Open-Platypus等数据集中抽取并组合,整理成了统一的多轮对话格式。主要包含逻辑推理、代码问答、代码生成相关语料样本,可以配合LoRA用于轻量微调训练快速激活你的模型在代码QA这方面的能力。推荐使用firefly框架,可以快速开箱即用使用该数据格式的加载。
提供机构:
botp
原始信息汇总

CodeChat 数据集概述

数据集描述

  • 名称: CodeChat 数据集
  • 规模: 轻量级小数据集
  • 用途: 提升模型的数理逻辑推理、代码问答能力

数据来源

  • 样本来源于多个数据集,包括但不限于:
    • shareAI/ShareGPT-Chinese-English-90k
    • garage-bAInd/Open-Platypus

数据内容

  • 主要包含以下类型的语料样本:
    • 逻辑推理
    • 代码问答
    • 代码生成

数据格式

  • 整理为统一的多轮对话格式

推荐使用

  • 推荐使用firefly框架进行数据加载和处理,该框架支持快速开箱即用该数据格式。
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作