Vezora/Mini_Orca_Code_Uncencored_alpaca_Format

收藏

Hugging Face2023-08-14 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Vezora/Mini_Orca_Code_Uncencored_alpaca_Format

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是psmathurs Mini orca数据集的修改版本，格式化为alpaca格式并且未经过审查。数据集经过过滤，仅包含约50,000个编码指令的示例。

该数据集是psmathurs Mini orca数据集的修改版本，格式化为alpaca格式并且未经过审查。数据集经过过滤，仅包含约50,000个编码指令的示例。

提供机构：

Vezora

原始信息汇总

数据集概述

数据集来源与格式

本数据集是基于"psmathur"的Mini orca数据集的修改版本，格式化为alpaca格式，且未经审查。

数据集内容

数据集经过筛选，仅包含约50,000个代码示例，主要围绕编程指令。

使用指南

对于ALPACA LORA用户，推荐使用的模块包括："gate_proj", "down_proj", "up_proj", "q_proj", "v_proj", "k_proj", "o_proj"。
大多数LORA模型使用："q_proj", "v_proj", "k_proj", "o_proj"。
Platypus模型推荐使用："gate_proj", "down_proj", "up_proj"。

训练参数

Platypus模型的超参数设置如下：
- 模型大小：13B和70B
- 批量大小：16
- 微批量大小：1
- 训练周期：1
- 学习率：4e-4 / 3e-4
- 截断长度：4096
- LORA等级：16
- LORA alpha：16
- LORA dropout：0.05
- LORA目标模块：gate_proj, down_proj, up_proj
- 训练输入：False
- 添加EOS标记：False
- 按长度分组：False
- 提示模板：alpaca
- 学习率调度器：余弦
- 预热步骤：100

推荐设置

推荐使用批量大小4-10，截断长度≤2048，以避免VRAM问题。
使用4位加载，正常浮点和bf16。

训练配置修改

使用oobabooga进行训练时，需修改"training.py"文件中的标准模块设置。
使用alpaca lora进行训练时，需在train.py命令中添加--lora_target_modules参数。

5,000+

优质数据集

54 个

任务类型

进入经典数据集

© 2023-2025 上海数据发展科技有限责任公司版权所有

沪ICP备17003045号-15 沪公网安备31010402336585号

二维码

社区交流群

面向社区/商业的数据集话题

二维码

科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作