Vezora/news_seniment_gpt_alpacaformat

Name: Vezora/news_seniment_gpt_alpacaformat
Creator: Vezora
Published: 2023-08-14 04:49:12
License: 暂无描述

Hugging Face2023-08-14 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Vezora/news_seniment_gpt_alpacaformat

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个基于alpaca格式的版本，源自oliverwang15/news_with_gpt_instructions，包含20k个使用GPT进行情感评分的例子，用于训练fingptv3。

提供机构：

Vezora

原始信息汇总

数据集概述

ALPACA LORA用户指南：
- 可针对的模块："gate_proj", "down_proj", "up_proj", "q_proj", "v_proj", "k_proj", "o_proj"
- 常用模块："q_proj", "v_proj", "k_proj", "o_proj"
- 高性能模块："gate_proj", "down_proj", "up_proj"
训练参数：
- Platypus2-13B / 70B 模型参数：
  - 批量大小：16
  - 微批量大小：1
  - 训练周期数：1
  - 学习率：4e-4 / 3e-4
  - 截断长度：4096
  - lora 等级：16
  - lora alpha：16
  - lora 丢弃率：0.05
  - lora 目标模块：gate_proj, down_proj, up_proj
  - 训练输入：False
  - 添加 EOS 标记：False
  - 长度分组：False
  - 提示模板：alpaca
  - 学习率调度器：cosine
  - 预热步骤：100
推荐设置：
- 批量大小：4-10
- 截断长度：≤ 2048
- 加载方式：load_in_4bit, Normal Float, bf16
特定软件配置：
- oobabooga 配置：编辑 "training.py" 文件，修改目标模块
- alpaca lora 配置：使用 --lora_target_modules 参数运行 train.py 命令

5,000+

优质数据集

54 个

任务类型

进入经典数据集