alpha-umi-toolbench-processed-json_format

Name: alpha-umi-toolbench-processed-json_format
Creator: maas
Published: 2025-12-23 12:05:03
License: 暂无描述

魔搭社区2025-12-23 更新2024-05-15 收录

下载链接：

https://modelscope.cn/datasets/shenweizhou/alpha-umi-toolbench-processed-json_format

下载链接

链接失效反馈

官方服务：

资源简介：

## alpha-umi-toolbench-processed-json_format alpha-umi [github repo](https://github.com/X-PLUG/Multi-LLM-Agent) 使用的预处理数据集完整数据。可直接用于GLPFT训练。 ### 数据下载 ``` git lfs install git clone https://www.modelscope.cn/datasets/shenweizhou/alpha-umi-toolbench-processed-json_format.git ``` 将下载后的模型放到alpha-umi项目路径的```dataset/toolbench/train```路径下 ### GLPFT训练（详情参考git repo）我们的α-UMi采用了两阶段的GLPFT微调方法，首先对主干大型语言模型（LLM）进行预热，然后分别对planner、caller、summarizer进行微调。 1. 首先，我们对一个LLM底座进行微调，使其学习整个工具调用智能体任务。 ``` cd ./GLPFT LLAMA_PATH="" # your path for initial LLM checkpoint NNODE=8 PORT=12345 BSZ=6 GA=1 EXP_NAME=/toolbench/backbone # path to save model export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py \ --model_name_or_path $LLAMA_PATH \ --data_path dataset/toolbench/train/train_backbone.json\ --output_dir saved_models/$EXP_NAME \ --num_train_epochs 2 \ --per_device_train_batch_size $BSZ \ --per_device_eval_batch_size $BSZ \ --gradient_accumulation_steps $GA \ --evaluation_strategy "no" \ --eval_steps 0 \ --save_strategy "steps" \ --save_steps 500 \ --save_total_limit 8 \ --learning_rate 5e-5 \ --warmup_ratio 0.4 \ --lr_scheduler_type "cosine" \ --gradient_checkpointing True \ --deepspeed ds_configs/stage3-a100.json \ --bf16 \ --logging_steps 2 \ --model_max_length 4096 \ --report_to none \ --lazy_preprocess True ``` 2. 在获得了backbone模型后，我们开始基于这个模型对planner、caller和summarizer进行微调： ``` cd ./GLPFT NNODE=8 PORT=12345 BSZ=6 GA=1 BB_PATH="saved_models/toolbench/backbone" EXP_NAME=/toolbench/planner export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py \ --model_name_or_path $BB_PATH \ --data_path dataset/toolbench/train/train_planner.json \ --output_dir saved_models/$EXP_NAME \ --num_train_epochs 1 \ --per_device_train_batch_size $BSZ \ --per_device_eval_batch_size $BSZ \ --gradient_accumulation_steps $GA \ --evaluation_strategy "no" \ --eval_steps 0 \ --save_strategy "steps" \ --save_steps 500 \ --save_total_limit 8 \ --learning_rate 1e-5 \ --weight_decay 0.01 \ --warmup_ratio 0.2 \ --lr_scheduler_type "cosine" \ --gradient_checkpointing True \ --bf16 \ --logging_steps 2 \ --model_max_length 4096 \ --report_to none \ --lazy_preprocess True EXP_NAME=/toolbench/caller export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py \ --model_name_or_path $BB_PATH \ --data_path dataset/toolbench/train/train_caller.json \ --output_dir saved_models/$EXP_NAME \ --num_train_epochs 1 \ --per_device_train_batch_size $BSZ \ --per_device_eval_batch_size $BSZ \ --gradient_accumulation_steps $GA \ --evaluation_strategy "no" \ --eval_steps 0 \ --save_strategy "steps" \ --save_steps 500 \ --save_total_limit 8 \ --learning_rate 1e-5 \ --weight_decay 0.01 \ --warmup_ratio 0.2 \ --lr_scheduler_type "cosine" \ --gradient_checkpointing True \ --bf16 \ --logging_steps 2 \ --model_max_length 4096 \ --report_to none \ --lazy_preprocess True EXP_NAME=/toolbench/summarizer export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py \ --model_name_or_path $BB_PATH \ --data_path dataset/toolbench/train/train_summarizer.json \ --output_dir saved_models/$EXP_NAME \ --num_train_epochs 2 \ --per_device_train_batch_size $BSZ \ --per_device_eval_batch_size $BSZ \ --gradient_accumulation_steps $GA \ --evaluation_strategy "no" \ --eval_steps 0 \ --save_strategy "steps" \ --save_steps 500 \ --save_total_limit 8 \ --learning_rate 1e-5 \ --weight_decay 0.01 \ --warmup_ratio 0.4 \ --lr_scheduler_type "cosine" \ --gradient_checkpointing True \ --bf16 \ --logging_steps 2 \ --model_max_length 4096 \ --report_to none \ --lazy_preprocess True ```

alpha-umi-toolbench-processed-json_format 本数据集为alpha-umi [GitHub仓库](https://github.com/X-PLUG/Multi-LLM-Agent) 所用的预处理数据集完整版本，可直接用于GLPFT训练。 ### 数据下载 git lfs install git clone https://www.modelscope.cn/datasets/shenweizhou/alpha-umi-toolbench-processed-json_format.git 请将下载得到的数据集放置于alpha-umi项目路径下的`dataset/toolbench/train`目录中。 ### GLPFT训练（详情请参考对应GitHub仓库）我们的α-UMi采用了两阶段的GLPFT微调方法，首先对主干大语言模型（Large Language Model，LLM）进行预热，随后分别对planner、caller、summarizer进行微调。 1. 首先，我们对一个大语言模型底座进行微调，使其掌握完整的工具调用智能体任务。 cd ./GLPFT LLAMA_PATH="" # your path for initial LLM checkpoint NNODE=8 PORT=12345 BSZ=6 GA=1 EXP_NAME=/toolbench/backbone # path to save model export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py --model_name_or_path $LLAMA_PATH --data_path dataset/toolbench/train/train_backbone.json --output_dir saved_models/$EXP_NAME --num_train_epochs 2 --per_device_train_batch_size $BSZ --per_device_eval_batch_size $BSZ --gradient_accumulation_steps $GA --evaluation_strategy "no" --eval_steps 0 --save_strategy "steps" --save_steps 500 --save_total_limit 8 --learning_rate 5e-5 --warmup_ratio 0.4 --lr_scheduler_type "cosine" --gradient_checkpointing True --deepspeed ds_configs/stage3-a100.json --bf16 --logging_steps 2 --model_max_length 4096 --report_to none --lazy_preprocess True 2. 在获取到backbone模型后，我们将基于该模型分别对planner、caller与summarizer进行微调： cd ./GLPFT NNODE=8 PORT=12345 BSZ=6 GA=1 BB_PATH="saved_models/toolbench/backbone" EXP_NAME=/toolbench/planner export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py --model_name_or_path $BB_PATH --data_path dataset/toolbench/train/train_planner.json --output_dir saved_models/$EXP_NAME --num_train_epochs 1 --per_device_train_batch_size $BSZ --per_device_eval_batch_size $BSZ --gradient_accumulation_steps $GA --evaluation_strategy "no" --eval_steps 0 --save_strategy "steps" --save_steps 500 --save_total_limit 8 --learning_rate 1e-5 --weight_decay 0.01 --warmup_ratio 0.2 --lr_scheduler_type "cosine" --gradient_checkpointing True --bf16 --logging_steps 2 --model_max_length 4096 --report_to none --lazy_preprocess True EXP_NAME=/toolbench/caller export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py --model_name_or_path $BB_PATH --data_path dataset/toolbench/train/train_caller.json --output_dir saved_models/$EXP_NAME --num_train_epochs 1 --per_device_train_batch_size $BSZ --per_device_eval_batch_size $BSZ --gradient_accumulation_steps $GA --evaluation_strategy "no" --eval_steps 0 --save_strategy "steps" --save_steps 500 --save_total_limit 8 --learning_rate 1e-5 --weight_decay 0.01 --warmup_ratio 0.2 --lr_scheduler_type "cosine" --gradient_checkpointing True --bf16 --logging_steps 2 --model_max_length 4096 --report_to none --lazy_preprocess True EXP_NAME=/toolbench/summarizer export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py --model_name_or_path $BB_PATH --data_path dataset/toolbench/train/train_summarizer.json --output_dir saved_models/$EXP_NAME --num_train_epochs 2 --per_device_train_batch_size $BSZ --per_device_eval_batch_size $BSZ --gradient_accumulation_steps $GA --evaluation_strategy "no" --eval_steps 0 --save_strategy "steps" --save_steps 500 --save_total_limit 8 --learning_rate 1e-5 --weight_decay 0.01 --warmup_ratio 0.4 --lr_scheduler_type "cosine" --gradient_checkpointing True --bf16 --logging_steps 2 --model_max_length 4096 --report_to none --lazy_preprocess True

提供机构：

maas

创建时间：

2024-04-23

5,000+

优质数据集

54 个

任务类型

进入经典数据集