five

alpha-umi-toolbench-processed-json_format

收藏
魔搭社区2025-12-23 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/shenweizhou/alpha-umi-toolbench-processed-json_format
下载链接
链接失效反馈
官方服务:
资源简介:
## alpha-umi-toolbench-processed-json_format alpha-umi [github repo](https://github.com/X-PLUG/Multi-LLM-Agent) 使用的预处理数据集完整数据。可直接用于GLPFT训练。 ### 数据下载 ``` git lfs install git clone https://www.modelscope.cn/datasets/shenweizhou/alpha-umi-toolbench-processed-json_format.git ``` 将下载后的模型放到alpha-umi项目路径的```dataset/toolbench/train```路径下 ### GLPFT训练(详情参考git repo) 我们的α-UMi采用了两阶段的GLPFT微调方法,首先对主干大型语言模型(LLM)进行预热,然后分别对planner、caller、summarizer进行微调。 1. 首先,我们对一个LLM底座进行微调,使其学习整个工具调用智能体任务。 ``` cd ./GLPFT LLAMA_PATH="" # your path for initial LLM checkpoint NNODE=8 PORT=12345 BSZ=6 GA=1 EXP_NAME=/toolbench/backbone # path to save model export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py \ --model_name_or_path $LLAMA_PATH \ --data_path dataset/toolbench/train/train_backbone.json\ --output_dir saved_models/$EXP_NAME \ --num_train_epochs 2 \ --per_device_train_batch_size $BSZ \ --per_device_eval_batch_size $BSZ \ --gradient_accumulation_steps $GA \ --evaluation_strategy "no" \ --eval_steps 0 \ --save_strategy "steps" \ --save_steps 500 \ --save_total_limit 8 \ --learning_rate 5e-5 \ --warmup_ratio 0.4 \ --lr_scheduler_type "cosine" \ --gradient_checkpointing True \ --deepspeed ds_configs/stage3-a100.json \ --bf16 \ --logging_steps 2 \ --model_max_length 4096 \ --report_to none \ --lazy_preprocess True ``` 2. 在获得了backbone模型后,我们开始基于这个模型对planner、caller和summarizer进行微调: ``` cd ./GLPFT NNODE=8 PORT=12345 BSZ=6 GA=1 BB_PATH="saved_models/toolbench/backbone" EXP_NAME=/toolbench/planner export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py \ --model_name_or_path $BB_PATH \ --data_path dataset/toolbench/train/train_planner.json \ --output_dir saved_models/$EXP_NAME \ --num_train_epochs 1 \ --per_device_train_batch_size $BSZ \ --per_device_eval_batch_size $BSZ \ --gradient_accumulation_steps $GA \ --evaluation_strategy "no" \ --eval_steps 0 \ --save_strategy "steps" \ --save_steps 500 \ --save_total_limit 8 \ --learning_rate 1e-5 \ --weight_decay 0.01 \ --warmup_ratio 0.2 \ --lr_scheduler_type "cosine" \ --gradient_checkpointing True \ --bf16 \ --logging_steps 2 \ --model_max_length 4096 \ --report_to none \ --lazy_preprocess True EXP_NAME=/toolbench/caller export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py \ --model_name_or_path $BB_PATH \ --data_path dataset/toolbench/train/train_caller.json \ --output_dir saved_models/$EXP_NAME \ --num_train_epochs 1 \ --per_device_train_batch_size $BSZ \ --per_device_eval_batch_size $BSZ \ --gradient_accumulation_steps $GA \ --evaluation_strategy "no" \ --eval_steps 0 \ --save_strategy "steps" \ --save_steps 500 \ --save_total_limit 8 \ --learning_rate 1e-5 \ --weight_decay 0.01 \ --warmup_ratio 0.2 \ --lr_scheduler_type "cosine" \ --gradient_checkpointing True \ --bf16 \ --logging_steps 2 \ --model_max_length 4096 \ --report_to none \ --lazy_preprocess True EXP_NAME=/toolbench/summarizer export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py \ --model_name_or_path $BB_PATH \ --data_path dataset/toolbench/train/train_summarizer.json \ --output_dir saved_models/$EXP_NAME \ --num_train_epochs 2 \ --per_device_train_batch_size $BSZ \ --per_device_eval_batch_size $BSZ \ --gradient_accumulation_steps $GA \ --evaluation_strategy "no" \ --eval_steps 0 \ --save_strategy "steps" \ --save_steps 500 \ --save_total_limit 8 \ --learning_rate 1e-5 \ --weight_decay 0.01 \ --warmup_ratio 0.4 \ --lr_scheduler_type "cosine" \ --gradient_checkpointing True \ --bf16 \ --logging_steps 2 \ --model_max_length 4096 \ --report_to none \ --lazy_preprocess True ```

alpha-umi-toolbench-processed-json_format 本数据集为alpha-umi [GitHub仓库](https://github.com/X-PLUG/Multi-LLM-Agent) 所用的预处理数据集完整版本,可直接用于GLPFT训练。 ### 数据下载 git lfs install git clone https://www.modelscope.cn/datasets/shenweizhou/alpha-umi-toolbench-processed-json_format.git 请将下载得到的数据集放置于alpha-umi项目路径下的`dataset/toolbench/train`目录中。 ### GLPFT训练(详情请参考对应GitHub仓库) 我们的α-UMi采用了两阶段的GLPFT微调方法,首先对主干大语言模型(Large Language Model,LLM)进行预热,随后分别对planner、caller、summarizer进行微调。 1. 首先,我们对一个大语言模型底座进行微调,使其掌握完整的工具调用智能体任务。 cd ./GLPFT LLAMA_PATH="" # your path for initial LLM checkpoint NNODE=8 PORT=12345 BSZ=6 GA=1 EXP_NAME=/toolbench/backbone # path to save model export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py --model_name_or_path $LLAMA_PATH --data_path dataset/toolbench/train/train_backbone.json --output_dir saved_models/$EXP_NAME --num_train_epochs 2 --per_device_train_batch_size $BSZ --per_device_eval_batch_size $BSZ --gradient_accumulation_steps $GA --evaluation_strategy "no" --eval_steps 0 --save_strategy "steps" --save_steps 500 --save_total_limit 8 --learning_rate 5e-5 --warmup_ratio 0.4 --lr_scheduler_type "cosine" --gradient_checkpointing True --deepspeed ds_configs/stage3-a100.json --bf16 --logging_steps 2 --model_max_length 4096 --report_to none --lazy_preprocess True 2. 在获取到backbone模型后,我们将基于该模型分别对planner、caller与summarizer进行微调: cd ./GLPFT NNODE=8 PORT=12345 BSZ=6 GA=1 BB_PATH="saved_models/toolbench/backbone" EXP_NAME=/toolbench/planner export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py --model_name_or_path $BB_PATH --data_path dataset/toolbench/train/train_planner.json --output_dir saved_models/$EXP_NAME --num_train_epochs 1 --per_device_train_batch_size $BSZ --per_device_eval_batch_size $BSZ --gradient_accumulation_steps $GA --evaluation_strategy "no" --eval_steps 0 --save_strategy "steps" --save_steps 500 --save_total_limit 8 --learning_rate 1e-5 --weight_decay 0.01 --warmup_ratio 0.2 --lr_scheduler_type "cosine" --gradient_checkpointing True --bf16 --logging_steps 2 --model_max_length 4096 --report_to none --lazy_preprocess True EXP_NAME=/toolbench/caller export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py --model_name_or_path $BB_PATH --data_path dataset/toolbench/train/train_caller.json --output_dir saved_models/$EXP_NAME --num_train_epochs 1 --per_device_train_batch_size $BSZ --per_device_eval_batch_size $BSZ --gradient_accumulation_steps $GA --evaluation_strategy "no" --eval_steps 0 --save_strategy "steps" --save_steps 500 --save_total_limit 8 --learning_rate 1e-5 --weight_decay 0.01 --warmup_ratio 0.2 --lr_scheduler_type "cosine" --gradient_checkpointing True --bf16 --logging_steps 2 --model_max_length 4096 --report_to none --lazy_preprocess True EXP_NAME=/toolbench/summarizer export PYTHONPATH=./ torchrun --nproc_per_node=$NNODE --master_port=$PORT train_mem.py --model_name_or_path $BB_PATH --data_path dataset/toolbench/train/train_summarizer.json --output_dir saved_models/$EXP_NAME --num_train_epochs 2 --per_device_train_batch_size $BSZ --per_device_eval_batch_size $BSZ --gradient_accumulation_steps $GA --evaluation_strategy "no" --eval_steps 0 --save_strategy "steps" --save_steps 500 --save_total_limit 8 --learning_rate 1e-5 --weight_decay 0.01 --warmup_ratio 0.4 --lr_scheduler_type "cosine" --gradient_checkpointing True --bf16 --logging_steps 2 --model_max_length 4096 --report_to none --lazy_preprocess True
提供机构:
maas
创建时间:
2024-04-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作