ob11/VL-PRM300K-train
收藏Hugging Face2025-10-14 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/ob11/VL-PRM300K-train
下载链接
链接失效反馈官方服务:
资源简介:
VL-PRM300K-train是一个基于VL-PRM300K的后处理版本的数据集,适用于使用HuggingFace Trainer和TRL的训练流程。它包含了为监督微调格式化的推理轨迹消息字段和为HuggingFace Trainer和TRL格式化的PIL图像字段。
VL-PRM300K-train is a postprocessed version of VL-PRM300K, ready to be used with training pipelines using HuggingFace Trainer and TRL. It includes reasoning trace formatted for supervised finetuning message field and PIL image formatted for HuggingFace Trainer and TRL image field.
提供机构:
ob11



