five

orpo-dpo-mix-40k-mlx

收藏
Hugging Face2025-03-01 更新2025-03-02 收录
下载链接:
https://huggingface.co/datasets/mlx-community/orpo-dpo-mix-40k-mlx
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个为MLX-LM优化的orpo-dpo-mix-40k数据集的拆分版本,专门用于ORPO训练。数据集被分为训练集(90%)、验证集(6%)和测试集(4%)。

This is a split version of the orpo-dpo-mix-40k dataset optimized for MLX-LM, specifically designed for ORPO training. The dataset is divided into a training set (90%), a validation set (6%), and a test set (4%).
提供机构:
MLX Community
创建时间:
2025-03-01
原始信息汇总

数据集概述

许可信息

  • 许可证:Apache-2.0

任务类别

  • 文本生成(Text-Generation)

语言

  • 英语(English)

标签

  • ORPO
  • DPO

数据规模

  • 10K < n < 100K

数据集描述

  • 数据集是orpo-dpo-mix-40k的一个拆分版本,专为直接与MLX-LM配合使用而设计,特别适配ORPO训练。
  • 数据集被分为三个部分:
    • 训练集:90%
    • 验证集:6%
    • 测试集:4%

示例用法

  • 使用以下命令训练模型: bash python -m mlx_lm.lora --model Qwen/Qwen2.5-3B-Instruct --train --test --num-layers 8 --data mlx-community/orpo-dpo-mix-40k --iters 1000 --batch-size 1 --val-batches 1 --steps-per-report 10 --adapter-path path --max-seq-length 1024 --grad-checkpoint --training-mode orpo or dpo --fine-tune-type lora --beta 0.1 --steps-per-eval 50 --test-batches 1

ORPO训练注意事项

  • MLX-LM目前原生不支持ORPO或DPO训练,但将在未来的更新中加入此功能。
  • 若要在MLX-LM中使用此数据集进行ORPO训练,需要:
    • 克隆我的MLX-examples的fork版本:https://github.com/Goekdeniz-Guelmez/mlx-examples.git
    • 切换到分支adding-support-for-orpo-training
    • 对于DPO训练,使用分支adding-dpo-training
  • 详细文档可在此链接查看:MLX-LM LORA Documentation
搜集汇总
数据集介绍
main_image_url
构建方式
针对机器学习模型训练的需要,该数据集orpo-dpo-mix-40k-mlx是由orpo-dpo-mix-40k数据集改编而来,专门为MLX-LM模型设计。数据集被划分为训练集、验证集和测试集,分别占总体的90%、6%和4%,以满足模型训练和评估的需求。
特点
本数据集的主要特点是针对ORPO训练进行了特别定制,包含了文本生成任务所需的语言数据。数据集以英语为主要语言,且其规模属于10K到100K的范围,便于研究者进行不同规模的模型训练和评估。此外,数据集遵循Apache-2.0协议,保证了使用的灵活性和开放性。
使用方法
使用该数据集进行模型训练时,用户可以通过命令行工具,按照指定的参数调用MLX-LM模型进行训练。具体使用时,需要根据数据集的分支选择相应的训练模式,目前ORPO和DPO的训练支持正在开发中,用户可以参考相关文档进行操作,并按照模型训练的要求设置参数。
背景与挑战
背景概述
在自然语言处理领域,文本生成任务始终是研究的热点之一。'orpo-dpo-mix-40k-mlx'数据集便是在此背景下诞生,它是'orpo-dpo-mix-40k'数据集的一个分割版本,专为MLX-LM模型设计,以适应ORPO训练的需求。该数据集由Gökdeniz Gülmez维护,并遵循Apache-2.0许可。它包含英语文本,规模在10K到100K之间,适用于机器学习模型的训练、验证和测试。
当前挑战
尽管该数据集为研究提供了便利,但在使用过程中仍面临一些挑战。首先,MLX-LM模型目前并不原生支持ORPO或DPO训练,这要求用户必须使用特定分支的代码来适配ORPO训练。其次,数据集的构建与分割需要精确控制,以确保训练、验证和测试集的质量和代表性。此外,数据集的应用范围受限于其对MLX-LM模型的依赖,这限制了其在其他模型或场景中的应用。
常用场景
经典使用场景
针对自然语言处理领域,orpo-dpo-mix-40k-mlx数据集的典型应用场景在于文本生成任务。该数据集经过专门设计,以适应MLX-LM模型的需求,能够为模型训练提供丰富的训练样本,进而提升模型在文本生成任务上的表现。
实际应用
在实际应用中,orpo-dpo-mix-40k-mlx数据集可被用于训练自然语言生成模型,这些模型可以应用于自动写作、机器翻译、对话系统等场景,为这些应用提供高质量的文本输出。
衍生相关工作
基于orpo-dpo-mix-40k-mlx数据集,研究者们已经开展了一系列相关工作,包括但不限于对MLX-LM模型结构的优化、训练策略的改进,以及针对特定文本生成任务的模型微调等,推动了自然语言处理领域的研究进展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作