NeuralNovel/Unsloth-DPO
收藏Hugging Face2024-03-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NeuralNovel/Unsloth-DPO
下载链接
链接失效反馈官方服务:
资源简介:
Unsloth-DPO数据集受orca_dpo_pairs启发,专注于Unsloth.ai。该数据集包含问题和答案对,旨在提高数据集的一致性和相关性。数据集的来源包括orca_dpo_pairs、Make LLM Fine-tuning 2x faster with Unsloth和🤗 TRL、以及unsloth.ai/blog/mistral-benchmark。为了提高数据集的质量,某些短语被选择性删除,例如Couldnt help but、Cant resist、Im sorry, but等。
Unsloth-DPO数据集受orca_dpo_pairs启发,专注于Unsloth.ai。该数据集包含问题和答案对,旨在提高数据集的一致性和相关性。数据集的来源包括orca_dpo_pairs、Make LLM Fine-tuning 2x faster with Unsloth和🤗 TRL、以及unsloth.ai/blog/mistral-benchmark。为了提高数据集的质量,某些短语被选择性删除,例如Couldnt help but、Cant resist、Im sorry, but等。
提供机构:
NeuralNovel
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可证: Apache 2.0
创建者与组织
- 创建者: NeuralNovel
- 社区组织: ConvexAI
数据集详情
- 名称: Unsloth-DPO
- 灵感来源: orca_dpo_pairs
- 相关资源:
- Make LLM Fine-tuning 2x faster with Unsloth and 🤗 TRL
- unsloth.ai/blog/mistral-benchmark
数据内容
- 数据类型: 问题与答案对
- 焦点: Unsloth.ai
- 处理: 为了提高数据集的连贯性和相关性,某些特定短语已被选择性移除,包括:
- Couldnt help but
- Cant resist
- Im sorry, but
- As an AI
- However, it is important to
- Cannot provide
- 以及其他短语



