Bokhbat/mongolian-dpo-orca

Name: Bokhbat/mongolian-dpo-orca
Creator: Bokhbat
Published: 2026-04-21 01:13:54
License: 暂无描述

Hugging Face2026-04-21 更新2026-04-26 收录

下载链接：

https://hf-mirror.com/datasets/Bokhbat/mongolian-dpo-orca

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: apache-2.0 task_categories: - text-generation language: - mn tags: - dpo - preference - mongolian - rlhf size_categories: - 1K<n<10K configs: - config_name: default data_files: - split: train path: data/train-*.parquet dataset_info: features: - name: prompt dtype: string - name: chosen dtype: string - name: rejected dtype: string splits: - name: train num_examples: 9664 --- # mongolian-dpo-orca Mongolian (Cyrillic) DPO preference pairs, machine-translated from [`Intel/orca_dpo_pairs`](https://huggingface.co/datasets/Intel/orca_dpo_pairs) with `facebook/nllb-200-3.3B` and filtered for Cyrillic ratio, minimum length, and chosen/rejected length balance. ## Schema | column | type | description | |-----------|--------|-----------------------------------| | prompt | string | user prompt (Mongolian Cyrillic) | | chosen | string | preferred response | | rejected | string | dispreferred response | ## Stats - Rows: 9664 - Source: `Intel/orca_dpo_pairs` - Translator: `facebook/nllb-200-3.3B` (eng_Latn -> khk_Cyrl) ## Usage ```python from datasets import load_dataset ds = load_dataset("Bokhbat/mongolian-dpo-orca", split="train") print(ds[0]) ```

# 蒙古语DPO-Orca数据集本数据集遵循Apache-2.0开源许可证，任务类别为文本生成，支持语言为蒙古语（mn），相关标签包括直接偏好优化（Direct Preference Optimization, DPO）、偏好配对、蒙古语、基于人类反馈的强化学习（Reinforcement Learning from Human Feedback, RLHF），样本量范围为1000至10000之间。数据集配置项： - 默认配置：训练拆分对应数据文件路径为`data/train-*.parquet` 数据集特征字段包括： 1. `prompt`：字符串类型，代表用户提示文本 2. `chosen`：字符串类型，代表模型优选回复文本 3. `rejected`：字符串类型，代表模型非优选回复文本数据拆分仅包含训练拆分，共包含9664条样本。本数据集为采用蒙古语西里尔字母书写的直接偏好优化偏好配对样本，由数据集`Intel/orca_dpo_pairs`（[https://huggingface.co/datasets/Intel/orca_dpo_pairs](https://huggingface.co/datasets/Intel/orca_dpo_pairs)）通过`facebook/nllb-200-3.3B`模型机器翻译得到，并针对西里尔字母占比、最小文本长度以及优选与非优选回复的长度平衡性进行了筛选。 ## 数据结构 | 列名 | 数据类型 | 描述 | |---------|----------|--------------------------------| | prompt | 字符串 | 用户提示（采用蒙古语西里尔字母） | | chosen | 字符串 | 模型优选回复 | | rejected| 字符串 | 模型非优选回复 | ## 统计信息 - 总样本数：9664 - 源数据集：`Intel/orca_dpo_pairs` - 翻译模型：`facebook/nllb-200-3.3B`（翻译方向：英语拉丁字母（eng_Latn） → 蒙古语西里尔字母（khk_Cyrl）） ## 使用示例 python from datasets import load_dataset ds = load_dataset("Bokhbat/mongolian-dpo-orca", split="train") print(ds[0])

提供机构：

Bokhbat

5,000+

优质数据集

54 个

任务类型

进入经典数据集