Bokhbat/mongolian-dpo-orca
收藏Hugging Face2026-04-21 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/Bokhbat/mongolian-dpo-orca
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
task_categories:
- text-generation
language:
- mn
tags:
- dpo
- preference
- mongolian
- rlhf
size_categories:
- 1K<n<10K
configs:
- config_name: default
data_files:
- split: train
path: data/train-*.parquet
dataset_info:
features:
- name: prompt
dtype: string
- name: chosen
dtype: string
- name: rejected
dtype: string
splits:
- name: train
num_examples: 9664
---
# mongolian-dpo-orca
Mongolian (Cyrillic) DPO preference pairs, machine-translated from
[`Intel/orca_dpo_pairs`](https://huggingface.co/datasets/Intel/orca_dpo_pairs) with `facebook/nllb-200-3.3B` and filtered
for Cyrillic ratio, minimum length, and chosen/rejected length balance.
## Schema
| column | type | description |
|-----------|--------|-----------------------------------|
| prompt | string | user prompt (Mongolian Cyrillic) |
| chosen | string | preferred response |
| rejected | string | dispreferred response |
## Stats
- Rows: 9664
- Source: `Intel/orca_dpo_pairs`
- Translator: `facebook/nllb-200-3.3B` (eng_Latn -> khk_Cyrl)
## Usage
```python
from datasets import load_dataset
ds = load_dataset("Bokhbat/mongolian-dpo-orca", split="train")
print(ds[0])
```
# 蒙古语DPO-Orca数据集
本数据集遵循Apache-2.0开源许可证,任务类别为文本生成,支持语言为蒙古语(mn),相关标签包括直接偏好优化(Direct Preference Optimization, DPO)、偏好配对、蒙古语、基于人类反馈的强化学习(Reinforcement Learning from Human Feedback, RLHF),样本量范围为1000至10000之间。
数据集配置项:
- 默认配置:训练拆分对应数据文件路径为`data/train-*.parquet`
数据集特征字段包括:
1. `prompt`:字符串类型,代表用户提示文本
2. `chosen`:字符串类型,代表模型优选回复文本
3. `rejected`:字符串类型,代表模型非优选回复文本
数据拆分仅包含训练拆分,共包含9664条样本。
本数据集为采用蒙古语西里尔字母书写的直接偏好优化偏好配对样本,由数据集`Intel/orca_dpo_pairs`([https://huggingface.co/datasets/Intel/orca_dpo_pairs](https://huggingface.co/datasets/Intel/orca_dpo_pairs))通过`facebook/nllb-200-3.3B`模型机器翻译得到,并针对西里尔字母占比、最小文本长度以及优选与非优选回复的长度平衡性进行了筛选。
## 数据结构
| 列名 | 数据类型 | 描述 |
|---------|----------|--------------------------------|
| prompt | 字符串 | 用户提示(采用蒙古语西里尔字母) |
| chosen | 字符串 | 模型优选回复 |
| rejected| 字符串 | 模型非优选回复 |
## 统计信息
- 总样本数:9664
- 源数据集:`Intel/orca_dpo_pairs`
- 翻译模型:`facebook/nllb-200-3.3B`(翻译方向:英语拉丁字母(eng_Latn) → 蒙古语西里尔字母(khk_Cyrl))
## 使用示例
python
from datasets import load_dataset
ds = load_dataset("Bokhbat/mongolian-dpo-orca", split="train")
print(ds[0])
提供机构:
Bokhbat



