2A2I/argilla-dpo-mix-7k-arabic
收藏Hugging Face2024-03-18 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/2A2I/argilla-dpo-mix-7k-arabic
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: test
path: data/test-*
- split: train
path: data/train-*
dataset_info:
features:
- name: dataset
dtype: string
- name: chosen
dtype: string
- name: rejected
dtype: string
- name: chosen_rating
dtype: float64
- name: rejected_rating
dtype: float64
splits:
- name: test
num_bytes: 6991078
num_examples: 750
- name: train
num_bytes: 62886912
num_examples: 6750
download_size: 30613280
dataset_size: 69877990
license: mit
language:
- ar
tags:
- synthetic
- dpo
- distilabel
size_categories:
- 1K<n<10K
---
# Dataset Card for "argilla-dpo-mix-7k-arabic"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
2A2I
原始信息汇总
数据集概述
基本信息
- 数据集名称: argilla-dpo-mix-7k-arabic
- 配置:
- 默认配置:
- 测试数据路径: data/test-*
- 训练数据路径: data/train-*
- 默认配置:
数据集特征
- 特征列表:
- dataset: 数据集名称,数据类型为字符串
- chosen: 选中的数据,数据类型为字符串
- rejected: 拒绝的数据,数据类型为字符串
- chosen_rating: 选中的评分,数据类型为浮点数
- rejected_rating: 拒绝的评分,数据类型为浮点数
数据集划分
- 测试集:
- 样本数量: 750
- 数据大小: 6991078字节
- 训练集:
- 样本数量: 6750
- 数据大小: 62886912字节
数据集大小
- 下载大小: 30613280字节
- 数据集总大小: 69877990字节
许可信息
- 许可证: MIT
语言
- 支持的语言: 阿拉伯语
标签
- 数据集标签:
- synthetic
- dpo
- distilabel
大小分类
- 数据集大小范围: 1K<n<10K



