laurentiubp/argilla-orca-bilingual-messages
收藏Hugging Face2024-07-13 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/laurentiubp/argilla-orca-bilingual-messages
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:messages、chosen和rejected。messages是一个列表,包含content和role两个子特征,分别表示消息的内容和角色。chosen和rejected是字符串类型,可能表示被选中和被拒绝的选项。数据集包含一个训练集(train),共有9497个样本,占用26103560字节。下载大小为14947317字节,数据集总大小为26103560字节。
The dataset contains three main features: messages, chosen, and rejected. Messages is a list containing two sub-features: content and role, which represent the content and role of the message, respectively. Chosen and rejected are of string type, possibly representing the selected and rejected options. The dataset includes a training set (train) with 9497 samples, occupying 26103560 bytes. The download size is 14947317 bytes, and the total dataset size is 26103560 bytes.
提供机构:
laurentiubp
原始信息汇总
数据集概述
数据集信息
- 特征:
- messages:
- content: 字符串类型
- role: 字符串类型
- chosen: 字符串类型
- rejected: 字符串类型
- messages:
数据分割
- train:
- 样本数量: 9497
- 字节数: 26103560
数据集大小
- 下载大小: 14947317 字节
- 数据集大小: 26103560 字节
配置
- default:
- 数据文件:
- train:
data/train-*
- train:
- 数据文件:



