maxidl/OpenOrca-gpt4-de
收藏Hugging Face2024-03-25 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/maxidl/OpenOrca-gpt4-de
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: messages_en
list:
- name: content
dtype: string
- name: role
dtype: string
- name: messages_de
list:
- name: content
dtype: string
- name: role
dtype: string
splits:
- name: train
num_bytes: 428035438
num_examples: 119559
download_size: 246426304
dataset_size: 428035438
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
German version of [Open-Orca/OpenOrca](https://huggingface.co/datasets/Open-Orca/OpenOrca). Translated using DeepL (informal style).
Currently limited to the first 119_559 examples, from the gpt4 subset.
|lang|#chars|
|---|---|
|en|196_009_006|
|de|219_100_043|
提供机构:
maxidl
原始信息汇总
数据集信息
特征
- messages_en
- content: 类型为字符串
- role: 类型为字符串
- messages_de
- content: 类型为字符串
- role: 类型为字符串
数据分割
- train
- 字节数: 428035438
- 样本数: 119559
数据大小
- 下载大小: 246426304
- 数据集大小: 428035438
配置
- default
- 数据文件:
- split: train
- 路径: data/train-*
- 数据文件:
数据集描述
- 德语版本的 Open-Orca/OpenOrca,使用 DeepL 翻译(非正式风格)。
- 目前仅包含前 119,559 个示例,来自 gpt4 子集。
语言和字符数
| 语言 | 字符数 |
|---|---|
| en | 196,009,006 |
| de | 219,100,043 |



