maxidl/math-prm-800k-de
收藏Hugging Face2024-01-19 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/maxidl/math-prm-800k-de
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是prm800k的德语版本,使用DeepL进行翻译(非正式风格)。数据集包含英语和德语的消息内容,每条消息包括内容和角色两个特征。数据集分为训练集,包含12,298个示例,总大小为24,901,087字节。数据集的下载大小为11,865,504字节。数据集支持文本生成任务,语言为德语和英语,大小类别为10K<n<100K。
该数据集是prm800k的德语版本,使用DeepL进行翻译(非正式风格)。数据集包含英语和德语的消息内容,每条消息包括内容和角色两个特征。数据集分为训练集,包含12,298个示例,总大小为24,901,087字节。数据集的下载大小为11,865,504字节。数据集支持文本生成任务,语言为德语和英语,大小类别为10K<n<100K。
提供机构:
maxidl
原始信息汇总
数据集概述
数据集信息
特征
- messages_en
- content: 数据类型为字符串
- role: 数据类型为字符串
- messages_de
- content: 数据类型为字符串
- role: 数据类型为字符串
数据分割
- train
- 字节数: 24901087
- 样本数: 12298
数据大小
- 下载大小: 11865504
- 数据集大小: 24901087
配置
- default
- 数据文件路径:
data/train-*
- 数据文件路径:
许可证
- MIT
任务类别
- 文本生成
语言
- 德语
- 英语
大小类别
- 10K<n<100K
语言统计
| 语言 | 字符数 |
|---|---|
| en | 11479654 |
| de | 12516903 |



