five

maxidl/math-prm-800k-de

收藏
Hugging Face2024-01-19 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/maxidl/math-prm-800k-de
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是prm800k的德语版本,使用DeepL进行翻译(非正式风格)。数据集包含英语和德语的消息内容,每条消息包括内容和角色两个特征。数据集分为训练集,包含12,298个示例,总大小为24,901,087字节。数据集的下载大小为11,865,504字节。数据集支持文本生成任务,语言为德语和英语,大小类别为10K<n<100K。

该数据集是prm800k的德语版本,使用DeepL进行翻译(非正式风格)。数据集包含英语和德语的消息内容,每条消息包括内容和角色两个特征。数据集分为训练集,包含12,298个示例,总大小为24,901,087字节。数据集的下载大小为11,865,504字节。数据集支持文本生成任务,语言为德语和英语,大小类别为10K<n<100K。
提供机构:
maxidl
原始信息汇总

数据集概述

数据集信息

特征

  • messages_en
    • content: 数据类型为字符串
    • role: 数据类型为字符串
  • messages_de
    • content: 数据类型为字符串
    • role: 数据类型为字符串

数据分割

  • train
    • 字节数: 24901087
    • 样本数: 12298

数据大小

  • 下载大小: 11865504
  • 数据集大小: 24901087

配置

  • default
    • 数据文件路径: data/train-*

许可证

  • MIT

任务类别

  • 文本生成

语言

  • 德语
  • 英语

大小类别

  • 10K<n<100K

语言统计

语言 字符数
en 11479654
de 12516903
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作