marcob/lambada_multilingual

Name: marcob/lambada_multilingual
Creator: marcob
Published: 2024-02-26 14:12:05
License: 暂无描述

Hugging Face2024-02-26 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/marcob/lambada_multilingual

下载链接

链接失效反馈

官方服务：

资源简介：

LAMBADA OpenAI数据集是一个由机器生成的多语言数据集，主要用于语言建模任务。该数据集基于LAMBADA数据集构建，包含德语、英语、西班牙语、法语和意大利语等多种语言。数据集的大小在1K到10K之间，具体包含5153个测试样本。数据集的特征是文本，数据类型为字符串。

The LAMBADA OpenAI dataset is a machine-generated multilingual translation dataset, suitable for language modeling tasks. It includes versions in German, English, Spanish, French, and Italian, each with a default configuration containing text features, and each configuration has a test set with the number of samples between 1K and 10K.

提供机构：

marcob

原始信息汇总

LAMBADA OpenAI 数据集概述

基本信息

名称: LAMBADA OpenAI
语言创建者: 机器生成
许可证: MIT
多语言性: 翻译
任务类型: 语言建模
源数据集: lambada
大小类别: 1K<n<10K
语言: 德语 (de), 英语 (en), 西班牙语 (es), 法语 (fr), 意大利语 (it)

数据集配置

默认配置
- 特征:
  - 名称: text
  - 数据类型: string
- 分割:
  - 名称: test
  - 样本数量: 5153
英语配置
- 特征:
  - 名称: text
  - 数据类型: string
- 分割:
  - 名称: test
  - 样本数量: 5153
意大利语配置
- 特征:
  - 名称: text
  - 数据类型: string
- 分割:
  - 名称: test
  - 样本数量: 5153

5,000+

优质数据集

54 个

任务类型

进入经典数据集