vietgpt/ted_talks_iwslt_en

Name: vietgpt/ted_talks_iwslt_en
Creator: vietgpt
Published: 2023-03-30 18:28:08
License: 暂无描述

Hugging Face2023-03-30 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/vietgpt/ted_talks_iwslt_en

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为Ted Talks，主要包含用于文本生成任务的英文文本数据。数据集的特征为text，数据类型为字符串。数据集包含一个训练集，大小为27,242,341字节，包含2,293个样本。数据集的总下载大小为15,366,817字节，总大小为27,242,341字节。数据集的语言为英语，标签为LM，规模类别为1K<n<10K。

提供机构：

vietgpt

原始信息汇总

数据集概述

基本信息

名称: Ted Talks
语言: 英语 (en)
任务类别: 文本生成 (text-generation)
标签: LM
大小类别: 1K<n<10K

数据集特征

特征名称: text
数据类型: 字符串 (string)

数据集拆分

拆分名称: train
示例数量: 2,293
字节大小: 27,242,341

下载与数据集大小

下载大小: 15,366,817 字节
数据集大小: 27,242,341 字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集