vietgpt/ted_talks_iwslt_en
收藏Hugging Face2023-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vietgpt/ted_talks_iwslt_en
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Ted Talks,主要包含用于文本生成任务的英文文本数据。数据集的特征为text,数据类型为字符串。数据集包含一个训练集,大小为27,242,341字节,包含2,293个样本。数据集的总下载大小为15,366,817字节,总大小为27,242,341字节。数据集的语言为英语,标签为LM,规模类别为1K<n<10K。
该数据集名为Ted Talks,主要包含用于文本生成任务的英文文本数据。数据集的特征为text,数据类型为字符串。数据集包含一个训练集,大小为27,242,341字节,包含2,293个样本。数据集的总下载大小为15,366,817字节,总大小为27,242,341字节。数据集的语言为英语,标签为LM,规模类别为1K<n<10K。
提供机构:
vietgpt
原始信息汇总
数据集概述
基本信息
- 名称: Ted Talks
- 语言: 英语 (en)
- 任务类别: 文本生成 (text-generation)
- 标签: LM
- 大小类别: 1K<n<10K
数据集特征
- 特征名称: text
- 数据类型: 字符串 (string)
数据集拆分
- 拆分名称: train
- 示例数量: 2,293
- 字节大小: 27,242,341
下载与数据集大小
- 下载大小: 15,366,817 字节
- 数据集大小: 27,242,341 字节



