RamAnanth1/talkrl-podcast
收藏Hugging Face2023-01-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/RamAnanth1/talkrl-podcast
下载链接
链接失效反馈官方服务:
资源简介:
该数据集来源于TalkRL Podcast网站,包含使用OpenAI的Whisper模型生成的播客集英文转录。数据集包括标题、摘要、链接、转录文本和分段信息,分段信息包括结束时间、开始时间和文本。数据集分为训练集,包含39个例子,总大小为4845076字节。任务类别包括文本分类、文本生成和摘要,语言为英语,大小类别为小于1K。
提供机构:
RamAnanth1
原始信息汇总
数据集概述
数据集名称
- 名称: TalkRL Podcast
数据集特征
- 特征列表:
title: 数据类型 - stringsummary: 数据类型 - stringlink: 数据类型 - stringtranscript: 数据类型 - stringsegments: 列表类型,包含以下子特征:end: 数据类型 - float64start: 数据类型 - float64text: 数据类型 - string
数据集分割
- 训练集:
num_examples: 39num_bytes: 4845076
数据集大小
- 下载大小: 2633561 bytes
- 数据集大小: 4845076 bytes
任务类别
- text-classification
- text-generation
- summarization
语言
- en
大小类别
- n<1K



