five

Whispering-GPT/lex-fridman-podcast-transcript-audio

收藏
Hugging Face2022-12-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Whispering-GPT/lex-fridman-podcast-transcript-audio
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过应用Whisper模型对Lex Fridman Podcast的YouTube视频进行转录而创建的。数据集包含了视频的转录文本和音频,主要用于自动语音识别任务。数据集的字段包括视频ID、频道名称、频道ID、视频标题、类别、描述、完整转录文本、分段转录信息以及音频文件。数据集的语言为英语,且仅包含训练集。

This dataset was created by applying the Whisper model to transcribe YouTube videos from the Lex Fridman Podcast. It contains the transcribed texts and audio of the videos, and is primarily used for automatic speech recognition tasks. The fields of the dataset include video ID, channel name, channel ID, video title, category, description, full transcription text, segmented transcription information, and audio files. The dataset is in English and only includes the training set.
提供机构:
Whispering-GPT
原始信息汇总

数据集概述

数据集名称

  • 名称: lexFridmanPodcast-transcript-audio

任务类别

  • 类别: 自动语音识别

数据集特征

  • id: 字符串类型
  • channel: 字符串类型
  • channel_id: 字符串类型
  • title: 字符串类型
  • categories: 字符串序列
  • tags: 字符串序列
  • description: 字符串类型
  • text: 字符串类型
  • segments: 列表类型,包含:
    • start: 浮点数类型
    • end: 浮点数类型
    • text: 字符串类型
  • audio: 音频类型

数据集结构

  • 数据字段:
    • id: YouTube视频ID
    • channel: 频道名称
    • channel_id: YouTube频道ID
    • title: 视频标题
    • categories: 视频类别
    • description: 作者添加的描述
    • text: 视频全文转录
    • segments: 视频时间及转录文本
      • start: 转录开始时间
      • end: 转录结束时间
      • text: 转录文本
    • audio: 视频提取的音频,ogg格式

数据集分割

  • 训练集: 333个样本,数据大小为65356108140.0字节,下载大小为64386861854字节

语言

  • 语言: 英语

数据集来源

  • 来源: Lex Fridman Podcast视频转录

贡献者

  • 贡献组织: Whispering-GPT
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作