five

Whispering-GPT/two-minute-papers

收藏
Hugging Face2022-11-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Whispering-GPT/two-minute-papers
下载链接
链接失效反馈
官方服务:
资源简介:
--- task_categories: - automatic-speech-recognition dataset_info: features: - name: CHANNEL_NAME dtype: string - name: URL dtype: string - name: TITLE dtype: string - name: DESCRIPTION dtype: string - name: TRANSCRIPTION dtype: string - name: SEGMENTS dtype: string splits: - name: train num_bytes: 10435074 num_examples: 737 download_size: 4626170 dataset_size: 10435074 tags: - whisper - whispering - base --- # Dataset Card for "two-minute-papers" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

任务类别: - 自动语音识别(automatic-speech-recognition) 数据集信息: 特征字段: - 频道名称(CHANNEL_NAME):数据类型:字符串 - 链接(URL):数据类型:字符串 - 标题(TITLE):数据类型:字符串 - 描述(DESCRIPTION):数据类型:字符串 - 转录文本(TRANSCRIPTION):数据类型:字符串 - 分段信息(SEGMENTS):数据类型:字符串 数据拆分: - 训练集(train):字节大小为10435074,样本数量为737 下载大小:4626170 数据集总大小:10435074 标签: - Whisper(whisper) - 耳语语音(whispering) - 基础版(base) --- # "两分钟论文"数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Whispering-GPT
原始信息汇总

数据集概述

任务类别

  • 自动语音识别(automatic-speech-recognition)

数据集特征

  • CHANNEL_NAME:字符串类型
  • URL:字符串类型
  • TITLE:字符串类型
  • DESCRIPTION:字符串类型
  • TRANSCRIPTION:字符串类型
  • SEGMENTS:字符串类型

数据集分割

  • 训练集(train)
    • 字节数:10435074
    • 示例数:737

数据集大小

  • 下载大小:4626170字节
  • 数据集总大小:10435074字节

标签

  • whisper
  • whispering
  • base
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作