five

retkowski/ytseg

收藏
Hugging Face2024-04-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/retkowski/ytseg
下载链接
链接失效反馈
官方服务:
资源简介:
YTSeg是一个基于YouTube转录文本的文本分割任务多样化基准数据集,包含19,299个来自393个频道的视频,总计6,533小时内容。主题广泛,覆盖科学、生活方式、政治、健康、经济和技术等多个领域。视频类型多样,包括播客、讲座、新闻、企业活动和宣传内容等。数据集提供文本、音频数据及视频下载脚本。
提供机构:
retkowski
原始信息汇总

数据集概述

数据集名称

YTSeg

数据集用途

用于文本分割任务的基准数据集。

数据集规模

  • 视频数量:19,299个
  • 频道数量:393个
  • 总时长:6,533小时

内容范围

涵盖广泛的主题,包括但不限于:

  • 科学
  • 生活方式
  • 政治
  • 健康
  • 经济
  • 技术

内容类型

视频来源于多种格式,如:

  • 播客
  • 讲座
  • 新闻
  • 企业活动与推广内容
  • 个人内容创作者的视频

数据提供

  • 文本数据
  • 音频数据
  • 视频数据下载脚本
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作