retkowski/ytseg
收藏Hugging Face2024-04-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/retkowski/ytseg
下载链接
链接失效反馈官方服务:
资源简介:
YTSeg是一个基于YouTube转录文本的文本分割任务多样化基准数据集,包含19,299个来自393个频道的视频,总计6,533小时内容。主题广泛,覆盖科学、生活方式、政治、健康、经济和技术等多个领域。视频类型多样,包括播客、讲座、新闻、企业活动和宣传内容等。数据集提供文本、音频数据及视频下载脚本。
提供机构:
retkowski
原始信息汇总
数据集概述
数据集名称
YTSeg
数据集用途
用于文本分割任务的基准数据集。
数据集规模
- 视频数量:19,299个
- 频道数量:393个
- 总时长:6,533小时
内容范围
涵盖广泛的主题,包括但不限于:
- 科学
- 生活方式
- 政治
- 健康
- 经济
- 技术
内容类型
视频来源于多种格式,如:
- 播客
- 讲座
- 新闻
- 企业活动与推广内容
- 个人内容创作者的视频
数据提供
- 文本数据
- 音频数据
- 视频数据下载脚本
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



