davanstrien/YouTube-Commons-en-sample

Name: davanstrien/YouTube-Commons-en-sample
Creator: davanstrien
Published: 2024-06-12 08:55:13
License: 暂无描述

Hugging Face2024-06-12 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/davanstrien/YouTube-Commons-en-sample

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含视频相关的信息，如视频ID、视频链接、标题、文本内容、频道名称、频道ID、发布日期、许可证信息、原始语言、语言识别方法、转录语言、单词计数和字符计数。数据集主要用于训练，包含41,970个样本，总大小为688,300,579字节。

提供机构：

davanstrien

原始信息汇总

数据集概述

config_name: default
- data_files:
  - split: train
  - path: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集