Jonathan916/my-cool-dataset
收藏Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Jonathan916/my-cool-dataset
下载链接
链接失效反馈官方服务:
资源简介:
We only provide video URLs. Text/Captions are generated by [BLIP-2](https://huggingface.co/Salesforce/blip2-opt-2.7b). Please follow [open-source agreement](https://opensource.org/license/mit/) for any usage.
DATA PREPARATION
1. Download youtube videos to the folder '$workdir/download_videos' with the urls provided in metafiles, and name the videos with their video_id.
e.g. url: https://www.youtube.com/watch?v=--4M68p_Loc
- $workdir
- download_videos
- --4M68p_Loc.mp4
We do not provide an official script for downloading YouTube videos. You may consider using the open-source youtube-dl (https://github.com/ytdl-org/youtube-dl).
2. Split HDVG clips with 'cut_videos_hdvg.py'
本数据集仅提供视频链接,文本/字幕由BLIP-2(https://huggingface.co/Salesforce/blip2-opt-2.7b)生成。任何使用行为均需遵循MIT开源协议(https://opensource.org/license/mit/)。
## 数据准备
1. 根据元文件中提供的视频链接,将YouTube视频下载至`$workdir/download_videos`文件夹,并以视频ID命名该视频文件。示例:
链接:https://www.youtube.com/watch?v=--4M68p_Loc
对应的目录结构:
- $workdir
- download_videos
- --4M68p_Loc.mp4
本数据集未提供官方的YouTube视频下载脚本,您可使用开源工具youtube-dl(https://github.com/ytdl-org/youtube-dl)完成下载。
2. 使用`cut_videos_hdvg.py`脚本分割HDVG视频片段。
提供机构:
Jonathan916
原始信息汇总
数据集概述
数据来源
- 数据集仅提供视频URL。
文本/字幕生成
- 文本/字幕由BLIP-2生成。
数据准备
-
视频下载
- 将YouTube视频下载至文件夹
$workdir/download_videos,视频命名使用其视频ID。 - 示例结构:
$workdirdownload_videos视频ID.mp4
- 未提供官方下载脚本,建议使用开源工具youtube-dl。
- 将YouTube视频下载至文件夹
-
视频剪辑
- 使用
cut_videos_hdvg.py脚本分割HDVG格式的视频片段。
- 使用



