five

Jonathan916/my-cool-dataset

收藏
Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Jonathan916/my-cool-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
We only provide video URLs. Text/Captions are generated by [BLIP-2](https://huggingface.co/Salesforce/blip2-opt-2.7b). Please follow [open-source agreement](https://opensource.org/license/mit/) for any usage. DATA PREPARATION 1. Download youtube videos to the folder '$workdir/download_videos' with the urls provided in metafiles, and name the videos with their video_id. e.g. url: https://www.youtube.com/watch?v=--4M68p_Loc - $workdir - download_videos - --4M68p_Loc.mp4 We do not provide an official script for downloading YouTube videos. You may consider using the open-source youtube-dl (https://github.com/ytdl-org/youtube-dl). 2. Split HDVG clips with 'cut_videos_hdvg.py'

本数据集仅提供视频链接,文本/字幕由BLIP-2(https://huggingface.co/Salesforce/blip2-opt-2.7b)生成。任何使用行为均需遵循MIT开源协议(https://opensource.org/license/mit/)。 ## 数据准备 1. 根据元文件中提供的视频链接,将YouTube视频下载至`$workdir/download_videos`文件夹,并以视频ID命名该视频文件。示例: 链接:https://www.youtube.com/watch?v=--4M68p_Loc 对应的目录结构: - $workdir - download_videos - --4M68p_Loc.mp4 本数据集未提供官方的YouTube视频下载脚本,您可使用开源工具youtube-dl(https://github.com/ytdl-org/youtube-dl)完成下载。 2. 使用`cut_videos_hdvg.py`脚本分割HDVG视频片段。
提供机构:
Jonathan916
原始信息汇总

数据集概述

数据来源

  • 数据集仅提供视频URL。

文本/字幕生成

  • 文本/字幕由BLIP-2生成。

数据准备

  1. 视频下载

    • 将YouTube视频下载至文件夹$workdir/download_videos,视频命名使用其视频ID。
    • 示例结构:
      • $workdir
        • download_videos
          • 视频ID.mp4
    • 未提供官方下载脚本,建议使用开源工具youtube-dl
  2. 视频剪辑

    • 使用cut_videos_hdvg.py脚本分割HDVG格式的视频片段。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作