five

czyang/MultiFoley-VGGSound-Test-Audio

收藏
Hugging Face2025-02-05 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/czyang/MultiFoley-VGGSound-Test-Audio
下载链接
链接失效反馈
官方服务:
资源简介:
这个数据集包含了基于MultiFoley工作的筛选后的VGGSound测试用例生成的结果。对于每个8秒的视频,生成了4个样本,这些样本是通过无声视频和文本(简化为VGGSound类别名称)输入生成的。每个音频文件按照特定的格式命名,包括类别名称、唯一标识符、开始时间和索引。整个数据集的大小约为25GB。

This dataset contains the generated results of our MultiFoley work based on the filtered VGGSound test cases. For each 8-second video, 4 samples are generated, which are produced from silent video inputs and text inputs (simplified to VGGSound category names). Each audio file is named in a specific format, including the category name, unique identifier, start time, and index. The entire dataset is approximately 25GB in size.
提供机构:
czyang
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作