Sports-1M 体育运动数据集
收藏帕依提提2024-03-04 收录
下载链接:
https://www.payititi.com/opendatasets/show-2029.html
下载链接
链接失效反馈官方服务:
资源简介:
Sports-1M 数据集在知识共享 3.0 下获得许可,包含 1,133,158 个视频 URL,这些 URL 使用 YouTube 主题 API 用 487 个体育标签自动注释。要下载数据集,请查看我们的 Github 存储库,或者直接使用: 然后查看随附的 README 以了解详细信息。这是 487 个类(7MB html 页面)中每个类的一些缩略图的可视化。JSON 格式的所有视频的详细信息 (53MB zip)。示例条目: 一个常见的问题是如何管理这种规模的数据。我们要注意的是,我们发布的 JSON 信息包含所有视频的时长,因此可以过滤到仅低于某个时长阈值的视频。另一个想法是立即从视频中采样帧/片段,而不是存储完整的原始文件,或者甚至在空间分辨率下立即将它们进一步调整为 227x277。因此,大部分数据集 (90%+) 最多可以达到几个 TB。
The Sports-1M dataset is licensed under Creative Commons 3.0, and comprises 1,133,158 video URLs that were automatically annotated with 487 sports tags via the YouTube Topics API. To download the dataset, please visit our GitHub repository or directly access the relevant resources, then refer to the accompanying README for detailed instructions. This is a visualization of sample thumbnails for each of the 487 classes (7MB HTML page). Detailed information of all videos is provided in JSON format (53MB zip archive). Example entry: A common question regarding this dataset is how to manage data at this scale. It is worth noting that the JSON metadata we released includes the duration of every video, allowing users to filter out videos that fall below a specified duration threshold. Another practical strategy is to directly sample frames or clips from the videos instead of storing complete raw files, or even resize them to 227×277 at their native spatial resolution on the fly. As a result, the total size of over 90% of this dataset will be up to several terabytes.
提供机构:
帕依提提
搜集汇总
数据集介绍

背景与挑战
背景概述
Sports-1M是一个包含1,133,158个体育相关视频URL的数据集,使用487个体育标签进行自动注释,以JSON格式提供视频详细信息。数据集规模较大,但提供了下载和处理建议,适合体育视频分析研究。
以上内容由遇见数据集搜集并总结生成



