Brightcove Streaming Datasets
收藏github2021-12-03 更新2024-05-31 收录
下载链接:
https://github.com/brightcove/streaming-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该项目包含几个真实世界的流媒体播放统计数据示例,提供给学术研究使用。数据集描述和使用示例在相关论文中有所解释。
This project encompasses several real-world streaming playback statistics examples, provided for academic research purposes. The dataset description and usage examples are elucidated in the associated research paper.
创建时间:
2021-04-29
原始信息汇总
数据集概述
数据集名称
Brightcove Streaming Datasets
数据集描述
包含多个真实世界的流媒体播放统计数据,用于学术研究。
数据集引用文献
- T. Teixeira, B. Zhang, Y. Reznik, "Adaptive Streaming Playback Statistics Dataset," Proc. 12th ACM Multimedia Systems Conference (MMSys 21), Istanbul, Turkey. September 28-October 1, 2021.
- Y. Reznik, K. Lillevold, A. Jagannath, and X. Li, "Towards Understanding of the Behavior of Web Streaming," Proc. The Picture Coding Symposium (PCS21), Bristol, UK, June 29 - July 2, 2021.
数据集文件组织
文件按事件组织在目录中,每个目录内的文件命名遵循以下规则:eventX_playback_statistics_Y.csv,其中X代表事件编号,Y代表文件编号。
数据字段说明
| 类别 | 参数 | 描述 |
|---|---|---|
| session | session | 与每个播放器会话关联的随机生成编号 |
| session | seq | 会话内事件的顺序编号 |
| client | device_type | 设备类型(桌面、移动、平板、电视、其他) |
| client | device_os | 操作系统类型(windows、osx、linux、android、ios、webos、其他) |
| client | browser | 浏览器类型(chrome、firefox、safari、edge、ie、opera、其他) |
| client | player | 播放器类型(应用、网页) |
| client | player_width | 播放器窗口宽度(像素) |
| client | player_height | 播放器窗口高度(像素) |
| rendition | rendition_indicated_bps | 渲染比特率(bps),音频和视频比特率总和 |
| rendition | rendition_width | 视频编码宽度(像素) |
| rendition | rendition_height | 视频编码高度(像素) |
| rendition | rendition_framerate | 视频帧率(fps) |
| rendition | video_codec | 视频编解码器类型(h264、hevc、av1) |
| rendition | video_codec_profile | 视频编解码器配置文件(baseline、main、high) |
| rendition | format | 流媒体格式(hls_v3、hls_v7、dash) |
| rendition | segment_duration | 分段持续时间(秒) |
| playback | video_seconds_viewed | 在最近两次播放器事件之间播放的媒体内容秒数 |
| playback | forward_buffer_seconds | 缓冲但尚未播放的媒体内容秒数 |
| playback | rebuffering_seconds | 在最近两次播放器事件之间播放器缓冲的总秒数 |
| playback | rebuffering_count | 在最近两次播放器事件之间播放器缓冲的次数 |
| playback | media_bytes_transferred | 自会话开始以来传输的总字节数 |
| network | measured_bps | 根据最后下载分段的大小和交付时间估计的网络带宽(bps) |
搜集汇总
数据集介绍

构建方式
Brightcove Streaming Datasets 的构建基于真实的流媒体播放统计数据,旨在为学术研究提供支持。数据集通过多个事件目录组织,每个目录包含以特定命名规则命名的CSV文件,文件大小受限于GitHub的100MB限制。每个文件记录了会话、客户端、渲染、播放和网络等多个类别的详细参数,涵盖了设备类型、操作系统、浏览器、播放器类型、视频编码、播放状态等丰富信息。
特点
该数据集的特点在于其多维度的数据覆盖,能够全面反映流媒体播放的各个环节。数据集中包含了设备类型、操作系统、浏览器、播放器窗口尺寸、视频编码格式、播放状态、网络带宽等关键参数,为研究者提供了深入分析流媒体播放行为的基础。此外,数据集的真实性和多样性使其成为研究自适应流媒体播放性能的理想选择。
使用方法
使用 Brightcove Streaming Datasets 时,研究者可以通过读取CSV文件获取详细的播放统计数据。每个文件按事件和会话编号组织,便于针对特定事件或会话进行深入分析。数据集中的参数可用于研究流媒体播放的缓冲行为、网络带宽对播放质量的影响、不同设备和浏览器的播放性能差异等。通过引用相关论文,研究者可以在学术研究中充分利用该数据集,推动流媒体技术的进一步发展。
背景与挑战
背景概述
Brightcove Streaming Datasets是由Thiago Teixeira、Bo Zhang和Yuriy Reznik等研究人员于2021年发布的一个面向学术研究的流媒体播放统计数据集。该数据集旨在为自适应流媒体播放行为的研究提供真实世界的播放统计数据,涵盖了多种设备类型、操作系统、浏览器、播放器类型以及视频编码格式等详细信息。该数据集的研究背景源于对流媒体播放行为的深入理解需求,特别是在不同网络条件和设备环境下的播放性能优化。通过该数据集,研究人员可以分析流媒体播放中的关键指标,如缓冲时间、播放中断次数、网络带宽等,从而推动自适应流媒体技术的进步。该数据集已在ACM Multimedia Systems Conference (MMSys '21)等国际会议上发表,对流媒体领域的研究具有重要影响力。
当前挑战
Brightcove Streaming Datasets在解决流媒体播放行为分析问题时面临多重挑战。首先,流媒体播放行为受到多种因素的影响,如网络带宽波动、设备性能差异、视频编码格式等,如何准确捕捉并分析这些复杂因素对播放性能的影响是一个关键挑战。其次,数据集的构建过程中,研究人员需要处理大规模的真实世界数据,确保数据的完整性和一致性,同时还要应对数据隐私和安全问题。此外,由于流媒体技术的快速演进,数据集需要不断更新以反映最新的播放行为和编码标准,这对数据集的维护和扩展提出了更高的要求。这些挑战不仅考验了数据集的构建技术,也为流媒体领域的研究提供了丰富的探索空间。
常用场景
经典使用场景
Brightcove Streaming Datasets 在多媒体系统研究领域中被广泛用于分析自适应流媒体的播放行为。通过该数据集,研究人员能够深入探讨不同设备、操作系统和浏览器对流媒体播放质量的影响,进而优化流媒体传输策略。数据集中的播放统计信息为研究流媒体缓冲、卡顿和带宽利用率提供了丰富的数据支持。
解决学术问题
该数据集解决了自适应流媒体传输中的关键学术问题,如如何在不同网络条件下优化视频质量和用户体验。通过分析播放统计数据,研究人员能够识别流媒体传输中的瓶颈,并提出改进算法以减少卡顿和提高播放流畅性。此外,数据集还为研究不同编码格式和分辨率对播放质量的影响提供了实验基础。
衍生相关工作
基于 Brightcove Streaming Datasets,许多经典研究工作得以展开。例如,Teixeira 等人在 MMSys '21 上发表的论文提出了基于播放统计数据的自适应流媒体优化算法。此外,Reznik 等人在 PCS '21 上的研究进一步探讨了网络带宽波动对播放行为的影响。这些研究不仅推动了流媒体技术的发展,还为后续的学术研究提供了重要的参考。
以上内容由遇见数据集搜集并总结生成



