MultiLive_dataset
收藏github2024-02-26 更新2024-05-31 收录
下载链接:
https://github.com/STAR-Tsinghua/MultiLive_dataset
下载链接
链接失效反馈官方服务:
资源简介:
我们收集并发布了超过72小时的uplink和downlink throughput数据,这些数据来自三个地理位置分布的商业直播流媒体服务器,作为开源数据集。
We have collected and released over 72 hours of uplink and downlink throughput data, sourced from three geographically distributed commercial live streaming servers, as an open-source dataset.
创建时间:
2020-01-15
原始信息汇总
数据集概述
数据集名称
MultiLive_dataset
数据集内容
- 类型:Uplink and downlink throughput trace
- 来源:Commercial live streaming servers
- 时长:超过72小时
- 分布:三个地理位置分布的服务器
数据集文件详情
-
publishResult_date.txt
- 数据类型:Uplink throughput data (kbps)
- 结构:
- 每段以Stream ID开始,指示后续数据行属于该Stream ID。
- 每行包含:
- 1: Timestamp (ms) to receive the frame data
- 2: The size of the frame data
- 3: I frame identification (0: non-I frame; 1: I frame)
- 4: Network transmission rate (kbps)
- 帧率(FPS)每1000ms更新一次。
-
liveldResult_date.txt
- 数据类型:Downlink throughput data (kbps)
- 结构:
- 每段以Stream ID开始,指示后续数据行属于该Stream ID。
- 网络传输率(kbps)每500ms更新一次。
搜集汇总
数据集介绍

构建方式
MultiLive_dataset的构建基于对商业直播服务器的上行和下行吞吐量数据的采集。研究团队从三个地理分布广泛的商业直播服务器中,收集了超过72小时的实时数据,并将其开源发布。数据采集过程中,上行吞吐量数据以毫秒级时间戳记录每帧数据的接收时间、帧数据大小、I帧标识以及网络传输速率,而下行吞吐量数据则以500毫秒为间隔更新网络传输速率。
特点
MultiLive_dataset的特点在于其数据的实时性和地理分布的广泛性。数据集不仅包含了上行和下行吞吐量的详细记录,还通过时间戳和帧标识提供了精确的数据分析基础。上行数据的帧率每1000毫秒更新一次,而下行数据的网络传输速率每500毫秒更新一次,确保了数据的高频采样和实时性。此外,数据集中的每个数据段均以流ID标识,便于用户对不同流的数据进行区分和分析。
使用方法
MultiLive_dataset的使用方法相对直观,用户可以通过流ID对数据进行分类和分析。上行吞吐量数据文件中的每一行包含时间戳、帧数据大小、I帧标识和网络传输速率,用户可以根据这些信息进行帧级别的网络性能分析。下行吞吐量数据文件则以500毫秒为间隔记录网络传输速率,用户可以通过这些数据评估网络的实时传输性能。数据集的开源性质使得研究人员可以自由地将其应用于直播流媒体的自适应码率控制、网络性能优化等领域的研究。
背景与挑战
背景概述
MultiLive_dataset数据集由研究人员在2020年发布,旨在为低延迟多端交互式直播流媒体提供上行和下行吞吐量数据。该数据集由三个地理分布的商业直播服务器采集,涵盖了超过72小时的测量数据。数据集的核心研究问题聚焦于如何通过自适应比特率控制技术优化直播流媒体的传输效率与用户体验。MultiLive_dataset的发布为学术界和工业界提供了宝贵的实验数据,推动了低延迟直播流媒体领域的研究进展,并在INFOCOM'2020会议上得到了广泛关注。
当前挑战
MultiLive_dataset在解决低延迟多端交互式直播流媒体领域问题时,面临的主要挑战包括如何在高动态网络环境下实现稳定的比特率控制,以及如何在多端交互场景中平衡延迟与传输质量。在数据集构建过程中,研究人员需克服数据采集的复杂性,包括从多个地理分布的服务器同步获取高精度吞吐量数据,并确保数据的完整性与一致性。此外,数据格式的设计与处理也需兼顾高效性与可扩展性,以支持后续的深度分析与算法验证。
常用场景
经典使用场景
MultiLive_dataset数据集在实时流媒体传输领域具有重要应用,特别是在多参与者互动直播场景中。通过提供上行和下行吞吐量的详细追踪数据,该数据集为研究人员和开发者提供了一个宝贵的资源,用于分析和优化实时视频流的传输效率和质量。
衍生相关工作
MultiLive_dataset的发布催生了一系列相关研究,特别是在自适应比特率控制和低延迟流媒体传输领域。基于该数据集,研究人员开发了多种先进的算法和模型,如MultiLive算法,这些工作不仅推动了学术研究的进展,也为工业界提供了实用的解决方案,进一步提升了实时流媒体的传输效率和用户体验。
数据集最近研究
最新研究方向
在实时流媒体技术领域,MultiLive_dataset为研究者提供了宝贵的上行和下行吞吐量数据,这些数据源自三个地理分布的商业直播服务器。随着5G网络的普及和云游戏、远程会议等应用的兴起,低延迟、高质量的流媒体传输成为研究热点。该数据集的最新研究方向聚焦于自适应码率控制算法的优化,以应对多用户交互式直播中的网络波动和带宽限制。通过分析这些数据,研究者能够开发出更加智能的码率调整策略,从而提升用户体验,减少卡顿和延迟。此外,该数据集还为网络拥塞控制、QoE(体验质量)评估等前沿研究提供了坚实的基础,推动了流媒体技术的进一步发展。
以上内容由遇见数据集搜集并总结生成



