FairStream
收藏arXiv2024-10-28 更新2024-10-30 收录
下载链接:
https://github.com/jw3il/fairstream
下载链接
链接失效反馈官方服务:
资源简介:
FairStream是一个用于强化学习代理的多媒体流媒体基准数据集,由达姆施塔特工业大学多媒体通信实验室创建。该数据集旨在模拟真实世界中的多媒体流媒体环境,包含部分可观测性、多目标优化、代理异质性和异步性等挑战。数据集内容包括多个异构客户端在共享瓶颈链路上的流媒体行为,每个客户端根据局部观测选择下一个片段的质量级别。数据集的创建过程基于动态自适应流媒体(DASH)模型,通过模拟不同网络条件下的流媒体行为来生成数据。该数据集主要应用于强化学习领域,旨在解决多媒体流媒体中的公平性和质量优化问题。
提供机构:
达姆施塔特工业大学多媒体通信实验室
创建时间:
2024-10-28
原始信息汇总
FairStream: Fair Multimedia Streaming Environment
概述
FairStream 是一个异步多智能体环境,兼容 RLlib 2.10。在该环境中,智能体代表异构客户端,通过共享连接流式传输按需多媒体内容。目标是在给定时间变化的带宽下,联合优化每个客户端的体验质量和所有客户端的公平性。客户端基于分段控制其流比特率,使用部分观察和异构需求,导致每个客户端的奖励函数不同。
安装
- 推荐使用 pip 安装,建议创建新的 Python 环境。
- 依赖项列在
pyproject.toml中。 - 环境需要运行轨迹,可以单独定义或下载(见网络轨迹部分)。
入门指南
- 通过运行
python src/example.py确认安装成功。 - 该命令将在环境中运行随机智能体,并打印每一步的状态信息。
网络轨迹
- 从 FCC Raw Data Releases 提取轨迹,包括 2022 年和 2023 年的数据。
- 使用
python src/traces/cook.py生成轨迹数据集和相关图表。 - 数据集保存在
./cooked_traces,图表保存在./plots_traces。 - 轨迹数据集分为训练、验证和测试数据集。
训练与评估
- 使用
src/main.py进行训练和评估。 - 提供多种训练和评估选项,可通过 CLI 调整。
- 提供自定义评估函数,允许跟踪每个智能体的多种指标。
- 使用自定义评估时,建议设置
export TUNE_DISABLE_AUTO_CALLBACK_LOGGERS=1以防止生成非常大的结果文件。
分析与图表
- 使用 TensorBoard 监控训练过程。
- 提供各种脚本创建结果图表,包括论文中使用的图表。
搜集汇总
数据集介绍

构建方式
FairStream数据集的构建基于动态自适应流媒体传输(DASH)模型,通过模拟多客户端环境下的多媒体流媒体传输,涵盖了部分可观测性、多目标优化、代理异质性和异步性等多重挑战。数据集包含了五个不同流量类别的基准测试套件,以详细分析所考虑代理的行为。构建过程中,采用了联邦通信委员会(FCC)提供的宽带连接测量数据,通过缩放和过滤处理,生成了176,873条带宽变化的网络轨迹,这些轨迹被分为训练、验证和测试集,以确保数据集的多样性和代表性。
特点
FairStream数据集的主要特点在于其复杂的多代理环境,能够模拟真实世界中多媒体流媒体传输的多种挑战。数据集包含了异质客户端的多样化需求,以及时间变化带宽的网络条件,这使得数据集在训练强化学习代理时具有高度的现实性和挑战性。此外,数据集提供了详细的基准测试结果,展示了不同算法在公平多媒体流媒体环境中的表现,为未来的研究提供了坚实的基础。
使用方法
FairStream数据集适用于训练和评估多代理强化学习算法在多媒体流媒体环境中的表现。研究者可以使用该数据集来开发和测试新的算法,以优化流媒体质量(QoE)和公平性。数据集的详细记录和基准测试结果为算法开发者提供了宝贵的参考,帮助他们理解和改进在复杂网络条件下的流媒体控制策略。此外,数据集的开源实现为研究者提供了实验和验证新想法的平台。
背景与挑战
背景概述
FairStream数据集由德国达姆施塔特工业大学的多媒体通信实验室(KOM)和澳大利亚拉筹伯大学的计算机科学与信息技术系共同创建。该数据集专注于多智能体强化学习(MARL)在多媒体流媒体中的应用,特别是自适应比特率流媒体控制。FairStream数据集的创建旨在解决在网络条件波动下选择最优比特率的挑战,同时考虑多个流媒体客户端之间的公平性。该数据集提供了一个包含部分可观测性、多目标优化、智能体异质性和异步性等多重挑战的多智能体环境。通过分析五个不同流量类别的基准方法,FairStream数据集为研究者提供了深入了解所考虑智能体行为的详细见解。
当前挑战
FairStream数据集面临的挑战主要包括:1) 在部分可观测性和多目标优化的通信系统中,智能体无法观测到完整的系统状态,这增加了网络监控的开销,并考虑了隐私和系统间的信任问题;2) 智能体异质性,即不同智能体具有不同的观测空间、动作空间、奖励函数或角色,这在实际通信系统中非常常见;3) 智能体异步性,即决策通常以事件驱动的方式异步进行,而现有的MARL环境和算法通常假设智能体是同步的。此外,构建过程中遇到的挑战包括如何在有限的带宽下实现无缝播放,以及如何在多个客户端之间实现公平的流媒体质量体验。
常用场景
经典使用场景
FairStream数据集在多媒体流媒体领域中被广泛用于训练和评估强化学习代理。其经典使用场景包括在动态自适应流媒体(DASH)模型下,模拟多个异构客户端在共享瓶颈链路上的多媒体流媒体行为。通过模拟部分可观测性、多目标优化、代理异构性和异步性等挑战,FairStream为研究者提供了一个复杂的多代理环境,以测试和改进强化学习算法在多媒体流媒体中的应用。
实际应用
在实际应用中,FairStream数据集可用于优化多媒体流媒体服务,特别是在网络条件不稳定的情况下。通过训练强化学习代理,服务提供商可以实现更平滑的播放体验和更高的用户体验质量(QoE)。此外,该数据集还可用于开发和测试新的带宽分配机制,以确保在多个客户端共享网络资源时的公平性和效率。
衍生相关工作
基于FairStream数据集,研究者们已经开展了一系列相关工作,包括改进多代理强化学习算法、探索新的带宽分配策略以及研究异步代理间的协调机制。例如,一些研究通过引入多目标强化学习方法,优化了代理在质量和公平性之间的权衡。此外,还有研究探讨了在异步环境下,通过学习通信来提高代理间的协作效率。这些衍生工作不仅扩展了FairStream的应用范围,也为多媒体流媒体领域的进一步研究提供了新的方向。
以上内容由遇见数据集搜集并总结生成



