P.1203 Open Dataset
收藏github2023-06-21 更新2024-05-31 收录
下载链接:
https://github.com/itu-p1203/open-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该开放数据集来自ITU-T P.1203标准化程序(P.NATS),包含2个训练数据库和2个验证数据库,以及不同模式下的特征数据、主观评级和基于itu-p1203版本1.2.1的模型输出分数。数据集用于HTTP自适应流媒体QoE评估,并提供了详细的文件布局和使用说明。
This open dataset originates from the ITU-T P.1203 standardization process (P.NATS), encompassing two training databases and two validation databases, along with feature data under various modes, subjective ratings, and model output scores based on ITU-P1203 version 1.2.1. The dataset is utilized for HTTP adaptive streaming QoE (Quality of Experience) evaluation and provides detailed file layouts and usage instructions.
创建时间:
2018-02-21
原始信息汇总
数据集概述
数据集名称
- P.1203 Open Dataset
数据集内容
- 数据库:包含2个训练数据库和2个验证数据库。
- 特征数据:
- Mode 0 (metadata-level)
- Mode 1 (packet-header-level)
- Mode 2 (bitstream-level, 2 percent)
- Mode 3 (bitstream-level)
- 主观评分:包含主观MOS评分及其95%置信区间。
- 模型输出:基于
itu-p1203版本1.2.1的模型输出分数。
数据集文件布局
- 特征文件:
features/features_mode0.csvfeatures/features_mode1.csvfeatures/features_mode2.tar.bz2features/features_mode3.tar.bz2
- 主观评分文件:
subjective_scores/mos.csvsubjective_scores/ratings.csv
- 模型输出文件:
O21.csvO22.csvO46.csv
- 模型输入与输出详细文件:
mode0至mode3各模式下,每个PVS和上下文(PC/mobile)的JSON文件。
性能指标
- 模型性能:提供了移动和PC两种上下文下的不同模式(0至3)的平均RMSE、平均RMSE*、平均PLCC和平均SROCC。
使用要求
- 使用此数据集进行研究时,需包含此仓库链接并引用相关出版物。
版权与许可
- 版权所有者:Deutsche Telekom AG, Ericsson AB, NETSCOUT Systems Inc.
- 许可:免费提供用于非商业研究目的。数据集按“原样”提供,不提供任何明示或暗示的保证。
开发者与贡献者
- 主要开发者:David Lindegren (Ericsson AB), Werner Robitza (Deutsche Telekom AG / Technische Universität Ilmenau)
- 贡献者:包括Marie-Neige Garcia, Steve Göring, Alexander Raake等。
搜集汇总
数据集介绍

构建方式
P.1203开放数据集的构建基于ITU-T P.1203标准化程序(P.NATS),涵盖了两种训练和两种验证数据库。数据集包含多种模式的特征数据,包括元数据级别(Mode 0)、数据包头级别(Mode 1)、比特流级别(Mode 2和Mode 3)。此外,数据集还提供了主观评分和基于`itu-p1203`版本1.2.1的模型输出分数。数据集的构建过程中,特征数据通过测量窗口进行解析,并生成了多个CSV文件,分别对应不同的模式。
特点
P.1203开放数据集的特点在于其多层次的视频质量评估模式,涵盖了从元数据到比特流的多个粒度。数据集提供了丰富的特征数据,包括视频编码参数、显示分辨率、帧率等,能够支持不同层次的视频质量分析。此外,数据集还包含了主观评分和模型输出分数,使得研究者能够进行多维度的质量评估。数据集的设计考虑了移动和PC两种场景,确保了其在不同应用环境下的适用性。
使用方法
使用P.1203开放数据集时,首先需要安装Python 3并安装所需的依赖库。数据集的特征文件以`.tar.bz2`格式存储,需解压后使用。通过运行`create_model_outputs.py`脚本,可以重新计算模型输出。数据集的使用方法还包括对主观评分和模型输出分数的分析,研究者可以根据需要选择不同的模式进行视频质量评估。此外,数据集提供了详细的模型输入和输出文件,便于研究者进行进一步的分析和验证。
背景与挑战
背景概述
P.1203 Open Dataset是由国际电信联盟(ITU-T)P.1203标准化程序(P.NATS)开发的一个开放数据集,旨在为HTTP自适应流媒体(HAS)的质量体验(QoE)评估提供支持。该数据集由多个研究机构共同开发,包括德国电信、爱立信、NETSCOUT等,主要研究人员包括Werner Robitza、Steve Göring和Alexander Raake等。数据集的核心研究问题是通过多层次的视频特征数据(如元数据、包头信息和比特流信息)来预测用户的主观质量评分。该数据集自2018年发布以来,已成为流媒体质量评估领域的重要基准,广泛应用于学术界和工业界的研究中。
当前挑战
P.1203 Open Dataset在解决流媒体质量评估问题时面临多重挑战。首先,流媒体质量评估本身具有高度复杂性,涉及视频编码、网络传输、用户设备等多方面因素,如何准确捕捉这些因素对用户体验的影响是一个核心难题。其次,数据集的构建过程中,研究人员需要处理大量异构数据,包括不同层次的视频特征和主观评分数据,这对数据清洗和整合提出了较高要求。此外,数据集在早期版本中曾出现计算错误,导致模型输入数据不准确,这一问题虽已修正,但也凸显了数据质量控制的重要性。最后,如何在不同设备(如移动设备和PC)上保持模型的一致性和准确性,也是该数据集面临的重要挑战之一。
常用场景
经典使用场景
P.1203 Open Dataset 在多媒体质量评估领域具有广泛的应用。该数据集通过提供不同模式下的特征数据和主观评分,为研究人员提供了丰富的实验材料。特别是在HTTP自适应流媒体(HAS)质量评估中,数据集被用于验证和优化ITU-T P.1203标准模型,帮助研究者深入理解视频流在不同网络条件下的表现。
实际应用
在实际应用中,P.1203 Open Dataset 被广泛用于流媒体服务提供商的视频质量监控和优化。通过分析数据集中的特征数据和主观评分,服务提供商可以更好地理解用户在不同设备和网络环境下的观看体验,从而优化视频编码和传输策略。此外,数据集还被用于开发自动化质量评估工具,帮助企业在实时流媒体传输中快速检测和修复质量问题。
衍生相关工作
P.1203 Open Dataset 的发布催生了一系列相关研究工作,尤其是在多媒体质量评估和流媒体优化领域。基于该数据集,研究者们开发了多种改进的QoE(Quality of Experience)评估模型,并提出了新的视频编码和传输策略。此外,数据集还被用于跨学科研究,如网络拥塞控制、用户体验优化等,进一步扩展了其在多媒体领域的应用范围。
以上内容由遇见数据集搜集并总结生成



