DCUtR测量数据集
收藏arXiv2025-10-31 更新2025-11-04 收录
下载链接:
https://probelab.io/ipfs/kpi
下载链接
链接失效反馈官方服务:
资源简介:
该数据集收集了超过440万次穿越尝试,来自85,000多个不同的网络,横跨167个国家,用于评估DCUtR协议在真实世界中的性能。数据集内容详尽,包含了直接连接建立阶段的成功率,以及与TCP和QUIC协议的成功率比较。该数据集的创建过程是基于大规模的测量活动,旨在验证DCUtR协议的有效性。该数据集广泛应用于P2P网络、NAT穿越和现代互联网特征研究。
This dataset comprises over 4.4 million traversal attempts sourced from more than 85,000 distinct networks across 167 countries, and is constructed to assess the real-world performance of the DCUtR protocol. It features comprehensive content, including the success rates of the direct connection establishment phase, as well as success rate comparisons against the TCP and QUIC protocols. This dataset was developed through large-scale Internet measurement campaigns, with the core goal of validating the effectiveness of the DCUtR protocol. It is widely employed in research on peer-to-peer (P2P) networks, Network Address Translation (NAT) traversal, and modern Internet characteristics.
提供机构:
德国哥廷根大学
创建时间:
2025-10-31
搜集汇总
数据集介绍

构建方式
在去中心化网络架构日益重要的背景下,DCUtR测量数据集通过精心设计的测量基础设施构建而成。研究团队部署了由蜜罐节点、服务器组件和客户端组成的分布式系统,蜜罐节点通过缓慢遍历分布式哈希表吸引NAT后方对等体建立中继连接,服务器组件通过gRPC接口为客户端提供待探测节点信息,客户端则执行实际的NAT穿透尝试。整个测量活动历时一个月,覆盖167个国家超过8.5万个独立网络,最终收集了440万次穿透尝试的详细数据,为研究去中心化NAT穿透协议提供了前所未有的实证基础。
特点
该数据集最显著的特征在于其规模宏大且时空跨度广泛,不仅记录了穿透尝试的最终结果,还详细捕获了每次尝试的完整协议交互过程。数据集包含多维度测量指标,包括往返时间测量、中继节点特性、传输协议性能对比等关键参数。特别值得注意的是,数据集通过协议过滤器机制实现了对TCP和QUIC传输协议的独立评估,为验证协议传输无关性提供了独特视角。此外,数据集还包含了连接反转优化效果的实证数据,以及网络环境异质性对穿透成功率影响的详细记录。
使用方法
研究人员可通过数据集提供的结构化接口深入分析去中心化NAT穿透协议的实际性能。数据集支持对穿透成功率的统计建模,允许研究者考察不同网络环境、NAT类型和传输协议对穿透效果的影响。使用时可首先通过连接事件表识别符合条件的对等体,继而结合穿透结果表分析协议效能,利用延迟测量数据评估路径优化效果。数据集还支持对中继节点选择策略的评估,以及连接反转等优化机制有效性的验证,为协议改进提供数据支撑。所有数据均采用标准数据库格式存储,便于进行复杂的联合查询和统计分析。
背景与挑战
背景概述
DCUtR测量数据集由哥廷根大学与FIZ Karlsruhe研究机构于2025年联合发布,聚焦于去中心化网络环境下的NAT穿透技术研究。该数据集源于对IPFS生产网络中DCUtR协议的大规模实证分析,涵盖167个国家、超过8.5万个独立网络的440万次穿透尝试,首次为完全去中心化的NAT穿透协议建立了70%±7.1%的基准成功率。该研究颠覆了传统认知中UDP协议在NAT穿透领域的优势地位,揭示了基于RTT的精确同步机制可实现TCP与QUIC协议的等效性能,为去中心化网络架构的发展提供了关键实证基础。
当前挑战
该数据集面临双重挑战:在领域问题层面,需解决去中心化P2P系统中NAT设备导致的连接障碍,特别是对称型NAT对直接连接的阻断问题;在构建过程中,需克服NAT环境下的节点发现难题——传统DHT机制仅能发现公开节点,而目标NAT节点因无法直接寻址而难以定位。研究团队通过设计蜜罐节点主动吸引NAT节点连接,并开发多组件测量架构实现协议过滤与数据收集,最终在确保伦理合规的前提下构建了覆盖全球的大规模实验数据集。
常用场景
经典使用场景
在分布式网络研究领域,DCUtR测量数据集为评估去中心化NAT穿透协议的实际效能提供了关键实证基础。该数据集通过记录超过440万次穿越尝试,涵盖了来自167个国家、8.5万余个独立网络的连接数据,成为研究现代对等网络连通性的核心基准。研究人员通过分析协议在不同网络环境下的连接建立成功率、往返时延变化及传输协议表现,能够深入理解去中心化网络在真实互联网环境中的连通特性。
解决学术问题
该数据集有效解决了去中心化网络架构中长期存在的NAT穿透难题,为验证协议设计的实际效能提供了量化依据。通过实证分析,数据集推翻了传统认知中UDP协议在NAT穿透方面的固有优势,证明基于精确时间同步的TCP与QUIC协议可实现近似70%的等效成功率。这一发现革新了网络协议设计的理论基础,同时为构建不依赖中心化基础设施的完全分布式网络提供了关键技术支撑,显著推动了去中心化网络架构的实用化进程。
衍生相关工作
基于该数据集开展的衍生研究已催生多项重要成果,包括协议时序优化策略、传输层适应性改进方案以及新型NAT行为建模方法。研究团队提出的生日悖论概率穿透技术,通过创新性地应用组合数学原理解决了端点依赖型NAT的穿透难题。此外,数据集支撑的异步路由RTT计算方法和角色交替重试机制,为后续协议栈优化提供了明确的技术路线,推动了整个去中心化网络研究领域的方法论革新。
以上内容由遇见数据集搜集并总结生成



