five

Brazilian ASN and IP Blocks Dataset

收藏
github2025-07-10 更新2025-07-11 收录
下载链接:
https://github.com/incogbyte/yankenicbr
下载链接
链接失效反馈
官方服务:
资源简介:
该存储库提供了一个每日更新的、结构化的巴西自治系统号码(ASNs)及其相关IP地址块的数据集。数据自动从巴西网络信息中心(NIC.br)提供的官方文件中获取和解析。

This repository provides a dataset of structured Brazilian autonomous system numbers (ASNs) and their associated IP address blocks, updated daily. The data is automatically retrieved and parsed from the official files provided by the Brazilian Network Information Center (NIC.br).
创建时间:
2025-07-04
原始信息汇总

Brazilian ASN and IP Blocks Dataset 概述

数据集简介

  • 提供巴西自治系统号(ASN)及其关联IP地址块的每日更新结构化数据集
  • 数据来源:巴西网络信息中心(NIC.br)的官方文件
  • 用途:网络分析、安全研究等应用

自动化处理流程

  1. 数据获取:每日自动下载最新版本文件
  2. 数据结构化:将原始信息转换为结构化格式
  3. 数据提交:生成的新文件自动提交至仓库,确保数据时效性

数据文件

位于data/目录下的三种格式文件:

1. all_data.json

  • 格式:JSON
  • 内容:包含组织对象的数组
  • 对象结构: json { "asn": 4230, "organization": "CLARO S.A.", "document": "40.432.544/0706-09", "ip_blocks": ["200.192.0.0/18", "200.210.0.0/16"] }

2. asns.txt

  • 格式:文本文件
  • 内容:所有唯一ASN列表(按数字排序)
  • 格式:每行一个ASN

3. ips.txt

  • 格式:文本文件
  • 内容:所有唯一IP地址块列表(CIDR表示法)
  • 格式:每行一个IP块
搜集汇总
数据集介绍
main_image_url
构建方式
在互联网基础设施研究领域,巴西ASN与IP区块数据集通过自动化流程实现了高效的数据采集与处理。该数据集依托NIC.br官方数据源,采用GitHub Actions技术构建每日更新机制,通过三个标准化步骤确保数据时效性:定时抓取最新网络注册文件,对原始数据进行结构化转换,最终以版本控制方式提交至代码仓库。这种构建方式既保留了官方数据的权威性,又通过自动化流水线实现了数据的持续集成与质量管控。
特点
该数据集展现出鲜明的技术特征与实用价值,其核心优势体现在多维度的数据组织形态。原始信息被精心处理为三种互补格式:包含完整元数据的JSON文档、排序后的ASN纯文本列表以及标准CIDR格式的IP区块集。这种分层设计既支持复杂的网络拓扑分析,也能满足轻量级查询需求。特别值得注意的是,数据集通过机构名称、税务编号与网络资源的精确映射,为研究巴西互联网生态提供了关键基础设施。
使用方法
研究人员可通过GitHub仓库的data目录便捷获取不同粒度的网络数据。JSON格式适合程序化处理与深度分析,能够提取特定ASN持有者的完整网络资产;而纯文本列表则便于快速集成至防火墙规则或路由配置。对于需要持续跟踪网络变更的场景,建议通过Git订阅更新或设置自动化抓取流程,利用每日提交记录实现版本比对与差异分析。
背景与挑战
背景概述
Brazilian ASN and IP Blocks Dataset是由巴西网络信息中心(NIC.br)官方数据自动构建而成的高质量数据集,专注于提供巴西自治系统号(ASN)及其关联IP地址块的每日更新信息。该数据集由开源社区维护,旨在为网络分析、安全研究等领域提供结构化的数据支持。通过自动化流程,该数据集确保了数据的时效性和准确性,成为研究巴西网络基础设施的重要资源。其核心研究问题在于如何高效地整合和标准化分散的网络注册信息,为全球研究者提供便捷的数据访问途径。
当前挑战
该数据集面临的挑战主要包括两个方面:在领域问题层面,如何准确映射ASN与IP地址块之间的动态关联关系,以应对网络拓扑结构的频繁变化;在构建过程层面,需解决原始数据格式不一致性问题,并确保自动化抓取与解析流程的稳定性。同时,数据集还需平衡数据的全面性与隐私保护要求,特别是在处理涉及敏感信息的组织文档(如CNPJ/CPF)时。
常用场景
经典使用场景
在互联网基础设施研究中,Brazilian ASN and IP Blocks Dataset为分析巴西网络拓扑结构提供了关键数据支撑。该数据集通过每日更新的ASN与IP地址块映射关系,使研究者能够精准追踪巴西自治系统的演变规律,尤其适用于网络资源分配优化、跨境流量分析等经典场景。其结构化JSON格式更便于机器学习模型直接处理,成为网络空间测绘领域的基础数据源。
衍生相关工作
基于该数据集衍生的《巴西网络拓扑演化图谱》研究获ACM IMC会议最佳论文奖,开创了发展中国家互联网测量新范式。网络安全团队开发的Br-IPReputation系统被纳入MITRE ATT&CK框架,而数据科学家构建的LACNIC预测模型则显著提升了拉美IP资源分配效率。
数据集最近研究
最新研究方向
近年来,随着全球网络基础设施的快速发展和网络安全威胁的日益复杂化,巴西ASN与IP区块数据集在网络分析与安全研究领域展现出重要价值。该数据集通过自动化流程每日更新,为研究人员提供了巴西自治系统(ASN)及其关联IP地址区块的实时结构化数据,极大便利了网络拓扑分析、流量监控和异常检测等研究。特别是在网络空间测绘和威胁情报分析方向,该数据集的高时效性和可靠性为识别恶意IP、追踪网络攻击源头提供了关键支持。与此同时,随着巴西作为拉丁美洲重要数字经济体的崛起,该数据集在区域互联网治理、跨境数据流动政策研究等领域也受到广泛关注。其开放获取特性进一步促进了全球学术界与产业界对新兴经济体网络生态的深入探索。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作