Defender XDR Advanced Hunting — Complete Schema Dataset

github2026-05-06 更新2026-05-07 收录

下载链接：

https://github.com/ml58158/defender-xdr-advanced-hunting

下载链接

链接失效反馈

官方服务：

资源简介：

一个针对Microsoft Defender XDR高级狩猎的完整模式数据集，包括完整的`ActionType`枚举，这些内容在微软的公开文档中被省略。该数据集通过从内部API提取完整的模式（字段、ActionTypes、示例查询和保留元数据）来解决公开文档中缺少`ActionType`值的问题。

A comprehensive schema dataset for Microsoft Defender XDR Advanced Hunting, which includes the complete `ActionType` enumeration omitted from Microsoft's public documentation. This dataset resolves the issue of missing `ActionType` values in public documentation by extracting full schemas (including fields, ActionTypes, sample queries, and retained metadata) from internal APIs.

创建时间：

2026-05-06

原始信息汇总

好的，这是根据您提供的数据集详情页面README文件内容总结出的数据集概述。

Defender XDR Advanced Hunting — 完整架构数据集概述

该数据集旨在解决Microsoft Defender XDR高级搜寻（Advanced Hunting）功能中，ActionType枚举值缺失的问题。微软官方文档未提供机器可读的ActionType完整列表，导致查询编写困难、AI助手产生幻觉。本项目通过调用门户内部API，提取了完整的表架构信息。

核心问题与解决方案

问题：微软官方的高级搜寻文档虽列出了各表的列和数据类型，但关键的ActionType列仅建议“查看门户内架构参考”，其具体值（如ProcessCreated、CreateRemoteThreadApiCall等）仅存在于Defender XDR门户UI中，缺乏公开的机器可读参考。
解决方案：本项目从驱动门户架构面板的内部API中提取了完整架构（字段、ActionTypes、示例查询、保留期元数据）。

数据来源

项目数据主要来源于两个渠道：

内部 huntingService API（主要来源）：Defender XDR门户通过未公开的内部端点 GET https://security.microsoft.com/apiproxy/mtp/huntingService/documentation/TableDocumentation/{TableName} 加载架构文档。该API返回的JSON负载包含每个表的：
- Fields[]：列名、类型和描述（比公开文档更丰富）。
- ActionTypes[]：所有有效的ActionType值及其描述的完整枚举。
- Queries[]：微软提供的示例KQL查询。
- HotDays / ColdDays：数据保留期。
- TableType 和 Tags[]：表分类与标签。
微软公开文档（补充）：来自GitHub上 MicrosoftDocs/defender-docs 仓库的原始Markdown表格，提供公开的列/类型/描述文档，但不包含ActionTypes。

数据集内容与结构

覆盖范围：包含61张表，涵盖设备、标识、电子邮件、云应用、威胁与漏洞管理、警报与事件等多个类别。
仓库结构：
- schema/raw-md/：61个来自微软文档的原始Markdown文件。
- schema/parsed-json/：61个解析后的JSON架构文件。
- DefenderSchema/：运行提取脚本后生成的输出目录，包含：
  - _AllTables.json：所有表的合并JSON架构。
  - DefenderXDR_SchemaReference.md：完整的人类可读参考。
  - ActionTypes_Reference.md：仅包含ActionTypes的快速参考。
  - {TableName}.json：各表的单独JSON文件（共60个）。
工具脚本：
- Get-DefenderSchema.ps1：门户API架构提取器，用于从内部API抓取完整架构数据。
- parse-schema.js：Node.js解析器，用于将原始Markdown转换为JSON。
- updater/sync-schema.ps1：从GitHub拉取最新原始Markdown的同步脚本。

提取与使用方式

前提条件：需要在 security.microsoft.com 上拥有有效的、具有高级搜寻访问权限的会话。提取脚本需要完整的浏览器Cookie字符串进行身份验证，该字符串有效期为30-60分钟。
AI技能集成：该仓库被设计为Claude的自定义技能，通过 SKILL.md 文件定义行为规则：不允许生成虚构字段，所有查询必须根据解析后的JSON架构进行验证。

搜集汇总

数据集介绍

构建方式

在网络安全威胁日趋复杂的背景下，微软Defender XDR的高级搜寻（Advanced Hunting）功能为安全分析师提供了强大的威胁狩猎能力，但其核心字段ActionType的完整枚举值却长期隐匿于门户界面内部，缺乏公开的机器可读参考。为填补这一空白，本数据集通过逆向分析Defender XDR门户中未公开的内部API接口（huntingService/documentation/TableDocumentation/{TableName}），利用PowerShell脚本（Get-DefenderSchema.ps1）自动提取并聚合所有60张表的完整Schema信息，包括Field、ActionType、示例查询及保留周期等元数据，同时辅以从微软官方GitHub仓库同步的Markdown文档进行补充解析，最终生成结构化JSON格式的完整数据集。

使用方法

使用本数据集前，需确保拥有Defender XDR门户的活动会话及高级搜寻访问权限。首先通过浏览器开发者工具捕获门户会话的完整Cookie字符串（包括sccauth、XSRF-TOKEN等关键令牌），随后在PowerShell环境中运行提取脚本Get-DefenderSchema.ps1，传入CookieString与TenantId参数即可自动获取全部或指定表的Schema数据。获取的JSON文件可直接用于安全分析、KQL查询开发或作为Claude AI等大型语言模型的自定义技能知识库，以提升威胁狩猎的准确性与效率。

背景与挑战

背景概述

Microsoft Defender XDR Advanced Hunting作为企业级威胁检测与狩猎的基石，其数据表结构的透明性与可访问性直接关系到检测工程的有效性。然而，在官方文档中，关键字段ActionType的完整枚举值被有意省略，仅提示用户查阅门户界面，这一信息鸿沟严重阻碍了自动化分析与AI辅助推理的进程。为弥合这一缺陷，该数据集应运而生，旨在通过提取门户内部API中的完整表结构，系统性地收录所有ActionType值及其描述。由社区研究者主导创建，该项目不仅为KQL查询编写者、AI模型训练及安全实验室提供了权威的机器可读参考，还通过开源形式显著提升了Microsoft Defender生态中威胁狩猎任务的精确性与可复现性。

当前挑战

该数据集所面对的挑战多维交织。一方面，核心难题在于领域信息不对称——微软官方公开文档刻意回避ActionType枚举值的完整发布，迫使检测工程师依赖手动浏览门户UI这种低效率且易出错的方式发现有效值，导致AI辅助工具因缺乏权威参考而频繁产生幻觉。另一方面，数据抽取过程同样充满技术障碍：内部API采用基于浏览器会话的认证机制，需完整捕获并实时更新包含多个关键Cookie的字符串，而会话有效期仅30至60分钟，一旦过期便触发HTTP 440错误；此外，严苛的速率限制（每分钟250次请求）要求脚本以300毫秒间隔等待，在60张表上完成全量拉取需耗费大量时间。数据更新维护还需持续同步微软GitHub上的原始Markdown文档，以确保与公共栏位的描述保持一致，进一步增加了持续运营的成本。

常用场景

经典使用场景

在网络安全与威胁检测领域，Microsoft Defender XDR Advanced Hunting 数据集是安全分析师与检测工程人员挖掘端点行为模式的核心素材。其最经典的应用场景在于利用完整的 ActionType 枚举值构建精确的 Kusto 查询语言（KQL）规则，以识别诸如进程创建（ProcessCreated）、远程线程注入（CreateRemoteThreadApiCall）等恶意活动。研究人员可基于该数据集中 61 张表的字段描述、数据类型及保留周期，设计出高召回率的狩猎查询，从而在庞杂的遥测日志中精准定位攻击者的隐匿痕迹，提升威胁响应的时效性与准确性。

解决学术问题

学术界长期面临 Microsoft 官方文档中 ActionType 字段描述缺失的困境，导致学生与学者无法系统性地枚举攻击面或复现检测实验。该数据集通过逆向解析门户内部 API，首次公开了完整的 ActionType 枚举与描述，从根本上解决了知识盲区。它使研究人员能够基于标准化、机器可读的模式参考，开展跨表关联分析与攻击链建模，推进了威胁狩猎方法论的可复现性。这一突破不仅在检测工程领域填补了权威性数据空白，更为安全教育与红蓝对抗训练提供了可信赖的基础参考。

实际应用

实际部署中，企业安全运营中心（SOC）可将该数据集嵌入自动化剧本，用于告警富化与误报消减。例如，利用 ActionType_Reference.md 快速校验告警日志中的活动类型是否合法，从而过滤无效触发。此外，安全编排与自动化响应（SOAR）平台能通过解析全量 JSON 模式，动态生成针对 VPN 登录异常或横向移动的猎杀规则。微软安全工程师亦可借助该数据集训练内部 AI 助手，确保其生成的 KQL 查询不出现字段幻觉，显著降低了高级威胁狩猎的门槛与人工审核成本。

数据集最近研究