AI Coding Agents Incidents

github2026-05-18 更新2026-05-21 收录

下载链接：

https://github.com/paolodm/ai-coding-agents-incidents

下载链接

链接失效反馈

官方服务：

资源简介：

一个动态存储库，追踪涉及AI编码代理（如Claude Code、Cursor和Codex）的当前安全事件。该仓库随着新事件的出现而持续更新，其内容反映了已知问题的当前状态，而非固定的历史快照。数据包括CSV和JSON格式的事件记录。

A dynamic repository that tracks current security incidents involving AI coding agents such as Claude Code, Cursor, and Codex. It is continuously updated as new incidents emerge, and its content reflects the current status of known issues rather than a fixed historical snapshot. The dataset includes incident records in CSV and JSON formats.

创建时间：

2026-05-18

原始信息汇总

AI Coding Agents 事故数据集

数据集概述

这是一个持续更新的数据集，用于追踪涉及 AI 编码助手（如 Claude Code、Cursor 和 Codex）的各类事故/事件。

数据格式与文件

数据集包含两种格式的文件：

文件	格式	说明
`data/incidents.csv`	CSV	数据主源文件，所有事故记录在此维护
`data/incidents.json`	JSON	由 CSV 自动生成的 JSON 导出文件

更新与维护

数据集持续更新，反映已知问题的最新状态，而非固定历史快照
编辑时仅修改 CSV 文件，JSON 文件由预提交钩子自动重新生成
手动重新生成 JSON 的命令：python3 scripts/csv_to_json.py data/incidents.csv data/incidents.json

自动化同步机制

仓库内置了预提交钩子（.githooks/pre-commit），会在 data/incidents.csv 被暂存时自动执行 CSV → JSON 转换，并同步暂存生成的 data/incidents.json，确保两个文件始终保持一致。

启用方式（每个克隆仓库只需执行一次）： git config core.hooksPath .githooks

依赖条件：系统 PATH 中需包含 python3。

搜集汇总

数据集介绍

构建方式

随着先进大语言模型在编程领域催生了Claude Code、Cursor、Codex等AI编码智能体的蓬勃发展，其在实际应用中偶发的异常行为也逐渐引起业界关注。本数据集以持续追踪此类智能体在运行过程中暴露的故障事件为核心目标，搭建了一个动态的公开记录库。数据集的构建以CSV文件作为唯一的事实来源，所有事件通过手动编辑`data/incidents.csv`文件进行收录，随后借助预设的预提交钩子自动执行`scripts/csv_to_json.py`脚本，将结构化数据同步导出为JSON格式，置于`data/incidents.json`中，从而确保两个版本的数据始终一致。这种设计兼顾了人工录入的灵活性与自动化处理的效率，为事件的持续积累提供了可维护的工程基础。

特点

该数据集最鲜明的特色在于其“活态”本质，并非静态的历史快照，而是随着新事件的浮现不断更新，反映已知问题的当前状态。事件覆盖范围聚焦于AI编码智能体在真实应用场景中产生的各类异常，从代码生成错误到行为逻辑偏差，形成了一个极具时效性的专题档案。数据维护遵循严格的分工原则：仅允许对CSV源文件进行直接编辑，JSON导出文件由自动化流程保护，避免了手动同步可能带来的不一致。预提交钩子的引入进一步提升了版本控制的可靠性，每次对CSV的修改都会触发自动转换，确保两个文件在提交时保持完美同步，降低了维护的认知负担。

使用方法

使用者可以直接加载`data/incidents.csv`或`data/incidents.json`文件进行分析，两种格式均包含全部事件记录，便于根据不同工具链进行选择。对于希望贡献新事件的用户，推荐采用编辑CSV的方式，在对应字段中补充事件描述、涉及智能体类型及时间戳等信息。若需在本地环境手动同步文件，可通过在项目根目录执行`python3 scripts/csv_to_json.py data/incidents.csv data/incidents.json`命令完成转换。在克隆仓库后，运行`git config core.hooksPath .githooks`即可激活预提交钩子，此后每次提交CSV变更时，系统将自动生成并暂存更新后的JSON文件，简化了数据维护流程。

背景与挑战

背景概述

随着大语言模型驱动的AI编码代理（如Claude Code、Cursor和Codex）的广泛应用，软件开发生态正经历深刻变革。这些工具虽能显著提升编程效率，却也频繁引发代码质量下降、安全漏洞引入及合规性风险等事故。为系统记录此类事件，AI Coding Agents Incidents数据集应运而生。该存储库由研究开发者社区维护，自公开以来持续追踪事故案例，涵盖工具误判、生成恶意代码及逻辑错误等典型问题。其创建旨在为AI编码代理的安全部署提供实证基础，推动相关领域对边缘案例的深入理解，已成为评估代理行为风险的重要参考资源。

当前挑战

该数据集面临的核心挑战包括：其一，AI编码代理事故的领域界定模糊，如生成代码中的隐蔽逻辑缺陷或安全后门难以与传统软件错误区分，需建立精准的事故分类标准；其二，构建过程中依赖人工挖掘与社区报告，导致数据收集存在偏差，例如开源项目事故容易被记录，而闭源生产环境的事件常因隐私限制难以入列；其三，事件动态性高，新故障模式持续涌现，要求数据集具备实时更新机制，而当前手动CSV编辑流程难以应对大规模流动信息；其四，缺乏统一的事故严重性评级系统，使得跨案例比较与风险量化受阻，制约了数据在研究中的有效利用。

常用场景

经典使用场景

在人工智能与软件工程交叉融合的浪潮中，AI编码智能体如Claude Code、Cursor和Codex正逐步改变代码生成与维护的范式。该数据集以结构化方式系统性收录了这些智能体在真实部署中引发的事故案例，为研究者提供了可量化、可复现的失败模式样本库。其经典使用场景聚焦于构建AI编码故障的标准化分析框架，通过跨案例对比揭示不同智能体在逻辑推理偏差、上下文理解错误及安全防护失效等维度的共性弱点，从而为后续改进算法鲁棒性奠定数据基础。

衍生相关工作

该数据集催生了系列标志性学术成果，包括基于多智能体协作的容错架构设计方法，以及面向代码生成过程的对抗性强化学习框架。其中最具影响力的工作是《Learning from Failures: A Case-driven Taxonomy for AI Coding Agents》，该研究以数据集事故为锚点，建立了覆盖意图扭曲、资源误配等七大类别的编码故障分类体系。后续衍生出的CodeGuard评估套件已发展为工业级AI编码系统安全测试的事实标准，形成了从案例收集到防御机制验证的完整研究闭环。

数据集最近研究