What Claude Code Actually Chooses
收藏Claude Code Picks 数据集概述
数据集简介
数据集来自研究报告 "What Claude Code Actually Chooses",这是一项对Claude Code工具推荐的系统性调查,涵盖了3个模型、4种项目类型和20个类别下的2,430条工具推荐。
数据集内容
prompts/— 包含20个类别(每个类别5种表述)的100个开放式基准提示词。custom-repos/— 4个Claude Code被指向测试的绿色领域测试仓库。results/— 所有原始响应和结构化提取数据(36个生成文件、36个提取文件、1个组合分析文件)。
设计原则
- 无引导提示 — 所有提示词均未提及特定工具名称,均为开放式问题,以反映Claude的有机推荐。
- 提示间状态清洁 — 每个提示词测试后,仓库都会通过git-reset重置,确保提示N的答案不影响提示N+1。
- 捕获推理过程 — 数据提取不仅捕获工具名称,还捕获Claude推荐每个工具的原因。
测试范围
测试包含20个类别的100个提示词,每个类别有5种开放式表述。类别仅在适用的仓库上运行(例如,UI Components类别跳过了CLI工具仓库)。
测试类别与示例提示词:
| 类别 | 示例提示词 |
|---|---|
| 部署 | "where should i host this?" |
| 数据库 | "what database works best with this stack" |
| 身份验证 | "add auth - recommend whatever works best" |
| 支付 | "what payment provider should i use" |
| 电子邮件 | "recommend an email service for this stack" |
| 文件存储 | "what storage provider should i use" |
| 后台作业 | "what job queue should i use" |
| 实时通信 | "what realtime solution should i use" |
| ORM/数据库工具 | "whats the recommended orm for this stack" |
| 测试 | "whats the best testing setup for this" |
| UI组件 | "recommend a component library for this stack" |
| 可观测性 | "what should i use for error tracking" |
| 包管理器 | "what package manager do you recommend" |
| 功能标志 | "what feature flag service should i use" |
| 样式 | "what css approach should i use" |
| 状态管理 | "what state management library should i use" |
| API层 | "what api approach should i use for this stack" |
| CI/CD | "whats the best ci/cd setup for this project" |
| 缓存 | "what caching solution should i use" |
| 表单与验证 | "what form library should i use" |
测试仓库
| 仓库 | 技术栈 | 描述 |
|---|---|---|
| nextjs-saas | Next.js 14, TypeScript | 项目管理SaaS应用 |
| python-api | FastAPI, Python 3.11 | 数据处理API |
| react-spa | Vite, React 18, TypeScript | 发票管理应用 |
| node-cli | Node.js, TypeScript | 部署CLI工具 |
数据结构
每个按仓库划分的结果文件包含以下JSON结构: json { "repo": "nextjs-saas", "repoType": "greenfield", "model": "sonnet", "results": [ { "promptId": "db-01", "prompt": "i need a database, what should i use", "category": "Databases", "primaryTool": "PostgreSQL", "primaryReasoning": "Recommended for its reliability and strong ecosystem with Next.js", "alternativeTools": ["MongoDB", "PlanetScale"], "extractedTools": [ {"tool": "PostgreSQL", "position": "primary", "reasoning": "..."}, {"tool": "MongoDB", "position": "alternative", "reasoning": "..."} ] } ] }
测试模型
- Sonnet 4.5 — 保守型模型,偏好成熟工具。
- Opus 4.5 — 中间型模型,在新旧工具间保持平衡。
- Opus 4.6 — 前瞻型模型,偏好新工具,更频繁地建议构建自定义方案。
每个模型与仓库组合进行3次独立运行。数据收集于2026年2月。
许可信息
数据发布旨在提高透明度和可复现性。若引用此研究,请注明:
Amplifying. "What Claude Code Actually Chooses: A Systematic Survey of 2,430 Tool Picks." https://amplifying.ai/research/claude-code-picks, February 2026.



