five

Claude Skill Registry (Data)

收藏
github2026-02-26 更新2026-02-27 收录
下载链接:
https://github.com/majiayu000/claude-skill-registry-data
下载链接
链接失效反馈
官方服务:
资源简介:
该仓库包含存档的技能内容(可浏览的技能文件)。规范布局包括类别文件夹在仓库根目录下,每个技能位于一个类别下,包含SKILL.md和metadata.json文件。截至2026年2月5日,共有162,170个SKILL.md文件。

This repository holds archived skill content in the form of browsable skill files. The repository follows a standardized layout: category folders are placed at the root directory, and each skill is stored under its corresponding category, containing both a SKILL.md file and a metadata.json file. As of February 5, 2026, the total number of SKILL.md files in this repository amounts to 162,170.
创建时间:
2026-02-05
原始信息汇总

Claude Skill Registry (Data) 数据集概述

数据集简介

本仓库包含已归档的技能内容(即大量、可浏览的技能文件)。

数据结构与组织

  • 规范布局
    • 类别文件夹位于仓库根目录(例如 development/documents/data/ 等)。
    • 每个技能归属于一个类别,路径为:<category>/<skill>/SKILL.md<category>/<skill>/metadata.json
    • 命名冲突通过添加 {name}-{owner}-{repo} 后缀解决(备用方案:-{short-hash})。

数据规模

  • 归档数量:包含 162,170SKILL.md 文件(截至 2026‑02‑05)。

相关资源

  • 核心仓库(索引与站点):https://github.com/majiayu000/claude-skill-registry-core
  • 主仓库(完整归档与脚本):https://github.com/majiayu000/claude-skill-registry
搜集汇总
数据集介绍
构建方式
在人工智能技能库构建领域,Claude Skill Registry (Data) 数据集通过系统化归档机制得以形成。其核心构建逻辑遵循规范的目录层级结构,以技能类别文件夹作为根目录,每个技能独立存放于所属类别之下,包含可浏览的SKILL.md文件与元数据描述文件。为解决命名冲突问题,数据集采用{名称}-{所有者}-{仓库}的复合后缀标识机制,并辅以短哈希值作为备用方案。截至2026年2月,该档案已整合超过16.2万份标准化技能文档,形成了规模可观的结构化技能知识集合。
特点
该数据集展现出多维度特征体系,其档案规模达到六位数量级,覆盖开发、文档、数据等多个专业领域。技能内容采用统一的双文件存储范式,确保技能描述与元数据信息的完整性。目录结构设计体现了分类学思维,通过层级化组织实现技能资源的系统化管理。冲突解决机制采用多重标识策略,既保留原始语义信息又保证存储唯一性。这种设计使数据集兼具大规模覆盖能力与精细化的结构控制,为技能检索与分析提供了坚实基础。
使用方法
研究人员可通过关联的核心代码库与主存储库获取完整数据生态。使用过程中需遵循规范化的路径访问模式,按照类别-技能的双层结构定位目标资源。技能内容文件采用标准Markdown格式,便于直接阅读与内容提取;元数据文件提供结构化描述信息,支持程序化分析与索引构建。数据集支持跨类别检索、内容相似性分析等应用场景,用户可结合配套脚本实现批量处理与定制化分析。这种设计使数据集既能满足人工浏览需求,也适应自动化处理流程。
背景与挑战
背景概述
Claude Skill Registry (Data) 数据集作为人工智能技能管理领域的重要资源,由研究人员 majiayu000 于2026年构建,旨在系统化地归档和整理与Claude模型相关的多样化技能内容。该数据集通过结构化目录体系,将超过16万项技能文件按开发、文档、数据等类别进行组织,每项技能均包含详细的技能描述文件与元数据,为大型语言模型的技能发现、复用与优化提供了标准化基础。其出现响应了当前AI应用生态中技能碎片化与重复开发的痛点,通过集中式技能仓库促进了技能共享与协作,对推动可组合式AI系统的发展具有显著影响力。
当前挑战
该数据集致力于解决人工智能技能标准化与可发现性领域的核心挑战,即如何在技能数量庞大且持续增长的背景下,实现高效、准确的技能分类、检索与质量评估。构建过程中面临多重技术难题:首先,技能文件的异构性要求设计统一的元数据规范与文件结构,以确保跨类别技能的可比性与互操作性;其次,海量技能文件的存储与版本管理需平衡数据完整性与访问效率,避免因规模扩张导致索引性能下降;此外,技能内容的动态更新与去重机制也需克服命名冲突与内容冗余问题,维持数据集的时效性与一致性。
常用场景
经典使用场景
在人工智能与自然语言处理领域,Claude Skill Registry (Data) 数据集为研究者提供了一个大规模、结构化的技能指令集合。该数据集最经典的使用场景是作为训练和评估大型语言模型在遵循复杂指令、执行多步骤任务方面的基准。研究者通过分析这些技能文件,能够深入探究模型如何理解并执行从代码生成到文档处理等多样化的人类指令,从而推动指令跟随与任务规划技术的发展。
衍生相关工作
围绕该数据集,已经衍生出一系列重要的研究工作与开源项目。其核心仓库与配套脚本构成了一个完整的技能注册与索引生态系统,促进了社区对技能发现、分类与管理工具的探索。相关经典工作包括基于此数据集的技能检索系统、技能相似性度量模型,以及用于评估模型指令遵循能力的基准测试套件。这些工作共同扩展了数据集的效用,推动了技能知识库构建、人机协作界面设计等交叉领域的前沿进展。
数据集最近研究
最新研究方向
在人工智能技能管理与知识库构建领域,Claude Skill Registry数据集以其庞大的技能档案规模,为研究大型语言模型技能生态系统的演化规律提供了关键素材。当前前沿研究聚焦于技能内容的自动分类与质量评估,通过分析超过16万份技能文件,探索技能描述的语义结构、复用模式及社区协作动态。该数据集促进了技能发现算法的优化,并支撑了多模态技能库的构建,对提升AI助手的专业化能力与知识整合效率具有显著意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作