hf-papers-wiki
收藏🧠 HF Papers Wiki 数据集详情
数据集概述
HF Papers Wiki 是一个持续增长、相互关联的知识库,专注于 Hugging Face 开源机器学习生态系统。该数据集由 LLM 代理按照 LLM Wiki 模式 构建和维护。
该数据集从 21 篇里程碑论文起步,经过 27 次批量摄入,已扩展到 231 篇论文和 358 个总页面。它是一个动态文档,随着新论文的摄入,实体页面会更新、交叉引用会添加、综合会不断演进。
数据统计
| 指标 | 数量 |
|---|---|
| 源论文摄入数量 | 231 |
| 模型实体页面 | 20 |
| 数据集实体页面 | 12 |
| 组织页面 | 22 |
| 概念页面 | 54 |
| 对比页面 | 15 |
| 总页面数 | 358 |
| 待处理(路线图) | 约4篇论文(第28批) |
数据结构
├── SCHEMA.md # Wiki 规范和流程 ├── ROADMAP.md # 下一迭代计划 ├── index.md # 所有页面的主目录 ├── log.md # 操作日志记录 ├── overview.md # 高层综合概述 ├── sources/ # 每篇论文一个页面(231篇论文) ├── entities/ │ ├── models/ # 模型家族 │ ├── datasets/ # 关键数据集 │ └── orgs/ # 组织 ├── concepts/ # 技术与思想(54个概念) └── comparisons/ # 对比分析(15个对比)
使用方式
- 作为 Obsidian 知识库:克隆仓库作为 Obsidian 仓库打开,
[[wiki-links]]链接兼容 Obsidian,可使用图谱视图查看互联关系 - 作为 LLM 知识库:将仓库指向 LLM 代理,使用
SCHEMA.md作为指令文件,LLM 可摄入新论文、回答问题并维护 Wiki - 开始阅读:从 overview.md 开始了解全局,查阅 index.md 获取主目录,浏览 comparisons/ 进行对比分析
覆盖亮点
最新批次(2026年5月,第27批):6篇论文
涵盖连续潜空间扩散语言模型、创意代理评估、基于扩散的自动驾驶、代理技能策展、跨文化安全基准测试以及基于残差的强化学习推理。
开放模型(45+篇论文)
涵盖 LLaMA 1–4、Mistral/Mixtral、Gemma 1–3、Qwen 2–3、DeepSeek LLM/V3/V3.2/R1、OLMo 1–3、Phi 3–4 等主流开放模型家族。
推理与强化学习(40+篇论文)
最全面的后 DeepSeek-R1 强化学习推理景观覆盖,包括跨域强化学习、算法创新、开放式强化学习、代理强化学习、指令遵循强化学习等。
视觉语言与多模态(34+篇论文)
涵盖 LLaVA、InternVL 1.5–3、Cambrian-1、Qwen2-VL/2.5-VL、SmolVLM、Qwen2-Audio 等主流视觉语言和多模态模型。
视频生成与3D
涵盖 Seedance 1.0、Self-Forcing++、CogVideoX、SVD、UniVidX 等视频生成和 3D 相关模型。
机器人与具身AI
涵盖 ExoActor(视频到控制)、Learning while Deploying(舰队规模 VLA 强化学习)、Map2World(3D 世界生成)等机器人领域内容。
扩散模型与生成(12+篇论文)
涵盖 Latent Diffusion、SD3、DiT、Continuous-Time DMD 等图像、视频、语言和机器人应用中的扩散模型。
数据与策展(14+篇论文)
涵盖 FineWeb/FineWeb2、Common Pile、Common Corpus、Dolma、DCLM、RedPajama 等关键数据集及数据混合法则。
嵌入模型
从 SBERT 到 E5、Nomic Embed、基于 LLM 的嵌入,直至 F2LLM 和 TabEmbed。
代理系统与科学AI(23+篇论文)
涵盖 ReAct、Toolformer、CodeAct、Agentic RL 等重要代理系统及科学 AI 相关工作。
训练基础设施与效率
涵盖 RoundPipe(消费级 GPU 管道并行)、Prima.cpp(分布式家庭推理)、Quartet(FP4 训练)等效率优化内容。
开放科学与合规
Apertus、Common Corpus、OLMo 1–3、DOLMA 引领完全开放、符合伦理的模型运动。
安全、评估与基准
涵盖 ShieldGemma、Compliance vs Sensibility、Benchmarkless Safety Scoring 等安全评估内容。
对比分析(共15项)
涵盖开放模型家族、对齐方法、强化学习推理方法、推理模型、预训练数据、视觉语言模型、开放科学与开放权重对比、小语言模型、推理引擎、嵌入模型、MoE 架构、代码模型与代理、扩散架构、上下文扩展方法、量化全景。
路线图
当前已摄入 231 篇论文,共计 358 个页面。第 28 批计划处理约 4 篇待处理论文,详细计划见 ROADMAP.md。




