Karpathy LLM Memory Wiki

基于 Karpathy 模式的 AI 知识编纂工具,自动构建可跨引用的结构化知识库。

已扫描
适合谁
需要长期知识沉淀的研究者、追求高效信息整合的团队协作成员
不适合谁
无需知识积累的临时任务用户、不接受自动化流程的严格控制型用户
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @dobrinalexandru/wiki-system

Skill 说明

命令、参数、文件名以原文为准

知识库系统

“维护知识库最繁琐的部分,不是阅读或思考——而是琐碎的整理工作。”

—— Andrej Karpathy

大多数AI记忆系统采用“检索-遗忘”模式:你提出一个问题,代理从上下文中获取信息并作答,而这些见解随即消失在聊天记录中。下次会话时,同样的问题仍需重新检索、重新合成。

本技能实现了 Karpathy 的 编译式而非检索式 知识管理范式([原始 Gist](https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f)):不再每次重复获取原始资料,而是由代理构建并持续维护一个结构化的知识库——即跨引用的 Markdown 页面,随时间不断积累和整合知识。人类负责决定输入什么内容;代理则自动完成摘要、交叉引用与维护工作,而这些正是人类通常因负担过重而放弃的任务。

三层架构

  1. 原始资料(不可变)——PDF、文章、论文、网址等。你将它们放入系统,代理读取但绝不修改。
  2. 知识库(由 LLM 维护)——位于 memory/wiki/ 目录下的结构化 Markdown 页面,包含 frontmatter、主张声明与跨页面引用。代理自动创建、更新并维护这些页面。
  3. 结构规范WIKI-SCHEMA.md)——定义页面结构、命名规则与工作流程的标准。随着知识库发展,该规范也会同步演进。

三种核心操作

  • 摄入 —— 原始资料进入系统后,代理提取关键主张,创建或更新知识库页面,并在相关页面间添加 [[交叉引用]]。单个来源可影响多个已有页面。
  • 查询 —— 代理优先检查知识库,基于已有内容合成答案并附带引用;若发现知识缺口,可将缺失项返回至摄入队列。知识不断累积,不会随会话结束而消失。
  • 校验 —— 每周健康检查:识别过期页面、失效链接、孤立页面、矛盾陈述、缺失元数据。确保知识库在增长的同时保持整洁。

兼容性

开箱即用支持

  • OpenClaw >= 2026.1.29(唯一硬性要求)
  • 内置记忆后端(默认)—— 安装脚本会将 memory/wiki 添加到 memorySearch.extraPaths,使知识库页面可通过 memory_search 搜索。无需手动配置。
  • Dreaming(已集成,可选开启)—— 知识库与 Dreaming 可共存且互不干扰。Dreaming 将每日对话信号合并为 MEMORY.md;知识库则将外部知识编译为 memory/wiki/ 中的页面。输入不同,输出分离,彼此不修改文件。Dreaming 还可将候选知识提交至摄入队列——4AM 的摄入定时任务会在 Dreaming 于凌晨 2:30 完成后 90 分钟自动处理。

可选增强功能

  • QMD —— 本地搜索辅助工具,支持重排序与查询扩展。建议知识库超过 50 页时使用。QMD 递归索引 memory/**/*.md,每 10 分钟自动索引一次,无需额外配置。
  • SuperMemory —— 云端记忆持久化。将 memory/wiki/index.md 加入同步脚本后,跨设备会话也能记住知识库中的主题。
  • 嵌入模型提供方(OpenAI、Gemini、Voyage、Mistral)—— 启用语义/向量搜索,支持关键词匹配之外的深层理解。尤其适用于查询术语与页面内容不一致的情况。
  • Honcho —— 跨会话语义搜索并结合用户建模。知识库页面会自动被索引。
  • [双记忆插件](https://clawhub.ai/skills/dual-memory)(memory-core + SuperMemory)—— 若通过复合插件同时运行两种后端,知识库搜索结果将自动与云端记忆合并。实现双重优势。
  • Obsidian —— [[wikilink]] 形式的交叉引用兼容 Obsidian 格式。只需将 Obsidian 指向 memory/wiki/ 即可浏览、可视化知识图谱并跳转链接。

知识库代理从不修改的内容

  • DREAMS.md —— 由 Dreaming 日记系统管理
  • memory/YYYY-MM-DD.md —— 由每日压缩流程管理
  • memory/dreaming/ —— 由 Dreaming 报告系统管理
  • memory/projects/active/ —— 由项目工作流管理
  • memory/decisions.logmemory/learnings.log —— 由追踪系统管理
  • 你原有的记忆文件、项目、日志等 —— 全部不受影响

注意:安装脚本仅在首次安装时向 MEMORY.md 追加一段知识库引用说明(以便代理知晓知识库存在)。安装完成后,知识库系统将不再修改 MEMORY.md —— Dreaming 保持对它的完全控制权。

工作原理

你将资料放入 work/wiki-sources/
        |
        v
[知识库摄入 - 定时任务或手动触发]
  读取资料,提取主张,创建/更新页面
        |
        v
memory/wiki/*.md (带 frontmatter 和交叉引用的结构化页面)
        |
        v
[OpenClaw 记忆索引]
  memory_search 可同时检索你的其他记忆文件与知识库页面

知识库页面位于 memory/ 目录下,因此所有 OpenClaw 记忆后端都会自动索引它们,无需额外配置。

安装

基础设置(目录创建、模板生成、MEMORY.md 引用):

bash skills/karpathy-wiki/scripts/wiki-setup.sh

完整设置(含定时任务与 SuperMemory 云端同步):

bash skills/karpathy-wiki/scripts/wiki-setup.sh --all --tz America/New_York

参数说明:

  • --tz TIMEZONE —— 定时任务使用的时区(默认:UTC)
  • --with-cron —— 创建摄入任务(每日凌晨 4 点)与校验任务(每周日 3:30)的定时计划
  • --with-sync —— 将知识库索引加入 SuperMemory 同步脚本,实现云端持久化
  • --all —— 同时启用 --with-cron--with-sync

基础安装会创建以下内容:

  1. memory/wiki/ 目录,包含 index.mdlog.md
  2. work/wiki-sources/ 目录,内含 pdfs/articles/papers/ 子目录
  3. 位于工作区根目录的 WIKI-SCHEMA.md
  4. 摄入队列文件 work/wiki-sources/ingestion-queue.md
  5. MEMORY.md 存在,则在其末尾追加知识库引用段落

定时任务与 SuperMemory 同步为可选功能,由你自主决定是否自动化。

卸载

openclaw cron delete <ingest-job-id>    # 获取 ID:openclaw cron list | grep Wiki
openclaw cron delete <lint-job-id>
rm -rf memory/wiki/ work/wiki-sources/ WIKI-SCHEMA.md

使用方法

添加知识

在对话过程中:

  1. 将源文件保存至 work/wiki-sources/
  2. 添加到 work/wiki-sources/ingestion-queue.md
   ## Pending
   - [ ] articles/my-article.md | Added 2026-04-07
   - [ ] https://example.com/paper | Added 2026-04-07
  1. 输入“wiki ingest”——代理将立即处理队列

在对话外触发摄入:

openclaw cron run <ingest-job-id>

自动执行: 定时任务每天最多处理 3 个来源,时间为凌晨 4 点。

查询维基

代理会检查 memory/wiki/index.md 中的相关页面,读取内容,并基于引用合成回答。如果问题揭示了知识空白,代理会将条目添加到摄入队列,以供后续研究。

手动校验

输入“wiki lint”可随时运行健康检查。

页面格式

页面使用带域名前缀的连字符命名法,并包含 YAML 前置元数据:

---
title: "Senolytics Overview"
domain: longevity
created: 2026-04-07
updated: 2026-04-07
sources:
  - work/wiki-sources/papers/unity-trial.pdf
tags: [senescence, aging]
confidence: high
status: active
---

# Senolytics Overview

## Summary
2-3 句话的概述。

## Key Claims
1. 带来源引用的主张

## Open Questions
- 未解决的问题

## Related
- [[longevity-cellular-reprogramming]]

域名: bio, vita, longevity, tech, ops, finance, people(可在 WIKI-SCHEMA.md 中自定义)

可参考 skills/karpathy-wiki/templates/page-template.md 获取模板起点。

文件结构

WIKI-SCHEMA.md                         <- 规则与规范
memory/wiki/index.md                   <- 页面目录(<4000 tokens)
memory/wiki/log.md                     <- 活动日志(追加式)
memory/wiki/{domain}-{topic}.md        <- 维基页面
work/wiki-sources/                     <- 原始源文档
work/wiki-sources/ingestion-queue.md   <- 处理队列
skills/karpathy-wiki/scripts/            <- 摄入与校验提示脚本
skills/karpathy-wiki/templates/          <- 模板骨架
skills/karpathy-wiki/references/         <- 该模式背景资料

定时任务调度

任务调度推荐模型目的
维基摄入每日凌晨 4:00具备推理能力(如 Claude Sonnet、GPT-4o、Gemini Pro)处理摄入队列——需要综合分析与跨引用能力
维基校验每周日 凌晨 3:30快速/低成本(如 Claude Haiku、GPT-4o-mini、Gemini Flash)健康检查——机械性验证,无需创造性思维

时区可通过设置时的 --tz 参数配置。摄入任务在 Dreaming 结束后 90 分钟(即凌晨 2:30)启动,避免冲突。模型在创建定时任务时设定,可通过 openclaw cron edit <id> --model <model> 随时修改。

故障排查

  • 页面无法搜索: 使用 openclaw memory status 检查索引状态。尝试运行 openclaw memory index --force
  • 定时任务未触发: 使用 openclaw cron list 查看任务状态。必要时重启网关。
  • 索引过大: 当页面超过 80 个时,架构支持按域名划分子索引。详见 WIKI-SCHEMA.md。
  • Dreaming 冲突: 设计上不可能发生。维基与 Dreaming 写入不同文件,并有 90 分钟的调度缓冲。

致谢

灵感源自 Andrej Karpathy 的 LLM 维基模式 [https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f](https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f)。实现已适配 OpenClaw 的内存架构,兼容所有内存后端(builtin、QMD、Honcho),支持可选的 Dreaming 集成及 SuperMemory 云端持久化。

完整概念解析请参阅 skills/karpathy-wiki/references/karpathy-llm-wiki.md

D
@dobrinalexandru

已收录 1 个 Skill

相关推荐