Private Knowledge Base

基于PDF与论文的私有知识库,支持跨文档检索与摘要。

已扫描
适合谁
研究人员、学生学者
不适合谁
无需文档管理的普通用户、无本地文件处理能力的环境
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @wirec-yzx/private-knowledge-base

Skill 说明

命令、参数、文件名以原文为准

Private Knowledge Base

个人文档存储与检索系统,用于管理 PDF、论文及研究文档。

快速开始

添加文档

# 将 PDF 添加到知识库
./scripts/ingest.sh ~/path/to/document.pdf

# 处理整个文件夹
./scripts/ingest-folder.sh ~/papers/

查询知识库

# 在所有文档中搜索某个概念
./scripts/search.sh "transformer architecture"

# 从相关文档中获取概念的摘要
./scripts/summarize.sh "attention mechanism"

核心工作流程

1. 文档摄入

当用户提供新的 PDF 或论文时:

  1. kb/index.json 中创建文档条目
  2. 提取文本内容和元数据
  3. 生成语义搜索用的嵌入向量
  4. 将文档存储至 kb/docs/,并使用标准化名称命名

2. 跨文档问答

当用户提问“哪篇文档提到了 X?”或“总结一下我文档中关于 X 的内容”时:

  1. 通过嵌入向量搜索相关段落
  2. 检索原始文档
  3. 在多份文档间整合信息生成答案
  4. 提供引用信息,包括文档名称和页码

3. 概念关联

建立文档之间的关联关系:

  • 共同提及的概念
  • 引用关系
  • 主题聚类

文件结构

private-knowledge-base/
├── SKILL.md
├── scripts/
│   ├── ingest.sh          # 单个文档摄入
│   ├── ingest-folder.sh   # 批量摄入
│   ├── search.sh          # 语义搜索
│   └── summarize.sh       # 跨文档摘要
├── references/
│   └── schema.md          # KB 索引格式说明
└── kb/                    # 运行时生成
    ├── index.json
    ├── embeddings/
    └── docs/

使用示例

用户: “我之前存的文档里,哪篇提到了 transformer?”

→ 执行 ./scripts/search.sh "transformer"

用户: “总结一下我文档里关于 attention 的内容”

→ 执行 ./scripts/summarize.sh "attention"

用户: “把这篇 PDF 加到知识库”

→ 执行 ./scripts/ingest.sh <pdf-path>

配置

设置知识库路径:

export KB_ROOT=~/.openclaw/workspace/kb

默认路径:若未设置,则使用 ~/kb

WY
@wirec-yzx

已收录 1 个 Skill

相关推荐