微信文章评估报告
09_IT运维与系统
title: 微信文章评估 — OKF 个人知识库 vs 光合盐知识库
category: 09_IT运维与系统
level: T2 🟡
status: ✅ 有效
dri: Hermes Agent
created: 2026-06-19
source: https://mp.weixin.qq.com/s/gumIP-jTwNwytWsmM3-aVg
微信文章评估报告
文章核心观点
文章描述了一个基于 OKF (Open Knowledge Format) 理念的自生长个人知识库:
信源 → raw/(不可变原始) → LLM编译 → wiki/(活知识库) → /ask + /lint → 回填wiki
关键原则:
- raw/ 不可变 — 原始数据只追加,不改写,作为"事实层"
- wiki/ 增量更新 — LLM 维护,永不从头重写,只富化已有页面
- _index.md 入口 — AI 和人操作前先读此页"看到有什么"
- [[双链]] 是命脉 — 知识的价值在连接不在单页
- 自身是个 daemon — 内置 cron,自己抓、自己编、自己查
- 富化不是摘要 — 新信息去丰富已有页面,不是新开一篇
光合盐知识库 vs OKF 模型对比
| 维度 | OKF 模型 | 光合盐当前 | 差距 |
|---|---|---|---|
| raw 层 | 独立目录,只追加不可变 | ✅ COS 存储原始PDF,PSQL存MD | ✅ 已有 |
| wiki 层 | LLM 编译的活知识库 | ✅ 光合盐KM知识库/ 368MD | ✅ 已有 |
| _index.md | 单一入口页,列所有内容 | ⚠️ 每目录有 _INDEX.md,但无单页[[总入口]] | 🟡 |
| 增量富化 | 新信息往已有页增加,不重写 | ⚠️ refine_pipeline 建新卡片,但不去富化已有卡片 | 🟡 |
| 自生长 daemon | 内置cron,全自动闭环 | ✅ 17条cron自动管线 | ✅ 更强 |
| [[双链]] 命脉 | 链接即知识结构 | ✅ 305/368文件已有双链 | ✅ |
| lint 质检 | 检查断链/孤页/矛盾 | ❌ 无质量检查 | 🔴 |
| 知识密度 | 12M纯文本/213页=56KB/页 | ⚠️ 未评估 | 🟡 |
| /ask 问答 | 基于知识库的自然语言问答 | ✅ RAG已搭建 | ✅ 更强 |
| OKF 格式兼容 | Google标准格式 | ❌ 未对齐 | 🟡 可选 |
| raw→wiki 管线 | LLM编译富化 | ✅ refine_pipeline.py | ✅ |
可借鉴的优化点
1. 增量富化模式 (最高价值)
当前问题:refine_pipeline.py 扫描新 MD 文件后创建产品卡片。但如果同一产品有新资料上传,不会去富化已有的产品卡片。
借鉴方案:
当前: COS新PDF → 新MD → 新建产品卡片 (独立)
目标: COS新PDF → 新MD → 查找已有卡片 → 如果有,增加新内容到现有卡片
如果无,新建卡片
实现:在 refine_pipeline.py 中增加"更新已有卡片"逻辑:
python
existing = db.query(product_cards).filter(name=extracted_name).first()
if existing:
# 增量更新:把新信息追加到已有卡片的字段中
existing.selling_points += "|" + new_points
else:
# 新建卡片
db.insert(product_cards, {...})