微信文章评估报告

09_IT运维与系统


title: 微信文章评估 — OKF 个人知识库 vs 光合盐知识库

category: 09_IT运维与系统

level: T2 🟡

status: ✅ 有效

dri: Hermes Agent

created: 2026-06-19

source: https://mp.weixin.qq.com/s/gumIP-jTwNwytWsmM3-aVg


微信文章评估报告

文章核心观点

文章描述了一个基于 OKF (Open Knowledge Format) 理念的自生长个人知识库:


信源 → raw/(不可变原始) → LLM编译 → wiki/(活知识库) → /ask + /lint → 回填wiki

关键原则:

  1. raw/ 不可变 — 原始数据只追加,不改写,作为"事实层"
  2. wiki/ 增量更新 — LLM 维护,永不从头重写,只富化已有页面
  3. _index.md 入口 — AI 和人操作前先读此页"看到有什么"
  4. [[双链]] 是命脉 — 知识的价值在连接不在单页
  5. 自身是个 daemon — 内置 cron,自己抓、自己编、自己查
  6. 富化不是摘要 — 新信息去丰富已有页面,不是新开一篇

光合盐知识库 vs OKF 模型对比

维度OKF 模型光合盐当前差距
raw 层独立目录,只追加不可变✅ COS 存储原始PDF,PSQL存MD✅ 已有
wiki 层LLM 编译的活知识库✅ 光合盐KM知识库/ 368MD✅ 已有
_index.md单一入口页,列所有内容⚠️ 每目录有 _INDEX.md,但无单页[[总入口]]🟡
增量富化新信息往已有页增加,不重写⚠️ refine_pipeline 建新卡片,但不去富化已有卡片🟡
自生长 daemon内置cron,全自动闭环✅ 17条cron自动管线✅ 更强
[[双链]] 命脉链接即知识结构✅ 305/368文件已有双链
lint 质检检查断链/孤页/矛盾❌ 无质量检查🔴
知识密度12M纯文本/213页=56KB/页⚠️ 未评估🟡
/ask 问答基于知识库的自然语言问答✅ RAG已搭建✅ 更强
OKF 格式兼容Google标准格式❌ 未对齐🟡 可选
raw→wiki 管线LLM编译富化✅ refine_pipeline.py

可借鉴的优化点

1. 增量富化模式 (最高价值)

当前问题refine_pipeline.py 扫描新 MD 文件后创建产品卡片。但如果同一产品有新资料上传,不会去富化已有的产品卡片。

借鉴方案


当前: COS新PDF → 新MD → 新建产品卡片 (独立)
目标: COS新PDF → 新MD → 查找已有卡片 → 如果有,增加新内容到现有卡片
                                        如果无,新建卡片

实现:在 refine_pipeline.py 中增加"更新已有卡片"逻辑:

python
existing = db.query(product_cards).filter(name=extracted_name).first()
if existing:
    # 增量更新:把新信息追加到已有卡片的字段中
    existing.selling_points += "|" + new_points
else:
    # 新建卡片
    db.insert(product_cards, {...})

2. 增量更新现有 wiki 页面

当前问题05_产品知识库/ 下的 MD 文件(199篇)是从 COS PDF 一次性生成的。当同一产品有新论文或培训材料时,现有 MD 文件不会增量更新。

借鉴方案cos_to_km.py 处理新 PDF 时,检查是否有同名 MD 文件:

3. 添加知识库健康检查 (lint)

bash
# 每小时或每天执行的 lint 脚本
lint_kb.sh:
  1. 检查断链: [[xxx]] 引用的文件不存在 → 报告
  2. 检查孤页: 没有被任何 [[xxx]] 引用的文件 → 报告
  3. 检查重复: 同名/相似内容的不同文件 → 报告
  4. 检查 _INDEX.md 与实际文件是否一致 → 报告
  5. 检查三件套完整性 → 报告

4. 全库单一入口页

创建 /home/ubuntu/光合盐KM知识库/[[README]].md,列出:

AI 和人在操作前先读这个页面。

5. OKF 格式预留

OKF 标准定义的知识单元结构:

yaml
type: knowledge
version: 0.1
id: companies/openai
title: OpenAI
tags: [ai, lab, llm]
relationships:
  - type: invests_in
    target: companies/anthropic
  - type: competes_with
    target: companies/google-deepmind

我们的产品卡片 YAML 已有类似结构,但缺少 relationships 字段。可在 YAML 头部增加:

yaml
---
product: 艾维岚
brand: Löviselle
links:
  contains: [[聚左旋乳酸]]
  produced_by: [[长春圣博玛]]
  indicated_for: [[面部抗衰]]
---

实施优先级

优先级改进项工作量收益
🔴lint 知识库健康检查1天发现断链/孤页/矛盾
🟡增量富化 refine_pipeline2天卡片自动生长不重复
🟡全库 [[README]] 入口页0.5天一目了然全库结构
🟢OKF 关系字段1天格式标准化
🟢增量更新 wiki MD2天资料自动生长

结论

光合盐知识库在设计理念上与 OKF 高度一致(raw层、wiki层、双链、cron自动化、RAG问答甚至更强),但缺少增量富化和质量检测两个关键能力。

文章最值得借鉴的不是架构(我们已经有了),而是:

  1. "永不从头重写,只富化已有" — 让知识自动生长而不膨胀
  2. 知识库体检 — 保证质量的自检机制

最后更新: 2026/6/21 17:00:04