知识库成熟度审计报告

08_数据分析2026/6/21

title: 知识库成熟度审计 — 距离"企业第二大脑"的差距

category: 08_数据分析

level: T2 🟡

status: ✅ 有效

dri: Hermes Agent

created: 2026-06-18

知识库成熟度审计报告

一、当前能力矩阵

能力维度	评分	状态说明
1. 数据存储	⭐⭐⭐⭐⭐	PostgreSQL + Meilisearch + COS + 文件系统, 4层冗余
2. 内容结构化	⭐⭐⭐⭐	3层体系(原始MD→产品卡片→概念卡片), 18+74字段标准化
3. 权限管控	⭐⭐⭐⭐	6级角色 × 8KB, 脱敏层, Cookie+API双认证
4. 管线自动化	⭐⭐⭐⭐	17条cron, PDF自动转MD, 每日提炼, RSS获取
5. 搜索能力	⭐⭐⭐	Meilisearch 关键词搜索, 多索引并行, 但无语义理解
6. 关联关系	⭐⭐	概念卡片有CardLink表(6种关系), 但手动维护, 无自动发现
7. AI问答(RAG)	⭐	❌ 无。DeepSeek只用于提炼, 不能基于知识库回答问题
8. 主动智能	⭐	❌ 全系统pull-based, 无主动推送/洞察/缺口检测
9. 用户使用	⭐	❌ 仅3个用户, 无反馈闭环, 系统未被充分使用
10. 知识图谱	⭐	❌ 无图数据库, 卡片间关系不可遍历查询

二、企业第二大脑成熟度模型


Level 5: 自主智能           目标(6-12月)
  主动推送·缺口检测·跨域综合

Level 4: 场景化AI          目标(3-6月)
  RAG问答·角色视角·工作流嵌入

Level 3: 关联知识图谱 ⬅️   目标(1-3月)
  向量搜索·自动关系发现·知识可视化

Level 2: 结构化知识库 ⬅️   当前(已达成)
  字段标准化·权限体系·管线自动化
  光合盐: 365MD, 984分块, 25产品卡, 74概念卡

Level 1: 文档库            当前(已超越)
  文件存储·关键词搜索

三、最重要的差距

差距1: 知识与AI之间隔着一层"语义"

当前：用户搜索"敏感肌抗衰" → Meilisearch匹配关键词 → 返回包含这些词的分块

第二大脑：用户问"敏感肌怎么抗衰？" → 向量检索找到最相关分块 → DeepSeek综合多源信息生成答案

修复成本最低, 收益最大。pgvector已在PostgreSQL内, 零新增基础设施。

差距2: 知识是孤岛, 不是网络

当前：25张产品卡片独立, 74张概念卡片独立。CardLink表存在但内容极少。

第二大脑：发现"[[艾维岚]]含有PLLA"、"PLLA属于再生材料"、"再生材料适应症是面部松弛" → 形成可遍历的知识网络。

差距3: 系统不"思考"

当前：只存储和检索。所有内容都是用户/hermes手动写入的。

第二大脑：自动检测"概念X出现在8篇MD中但没有对应的概念卡" → 建议创建。自动发现"产品A的卖点和产品B的适应症重叠" → 生成联合推荐。

差距4: 没有人在用

3个用户 vs 6个门店 × 多个员工。系统不被人用 → 没有反馈 → 无法变聪明。

四、改进路线图

Phase 1 — 让知识库"能对话"（1周）

任务	说明	难度
pgvector 安装	PostgreSQL已有, 只需启用extension	极低
向量化脚本	对984个分块调用DeepSeek embedding	低
RAG API	用户提问→向量搜索→DeepSeek回答	低
Admin RAG页面	管理后台 + 对话测试界面	低

Phase 2 — 让知识"自己长"(2周)

任务	说明	难度
自动关系抽取	读取所有卡片→LLM提取关系→写入CardLink	中
关系可视化	管理后台的网状关系图	中
语义相似推荐	每个卡片下方显示"相关概念"	低
缺口检测	扫描MD→发现未建卡的概念	中

Phase 3 — 让系统"主动推"（1月）

任务	说明	难度
知识日报	DeepSeek每日生成"今日新增知识摘要"	低
使用分析	哪些内容被查最多、哪些查询无结果	中
反馈闭环	每篇内容/每个答案加thumbs up/down	中

Phase 4 — 让知识"嵌入工作"（1-3月）

任务	说明	难度
角色视角RAG	医师看到临床视角, 咨询师看到销售视角	中
企业微信集成	咨询师在企微上直接提问	中
智能推荐	根据客户情况推荐产品组合+话术	高

五、结论

能成为企业第二大脑吗？—— 骨架已成, 缺神经。

存储✅ 权限✅ 管线✅ → 骨架
语义检索❌ 知识网络❌ 主动智能❌ → 缺神经系统

当前成熟度: Level 2（结构化知识库）

离"第二大脑"(Level 4-5)的差距: 约6个月工程

最高ROI下一步: 上pgvector + RAG（1周, 零新增基础设施）

最后更新: 2026/6/21 17:00:04