知识库成熟度审计报告

08_数据分析


title: 知识库成熟度审计 — 距离"企业第二大脑"的差距

category: 08_数据分析

level: T2 🟡

status: ✅ 有效

dri: Hermes Agent

created: 2026-06-18


知识库成熟度审计报告

一、当前能力矩阵

能力维度评分状态说明
1. 数据存储⭐⭐⭐⭐⭐PostgreSQL + Meilisearch + COS + 文件系统, 4层冗余
2. 内容结构化⭐⭐⭐⭐3层体系(原始MD→产品卡片→概念卡片), 18+74字段标准化
3. 权限管控⭐⭐⭐⭐6级角色 × 8KB, 脱敏层, Cookie+API双认证
4. 管线自动化⭐⭐⭐⭐17条cron, PDF自动转MD, 每日提炼, RSS获取
5. 搜索能力⭐⭐⭐Meilisearch 关键词搜索, 多索引并行, 但无语义理解
6. 关联关系⭐⭐概念卡片有CardLink表(6种关系), 但手动维护, 无自动发现
7. AI问答(RAG)❌ 无。DeepSeek只用于提炼, 不能基于知识库回答问题
8. 主动智能❌ 全系统pull-based, 无主动推送/洞察/缺口检测
9. 用户使用❌ 仅3个用户, 无反馈闭环, 系统未被充分使用
10. 知识图谱❌ 无图数据库, 卡片间关系不可遍历查询

二、企业第二大脑成熟度模型


Level 5: 自主智能           目标(6-12月)
  主动推送·缺口检测·跨域综合

Level 4: 场景化AI          目标(3-6月)
  RAG问答·角色视角·工作流嵌入

Level 3: 关联知识图谱 ⬅️   目标(1-3月)
  向量搜索·自动关系发现·知识可视化

Level 2: 结构化知识库 ⬅️   当前(已达成)
  字段标准化·权限体系·管线自动化
  光合盐: 365MD, 984分块, 25产品卡, 74概念卡

Level 1: 文档库            当前(已超越)
  文件存储·关键词搜索

三、最重要的差距

差距1: 知识与AI之间隔着一层"语义"

当前:用户搜索"敏感肌抗衰" → Meilisearch匹配关键词 → 返回包含这些词的分块

第二大脑:用户问"敏感肌怎么抗衰?" → 向量检索找到最相关分块 → DeepSeek综合多源信息生成答案

修复成本最低, 收益最大。pgvector已在PostgreSQL内, 零新增基础设施。

差距2: 知识是孤岛, 不是网络

当前:25张产品卡片独立, 74张概念卡片独立。CardLink表存在但内容极少。

第二大脑:发现"[[艾维岚]]含有PLLA"、"PLLA属于再生材料"、"再生材料适应症是面部松弛" → 形成可遍历的知识网络。

差距3: 系统不"思考"

当前:只存储和检索。所有内容都是用户/hermes手动写入的。

第二大脑:自动检测"概念X出现在8篇MD中但没有对应的概念卡" → 建议创建。自动发现"产品A的卖点和产品B的适应症重叠" → 生成联合推荐。

差距4: 没有人在用

3个用户 vs 6个门店 × 多个员工。系统不被人用 → 没有反馈 → 无法变聪明。

四、改进路线图

Phase 1 — 让知识库"能对话"(1周)

任务说明难度
pgvector 安装PostgreSQL已有, 只需启用extension极低
向量化脚本对984个分块调用DeepSeek embedding
RAG API用户提问→向量搜索→DeepSeek回答
Admin RAG页面管理后台 + 对话测试界面

Phase 2 — 让知识"自己长"(2周)

任务说明难度
自动关系抽取读取所有卡片→LLM提取关系→写入CardLink
关系可视化管理后台的网状关系图
语义相似推荐每个卡片下方显示"相关概念"
缺口检测扫描MD→发现未建卡的概念

Phase 3 — 让系统"主动推"(1月)

任务说明难度
知识日报DeepSeek每日生成"今日新增知识摘要"
使用分析哪些内容被查最多、哪些查询无结果
反馈闭环每篇内容/每个答案加thumbs up/down

Phase 4 — 让知识"嵌入工作"(1-3月)

任务说明难度
角色视角RAG医师看到临床视角, 咨询师看到销售视角
企业微信集成咨询师在企微上直接提问
智能推荐根据客户情况推荐产品组合+话术

五、结论

能成为企业第二大脑吗?—— 骨架已成, 缺神经。

当前成熟度: Level 2(结构化知识库)

离"第二大脑"(Level 4-5)的差距: 约6个月工程

最高ROI下一步: 上pgvector + RAG(1周, 零新增基础设施)


最后更新: 2026/6/21 17:00:04