系统全量审计报告

09_IT运维与系统

系统全量审计报告

审计日期: 2026-06-08

审计范围: 全部 11 个 systemd 服务 + 数据库 + ETL + 前端




一、执行总结


过去 2 天完成的工作:


阶段内容耗时
Phase 1备份脚本、Holographic 记忆、Web UI 升级、知识库✅ 完成
Phase 2A数据仓库(PG 建库 + 同步脚本 + 12个物化视图)✅ 完成
Phase 2B展示层(Di[[f]]y 知识库 + Metabase BI + 推送机器人)✅ 完成
Phase 2C基础设施(Nginx SSL + 域名 + 防火墙 + 优化)✅ 完成

二、架构现状

2.1 服务运行状态

服务状态端口内存说明
nginxactive80/443Di[[f]]y + Metabase 反代 + SSL
MySQLactive3306462MBruimeiyun 原始数据
PostgreSQLactive5432~100MBDi[[f]]y + ruimeiyun_dw 数仓
Redisactive6379Di[[f]]y 缓存/队列
di[[f]]y-apiactive5001~400MBDify 后端 API
di[[f]]y-webactive3000~200MBDify 前端
di[[f]]y-celeryactive~100MB文档索-引队列
metabaseactive3001~1GBBI 看板(已限制 512MB)
hermes-gatewayactive8642~100MBHermes API
hermes-web-uiactive8888~200MBHermes Web

2.2 数据架构


睿美云远程DB (123.56.250.44:29613)
     │ 每日9:00 crontab
     ▼
MySQL ruimeiyun — 8张基表(纯原始数据,无视图)
     │ 每日10:00 sync_ruimeiyun_dw.py
     ▼
PostgreSQL ruimeiyun_dw
     ├── 7张 stg_* 表(原始数据镜像,697K行)
     └── 12个物化视图(DWD x2 + DWS x7 + ADS x3)
           │
           ├── Metabase BI 看板 ← 你在这里
           ├── Dify 知识库查文档 ← 已可用
           └── push_bot.py 推微信 ← 差 Webhook URL

2.3 12个物化视图状态

视图行数状态
DWDm_dwd_customer_visit76,126
DWDm_dwd_customer_consultant44,531
DWSm_dws_daily_kpi4,100
DWSm_dws_consultant_monthly450
DWSm_dws_doctor_monthly2,117
DWSm_dws_nurse_monthly430
DWSm_dws_cra[[f]]tsman_monthly502
DWSm_dws_project_analysis15,734
DWSm_dws_recall_per[[f]]ormance508
ADSm_ads_customer_r[[f]]m13,863
ADSm_ads_churn_warning17,635
ADSm_ads_executive_dashboard154

三、已发现并修复的问题

问题发现时间修复
MySQL 24个标准视图损坏Phase 2A✅ 全部删除,MySQL 改为纯数据存储
24个 MySQL 标准视图实际已损坏(列不存在)Phase 2A✅ PostgreSQL 物化视图替代
Di[[f]]y SSL 证书不存在Phase 2C✅ Let's Encrypt 签发
Di[[f]]y 443 端口云防火墙未开Phase 2C✅ 用户开通安全组
Di[[f]]y Cookie 域名未配置导致登录循环Phase 2C✅ 添加 COOKIE_DOMAIN
Mock Plugin Daemon 不能装插件Phase 2C✅ 禁用插件系统,改用 push_bot.py
Di[[f]]y 前端 JS 加载慢 (59MB)Phase 2C✅ Nginx 直接提供静态文件 + gzip + 1年缓存
Di[[f]]y 前端 API 前缀不匹配Phase 2C✅ 重建前端 HTTPS 配置
Metabase /bi 子路径配置错误Phase 2C✅ MB_SITE_URL + Nginx 路径修复
Metabase 内存无限制 (1.3GB)本次审计✅ 限制为 512MB
crontab 同步脚本丢失本次审计✅ 已加回
Nginx SSL 证书配置路径验证本次审计✅ 确认有效

四、对标行业最佳实践

4.1 已达标 ✅

实践现状
服务自动重启✅ 全部 systemd,[[f]]ailure 自动重启
数据备份✅ 每日全量备份,保留 30 天
数据库读写分离✅ MySQL(写) → PostgreSQL(读)
数据分层✅ ODS → DWD/DWS → ADS
API 认证✅ Di[[f]]y API Key
SSL/TLS✅ Let's Encrypt
静态缓存✅ 1 年缓存 + gzip
HTTP/2✅ Nginx http2

4.2 待改进 🔴

编号差距风险建议
G-01单点故障VM 宕机 → 全部停止PostgreSQL 异地备份到对象存储;关键配置版本管理
G-02无监控告警服务挂了无人知push_bot.py --health 已写好,需配 Webhook URL
G-03Metabase 内存仍偏高限制 512MB 后重启,实际可能回到 1GB观察重启后实际内存
G-04无 CI/CD修改物化视图 DDL 需手动执行同步脚本已在版本管理中(sync_ruimeiyun_dw.py
G-05无负载测试多用户并发时性能未知当前 1 人使用,暂不需要

4.3 企业级增强 🟡

编号建议优先级说明
E-01PostgreSQL 异地备份到 COS每天备份完自动上传到腾讯云对象存储
E-02统一监控(node_exporter + Prometheus)系统资源 + 服务可用性监控
E-03Di[[f]]y 员工账号配置登录 Dify → 设置 → 成员管理
E-04Hermes 多用户隔离已有 3 个 pro[[f]]ile,需创建用户绑定

五、下一步建议

本周可做(你独立完成)


1. 企业微信群获取 Webhook URL → 给我
2. Metabase 看板编排:编辑 → 添加卡片 → 拖拽布局
3. Dify 创建员工账号:设置 → 成员管理 → 添加用户

本周可做(我完成)


4. 配好 push_bot.py → 日报/告警推送到你微信
5. Metabase 内存观察 → 确认限制生效

后续规划


6. PostgreSQL 异地备份 → 腾讯云 COS
7. 系统监控 → node_exporter + 告警


最后更新: 2026/6/17 22:00:04