王宗凯
从"看得见"到"处理得动"到"能自主决策"
Java/Python/LLM 全栈
日志中台实时处理
标准化 RAG 知识库
运维问答 Top5
DOSM可观测中台架构
Java架构师 · 2021.08 – 2022.06
传统运维体系中,主机、中间件、数据库、业务日志、服务调用等运维数据分散独立,形成大量数据孤岛,且缺乏标准化的日志处理、链路追踪、智能告警能力,导致生产故障排查周期长、运维人力成本高、业务风险不可控。本中台搭建"日志+链路追踪+监控告警"三位一体全域可观测数据底座,实现全域运维资源可视化、故障快速定位、自动化预警处置。
采集层
传输层
处理层
存储层
查询层
可视化
全域运维数据采集覆盖
微服务全链路追踪
一体化架构设计
DOSM日志中台
架构师 · 2022.06 – 2024.06
传统日志系统存在两大核心瓶颈:高并发场景下海量日志同步采集挤压业务读写带宽,造成核心业务 TPS 抖动;单一 ES 架构在数据量突破百亿级后查询聚合性能断崖式下跌,无法支撑千亿、万亿级日志存储。本项目牵头完成日志中台全架构升级,搭建高并发、低延迟、可无限扩容的海量日志处理架构。
流式处理管道
采集
100W TPS 资源隔离
传输
Kafka 削峰解耦
计算
Flink 实时清洗聚合
存储
ES/ClickHouse 冷热分层
🔥 冷热分层存储架构
ES 热集群
- 近 10 天热点数据
- 按天拆分索引
- 高频检索优化
CH 冷集群
- 历史全量数据
- 低成本归档
- 列式聚合查询
日志中台实时处理
冷热分层异构存储
智能路由查询 秒级响应
DOSM AI运维Agent智能体中台
架构师 · 2024.08 – 至今
伴随企业 IT 架构云原生化,运维场景愈发复杂,传统"问答机器人+固定流程"模式存在意图识别不准、多轮对话断裂、记忆丢失、无法处理复杂任务等痛点。本中台作为 DOSM 智能助理"云小慧"的核心大脑,依托 LLM + ReAct 推理、DAG 流程编排、Harness 长任务三大核心引擎,构建"能听、能懂、能记、能做、能学"的数字化运维员工体系。
三大核心引擎
ReAct 推理
思考→行动→观察→反思
知识问答、资产查询、工单进度查询
DAG 编排
有向无环图流程编排
智能提单、告警根因分析、故障自愈
Harness 长任务
状态持久化 + 断点续跑
资源调度、数据库调优、自动化巡检
搭建标准化、可观测、高可用、可复用、跨异构语言(Java + Go + Python)的智能体底层治理底座。主导打通 SpringCloud Java 生态与 Python AIGC 微服务生态壁垒,基于 Nacos 统一实现服务注册、配置管理与动态 RPC 通信。重构智能体中台接入层,设计全渠道统一会话网关体系。
服务治理 Infra
新 Agent 落地周期缩短
Top5 从 65% 提升至 88%
从 0.50 提升至 0.92
P1/P2 从小时级降至 5 分钟
新 Agent 落地周期缩短
10年能力跃迁
从初级研发到架构师,从单体到AI Native
🌱 基础积累期
亚信科技 · 5年 · 初级→高级开发
2016-2021
🚀 架构跃迁期
云智互动 · 4年+ · Java架构师
2021-至今
🌱 基础积累期(亚信科技 · 2016-2021):5 年电信行业核心系统研发经验,从初级研发成长为高级 Java 开发。 主导 AOP 运维监控系统从 0 到 1 搭建,为后来可观测中台的架构设计埋下种子; 负责中国联通积分商城架构重构与全量容器化迁移,完成从单体到云原生的技术跃迁; 支撑日均千万级统一认证请求。 这段经历奠定了我在高并发、分布式、运维监控领域的工程底座。
AOP运维监控系统
初级→Java开发
AOP接口集成平台
Java开发
积分商城2.0云化
核心开发
中国联通统一认证
高级Java开发
可观测中台
Java架构师
日志中台
架构师
低代码平台
架构师
AI Agent中台
架构师
单体架构 → SOA → 微服务 → 云原生 → AI Native
脚本运维 → 自动化运维 → 平台化运维 → AI 智能运维
执行者 → 核心骨干 → 架构师 → 技术领导者
技术能力图谱
📌 技术栈 · 点击标签跳转关联项目
📋 工程素养
AI 面试官
和我的数字分身聊聊项目 · 基于真实经历回答
你好!我是王宗凯的AI数字分身。我基于他真实的项目经历回答你的问题。你可以问我关于可观测中台、日志中台、AI Agent中台或他的职业经历。有什么想了解的吗?