151、中级运维面试题精选
2000/6/12大约 3 分钟
中级运维面试题精选
运维中级岗位需要掌握自动化、容器化与高可用能力,下列 15 题可帮助你完善答题思路。
自动化与流程
设计一套 CI/CD 流程,说明构建、测试、发布、回滚各环节使用的工具。
- 追问:如何实现多环境并行部署与差异校验?
- 核心考察:流水线编排、自动化审批、回滚机制。
如何在 GitOps 模式下管理多环境配置并防止漂移?
- 追问:配置回滚过程如何保证安全?
- 核心考察:Git 仓库、Kustomize/Helm、审计。
比较 Ansible、Chef、Puppet 的特性与适用场景。
- 追问:你所在团队是如何选择的?
- 核心考察:配置管理工具、幂等、学习成本。
如何评估自动化脚本的可靠性?需要哪些测试与回滚措施?
- 追问:如何在脚本中注入安全检查?
- 核心考察:脚本测试、Canary、日志记录。
描述一次发布事故的复盘过程与改进措施。
- 追问:复盘结论如何固化成流程?
- 核心考察:事故响应、改进闭环、知识沉淀。
容器与云原生
Kubernetes 中 Deployment、StatefulSet、DaemonSet 的区别与典型场景是什么?
- 追问:如何编写 YAML 模板提高复用性?
- 核心考察:控制器原理、工作负载分类。
如何排查 Pod CrashLoopBackOff?列出排查命令。
- 追问:遇到启动依赖顺序问题如何解决?
- 核心考察:kubectl logs/describe、事件诊断。
解释 Service、Ingress、LoadBalancer 的关系与使用案例。
- 追问:在多集群下如何统一入口?
- 核心考察:服务暴露、流量治理、网关。
K8s 集群升级时需要关注哪些兼容性与回滚问题?
- 追问:你会如何安排升级窗口?
- 核心考察:版本策略、灰度升级、备份恢复。
如何在容器内采集日志并接入集中化平台?
- 追问:日志激增时如何扩展处理能力?
- 核心考察:Sidecar、EFK/ELK、日志切割。
高可用保障
设计 Nginx + Keepalived 的高可用架构并描述故障切换流程。
- 追问:如何验证 Keepalived 切换结果?
- 核心考察:HA 方案、虚拟 IP、健康检查。
MySQL 主从延迟过大如何处理?
- 追问:如何提前预警主从延迟?
- 核心考察:复制机制、调优、监控。
如何制定容量规划并设置自动扩缩容阈值?
- 追问:容量超出预警后采取哪些措施?
- 核心考察:指标采集、预测模型、弹性扩容。
灾备演练的频率与步骤如何安排?
- 追问:演练失败如何总结与整改?
- 核心考察:备份恢复、演练流程、责任矩阵。
分享一次处理跨机房网络抖动的方案。
- 追问:关键指标如何监测?
- 核心考察:网络冗余、流量切换、联动机制。