一个纯技术问题的完整拆解示例

服务启动很慢，但 CPU、内存都不高，问题出在哪？

这是一个我在真实项目中遇到过、也见过很多人遇到的问题：

一个后端服务启动需要 2～3 分钟，但服务器 CPU、内存都很空闲。

没有报错，没有异常，日志也在正常打印，就是——慢。

一、问题是怎么出现的

背景很常见：

Java 后端服务
Spring Boot 项目
部署在普通云服务器
服务功能并不复杂

但有一天发现：

本地启动：30 秒左右
服务器启动：2～3 分钟
重启多次，结果一致

最让人困惑的是：

资源看起来完全够用。

二、为什么这个问题会卡住

这个问题之所以难，原因在于：

没有明显异常
- 没有报错
- 没有堆栈
监控数据“看起来正常”
- CPU 低
- 内存充足
启动过程是黑盒
- Spring Boot 启动阶段默认不透明

于是问题变成了：

它到底在“等什么”？

三、第一步：先让启动过程“可观察”

在没有任何猜测之前，我先做了一件事：

👉 打开 Spring Boot 启动耗时日志

1

java -jar app.jar --debug

并在日志中重点关注：

Bean 初始化耗时
自动配置加载顺序
卡顿发生的阶段

很快发现一个关键信号：

卡在某些 Bean 初始化阶段，每个耗时十几秒。

四、缩小范围：定位“慢 Bean”

接下来做了两件事：

1️⃣ 启用启动耗时统计

1

spring.main.log-startup-info=true

2️⃣ 对比本地与服务器日志

结果非常关键：

本地：几乎瞬间完成
服务器：部分 Bean 初始化极慢

说明问题不是代码逻辑本身，而是运行环境差异。

五、真正的原因：DNS 反向解析

继续顺着慢 Bean 查下去，最终定位到：

数据库连接池初始化
日志组件初始化

它们都做了一件事：

获取本机主机名 / IP 的反向解析

在服务器环境中：

DNS 配置不完整
反向解析超时
每次超时都要等十几秒

于是：

一个 Bean：慢 10 秒
十几个 Bean：直接 2～3 分钟

六、解决方案：让问题“直接失效”

答案并不复杂，但非常关键。

✅ 方案 1：关闭 DNS 反向解析（推荐）

在 JVM 启动参数中加入：

1
2


-Djava.net.preferIPv4Stack=true
-Dsun.net.inetaddr.ttl=60

或在相关组件中显式指定 IP，避免自动解析。

✅ 方案 2：修复服务器 DNS（根因方案）

配置正确的 /etc/hosts
确保主机名可解析
避免反向 DNS 超时

七、验证结果

修改后：

服务启动时间：30 秒左右
CPU、内存无变化
日志初始化正常

问题彻底消失。

八、这个问题带来的真实收益

这个答案带来的收益，不止是“启动快了”。

✅ 1. 少了一类“玄学问题”

以后再遇到：

服务无故变慢
启动阶段卡住
资源却很空闲

我会第一时间想到： 👉 是不是环境级阻塞？

✅ 2. 得到一个可复用的排查模板

这次问题，沉淀出一个通用方法：

先让过程可观察
对比不同环境
优先怀疑 IO / 网络 / DNS
再回头看代码

✅ 3. 这个答案可以被反复使用

这个问题，后来在至少 3 个项目中再次出现，但我再也没有被它困住过。

九、用 problem.plus 的结构回看这个问题

问题：服务启动异常缓慢
卡点：无报错、无异常、资源正常
拆解：日志 → Bean → 环境差异
答案：DNS 反向解析导致阻塞
收益：启动恢复、方法论沉淀

结语

这是一个非常“普通”的技术问题。

但它的价值在于：

出现频率高
排查成本大
答案一旦知道，非常稳定

问题是契机，答案是收益。

这正是 problem.plus 想长期记录的内容。

一个纯技术问题的完整拆解示例#

服务启动很慢，但 CPU、内存都不高，问题出在哪？#

一、问题是怎么出现的#

二、为什么这个问题会卡住#

三、第一步：先让启动过程“可观察”#

👉 打开 Spring Boot 启动耗时日志#

四、缩小范围：定位“慢 Bean”#

1️⃣ 启用启动耗时统计#

2️⃣ 对比本地与服务器日志#

五、真正的原因：DNS 反向解析#

六、解决方案：让问题“直接失效”#

✅ 方案 1：关闭 DNS 反向解析（推荐）#

✅ 方案 2：修复服务器 DNS（根因方案）#

七、验证结果#

八、这个问题带来的真实收益#

✅ 1. 少了一类“玄学问题”#

✅ 2. 得到一个可复用的排查模板#

✅ 3. 这个答案可以被反复使用#

九、用 problem.plus 的结构回看这个问题#

结语#