程序告诉你的事情(节省自己的时间)
系统运行在QA或产品环境上才是真正考虑我们程序员的时候。QA和OP看到任何异常时会求助于我们,然后我们经常的动作可能是:询问QA和OP问题出现的症状,登录到服务器上,查看日志和环境,分析问题。长此以往,发现自己的时间一天天浪费在回复QA:build是老的,网络中断,配置不是最新的,系统初始化失败,。。。
从我自己的经验来看,绝大部分报上来的问题是环境和依赖所导致。我们也不能依靠QAs来检查这些异常吧(他们会认为我们的代码是一头“怪物”)。
自力更生!让自己的程序来告诉我们,为什么现在出错了?
程序运行时,对大家来说,都是黑盒子。如果没有web监控方式,那么日志就是系统最好的“脸面”了,察言观色就从日志开始。
如果要追踪问题,我们希望看到哪些信息呢?我大概列出来:
build version初始化的配置信息(用来检查配置是不是最新)重要的参数 (如请求地址,名称等等,它们只在内存中,平时是看不到的)依赖的状态 (网络是否正常,依赖的其它组件初始化是否正常,等)
这些信息足够关键,如果QA和OP看到这些信息而不是原始的异常,那么他们也能基本定位问题,是吧?
另外一个问题,什么时候需要这些状态信息显示呢?在我看来,有这几个时间:
系统启动后,提供服务之前 (用来判断启动是否正常)出现严重异常时 (不是NPE这些基本异常,和业务有关)外部监控请求系统状态时
一般来说,外部监控只能得到系统进程的运行状态,它不能获取到有价值的内部状态。内部状态只有程序员才知道是否重要,是否有必要让外部
监控起来。对于这个问题,这里来分享一个简单的例子。
首先,每个需要监控起来的重要组件都要实现这样的一个接口,StateReporter。系统里面的重要组件一般是系统型的类,如xxxManager等触角
广泛的类。这些类一般可以提供足够多,足够广的状态信息。StateReporter很简单,除了收集所有想展现的状态信息外,还能起标识作用。
/** * Implementation of this interface should collect/re-check state of * primary in-memory parameters and * system dependencies(DB, network or other 'heavy' components). * <br> * System could report state information when fatal or * specified exception occurred, checking periodically ... * <br> * To reduce the invocation frequently. * * @author dennyy99@gmail.com * @since 2012-5-15 * @version 1.0 */public interface StateReporter {public String LF = "\n";public String CR = "\r";public String SPLIT_MSG = "========Additional State========" + LF;/** * Obtains state information from implementation * * @return state collection for troubleshooting and system monitoring */public String obtainStateReport();}
public class TargetManager implements StateReporter
TargetManager manager = new TargetManager("Baidu");try {manager.requestRemote("http://www.baidu.com/");} catch (Exception e) {e.printStackTrace();if (manager != null && manager instanceof StateReporter) {System.out.println("Error occurs. Additional msg:");System.out.println(manager.obtainStateReport());}}