公司网站部署后遇到的奇怪问题
???? 公司的产品成功部署,试运行上线,非常高兴,大半年的努力有了回报。但是还没有高兴多久,用户就反馈有些产品的页面中分页的功能不能正确使用,就是单击下一页的时候没有反映。不能使用的用户没有规律,部分用户可以使用,部分用户不能使用。经过我们的内部测试,都是可以正常使用,排除了服务器配置问题、防火墙、IPS、路由器的问题。相当的头疼。
????? 后来在故障的排查过程中,发现公司部分员工的机器也不能正常使用分页功能,这些就有些头绪,本人决定在服务器和客户机上抓包定位,这里要说明下一我们公司网站的架构了:
?
??????????????????? router
??????????????????????? |
??????????????????????? |
????????????????????? FW
??????????????????????? |
????????????????????? IPS
??????????????????????? |
??????????????? F5---SW
??????????????????????? |
?????????????? Web Clutser
?
????? 由于使用了F5设备进行web和数据库的负载均衡,如果要转包就需要保持在集群中只有一台webserver。动手.....
经过转包分析,用户在点击了下一页的时候发送的Ajax请求的源端口发生了变化,和建立Http连接时候的源端口不一致,这时候以为发现了问题的根源,经过对使用正常的机器抓包分析同样是源端口发生了变化,区别就只有两台机器的出口方式不一样,就是通过不同的ADSL到公网,这是我有个灵感闪现,在两台机器上面使用tracert跟踪访问公司的IP,看看有什么不同,结果发现使用正常的机器可以跟踪到HOP信息,不能正确使用的机器不能跟踪到Hop信息。这个就奇怪了,同是电信的ADSL,为什么有这样的区别呢?问题的根源很可能就在我们的IP地址配置问题了,因为我们使用是电信代理商分配的IP地址,我们其实就是代理商的一个子网段,但是是他们那里的路由信息配置问题?这个就需要那边的技术人员协助定位了。有了处理结果,再通知大家。
?
问题终于解决:
?????? 过程是这个样子的,我们将公司的公网IP撤销VPN的Tunel,直接放在公网上(就是在电信的路由器上做数据),问题就不在出现了。看来问题还是在VPN上面,我的估计应该是VPN对数据包进行加密后,一部分网络设备对包传输过程中出现了丢失,造成这种现象,这个只是我的估计。具体的原因还需要查找。
1 楼 hifun 2008-09-14 似懂非懂的。