关于ZNKC用户的数据迁移架构设计的回复
使用过程中的设备故障点在双存储环境下,由于在TSM备份服务器、FC光交、存储设备、都有冗余设计消除了单点故障。而如果采用单存储V7000+老存储,单点故障点如下: V7000设备的卷控制器、老存储本身、由于是异构存储基于TSM来扩管,无法基于多路径实现冗余存储链路,因此链路是1条,因此也存在单点故障。如果出现故障:双设备无需干预,利用v7000的mirror和cluster故障自动切换,由于v7000 cluster不支持vsphere site recovery manager 3.5/4.1版本,因此利用TSM for VE来进行手工恢复,多路径链路发挥作用。如果是单设备,当出现故障的时候:1、TSM故障:需要人工修复TSM软件故障,然后重新挂载TSM备份数据。2、卷控制器故障:需要人工刷新V7000 Fireware版本至6.5以上,或保修更换卷控制器,然后重新配置v7000挂载相关数据。3、老存储本身故障,人工利用TSM for VE的方式将ESX3.5数据利用备份数据恢复数据到V7000或其他存储介质上,利用TSM for DB将数据库数据的备份恢复到V7000或其他存储介质,利用TSM逻辑卷管理fastback将操作系统备份恢复到v7000或其他存储介质上。
恢复时间如下:
由于出现的故障原因有多种,而且故障源也有多样,因此恢复时间应该细化来看:
前提是双V7000环境下,所有配置齐全环境,含用户方群集环境
1. 操作系统故障、应用服务器无误、数据库无误、硬件主机无误、存储无误、光纤交换机无误:故障恢复时间约15秒(Windows 2000/2003/2008)
2. 操作系统无误、应用服务器故障、数据库无误、硬件主机无误、存储无误、光纤交换机无误:故障恢复时间约30秒×应用资源个数(Windows 2000/2003/2008)
3. 操作系统无误、应用服务器无误、数据库故障、硬件主机无误、存储无误、光纤交换机无误:故障恢复时间约30秒×应用资源个数(Windows 2000/2003/2008)
4. 操作系统无误、应用服务器无误、数据库无误、硬件主机故障、存储无误、光纤交换机无误:故障恢复时间约15秒(Windows 2000/2003/2008)
5. 操作系统无误、应用服务器无误、数据库无误、硬件主机无误、存储故障、光纤交换机无误:V7000群集切换时间约2分钟,镜像数据可用时间约1分钟,合计3分钟
6. 操作系统无误、应用服务器无误、数据库无误、硬件主机无误、存储无误、光纤交换机故障:光纤交换机切换时间约2分钟,由于冗余设计,即使发生故障多路径设计也可以正常使用,用户无觉察。可以容错。
7. 虚拟机vsphere ESX故障、如果采用ESX Live启动设计,系统恢复时间为:物理服务器重启时间约10分钟。
8. 虚拟机vsphere 虚拟机故障,如果采用vmware HA设计,故障转移时间为:30秒以内。如果采用vmware FT设计,故障转移时间为3秒以内,近乎实时。
9. Oracle RAC环境下,RAC node节点故障由RAC自行进行故障切换,在以下设计中:RAC基于裸设备构建,OLTP数据模式,切换时间为2分钟。RAC基于ASM构建,OLTP数据模式,切换时间为10分钟。RAC基于裸设备构建,OLAP数据模式,切换时间为5分钟。RAC基于ASM构建,OLAP数据模式,切换时间为20分钟。
10. Oracle Standby环境,数据完全损坏、无RAID环境,由于基于TSM物理备份恢复时间约10GB花费12分钟、TSM逻辑备份恢复时间约10GB花费18分钟,逻辑部分方式比物理备份方式增加了Oracle数据的校验扫描,因此时间相反会更长一些,但也更可靠些。
11. SQLServer数据库恢复,SQLServer Cluster环境下,故障切换时间约15秒。如果基于SQLServer实施了SQLServer镜像,故障切换时间几乎实时。如果基于IBM CDC技术来实施SQLserver表级别的数据同步连续数据复制CDP,故障切换时间也是实时的,而且比SQL镜像更可靠,由于是表级别的,不是实例级别,因此应用可以连接即用,无需像SQL镜像那样还需配置后可用,因此恢复时间为实时,但是配置时间也计算在内的话,后者的时间消耗更少。SQLserver单机环境下同上。