其它文章
今天你备份了吗
如何评估你的存储系统
10分钟完成灾难恢复
存储备份无人职守
存储容灾方案介绍
备份+复制双重保护
VCS通过故障转移来保证系统的灵活性
SAN与NAS共同构建数字档案馆
基于NAS的个人工作数据自动备份
IT灾难恢复基础之灾难恢复五步法
Cisco技术 / 技术专题 / 存储技术 / Veritas助力电信防灾

Veritas助力电信防灾

作者:     http://cisco.ccxx.net

Veritas助力电信防灾

  一. 某电信公司T2100网管系统联通工程容灾方案背景与需求 

容灾,对于IT而言,就是一个提供能防止各种灾难的计算机信息系统,使得用户的核心计算机系统(主点,如北京机房)在遭受如:火灾、水灾、地震、战争、人为破坏等不可抗拒的灾难和意外时,能够及时恢复系统的正常运行。其中的基本条件是要在异地(灾备点,如广州机房)有一个备份系统,并且主点的数据被实时复制到灾备点(可以称之为数据级容灾),在此基础上再将应用切换到灾备点(应用级容灾)。某电信公司T2100网管系统作为一个功能强大的高性能网管系统必需具有高可用性和灾难恢复功能,以保证它可以不间断地对所管理的网元和子网做故障/告警管理、配置管理、安全性管理和性能管理等,进而保证被管理网络的持续不断的正常运行。在某电信公司T2100网管系统的联通工程中,主点为联通网管中心北京机房,它运行某电信公司T2100网管系统对相关传输网络进行管理,同时,为了能够在灾难发生后(如主点北京机房出现严重故障或灾难),T2100网管系统依然可以不间断地管理相关网络,联通在广州的网管中心建立了T2100的灾备系统,以便适时接管T2100网管业务。显然,这种容灾方案必需是一个在数据级容灾基础上的应用级容灾方案。

二. 方案分析

根据上面的需求, 某电信公司T2100网管系统的联通工程采用了Veritas公司的整套容灾解决方案:

1、技术简介

VERITAS的容灾方案是一个包括数据级和应用级的整体解决方案。其中,数据级容灾系统将主点数据实时复制到灾备点。复制,顾名思义就是将用户应用系统数据拷贝到另外一个不同的物理点上。数据复制技术是容灾系统的基础。数据复制,主要有同步数据复制和异步数据复制两种。同步数据复制,指通过将本地生产数据以完全同步的方式复制到异地,每一本地IO交易均需等待远程复制的完成方予以释放。异步数据复制则是指将本地生产数据以后台同步的方式复制到异地,每一本地IO交易均正常释放,无需等待远程复制的完成。同步复制实时性强,灾难发生时远端数据与本地数据完全同步。但这种方式因为数据在网络中的传输延迟而影响主点的应用性能。异步复制则不然,但可能导致灾备点数据比主点数据有一定延迟,这些延迟的数据在灾难发生后将丢失。由此可见,同步方式和异步方式实际上是各有千秋,需要依据具体的应用,在应用性能和潜在的可能丢失数据量之间作一个取舍和均衡。VERITAS的VVR(Veritas Volume Replicator)是一个灵活而高性能的基于Volume的复制软件,它通过一个叫SRL的Volume做被复制数据的缓存和序时记录,充分保证可靠的复制并保证主备点数据的一致性。

深圳某电信公司的T2100是一个实时性很强的高性能网管系统,相对而言,其主点的应用性能更为关键和重要,由此,采用异步复制方式较为合适。同时,依据其数据流量均值并结合峰值可以确定主备点(北京和广州)之间的复制链路带宽为2M,同时,依据数据流量峰值和带宽确定SRL的大小(1G)。

在数据复制的同时,VERITAS容灾方案中的GCM还可以在北京和广州之间建立心跳线以检测北京和广州两地的系统,一旦北京T2100系统发生故障,GCM将自动或由系统管理员确认或手工将T2100应用在广州接管运行,并将应用数据从广州向北京复制。由此保证T2100系统的不间断运行,甚至是在灾难发生时。另一方面,对于计划内的停机情况,如北京机房的地点整体搬迁,也可以手工将T2100系统切换到广州运行,直到北京的新机房建立好后再将T2100系统切换回北京。

2、系统结构和配置

软硬件配置和拓扑图如下:

 

VERITAS容灾系统由四个部分组成:

Veritas Volume Manager(VxVM)

VxVM3.2提供了一个在线数据存储管理基础,给系统盘和数据盘做本地的镜像和其它RAID功能,并可在线改变Volume的大小。

Veritas Volume Replicator(VVR)

VVR3.2在北京和广州之间做数据复制,将数据库和应用数据作异步复制。

Veritas Cluster Server(VCS)

VCS2.0管理本地集群(单点集群),将T2100所涉及的所有软硬件资源做集中的管理,并为GCM提供基础数据接口。

Global Cluster Manager(GCM)

GCM1.2管理由北京和广州两个Site组成的广域集群,集中管理广域范围的T2100应用,并结合VVR3.2做应用级的容灾,在北京和广州之间做自动的或管理员确认的或计划内人工发起的T2100应用切换。

3、结构方案图

T2100应用运行在北京主节点,在灾难发生后,如断电、自然灾难等原因导致宕机后,T2100应用能自动切换到广州运行。当主节点恢复正常后,能够将应用再切换回主节点。同时也支持计划内的手工应用级切换管理。

其中,数据复制所依赖的广域网数据链路带宽为2M,并配置主备路由。

三.应用效果

某电信公司T2100网管系统联通工程的容灾方案已经于今年五月份实施完成并生产运行.自系统投入运行以来, 运行正常, 系统性能良好, 达到了预期目标. 通过Veritas容灾解决方案,不但提高了数据的存储性能, 系统可以达到7X24小时不间断工作, 满足了高可用性的原则.产生了巨大的社会效益和经济效益.


 

收藏本页

共 0 人推荐文章 Veritas助力电信防灾

Copyright © 2006 cisco.ccxx.net 版权所有.提供Cisco技术,Cisco培训,CCNA,CCNP,CCIE培训,Cisco论坛CCIE实验室
上海地区Cisco培训、CCNA培训、CCNP培训、CCIE培训