方案&案例

Solutions & Cases

首页 > 方案&案例 > 数据备份容灾方案 > 详情页

RoseHA容错、容灾高可用性系统解决方案

发布时间:2019-12-09 阅读:7971次 编辑 :admin

 

RoseHA容错、容灾高可用性系统解决方案


RoseHA的工作原理

RoseHA双机系统的两台服务器(主机)都与磁盘阵列(共享存储)系统直接连接,用户的操作系统、应用软件和RoseHA高可用软件分别安装在两台主机上,数据库等共享数据存放在存储系统上,两台主机之间通过私用心跳网络连接。配置好的系统主机开始工作后,RoseHA软件开始监控系统,通过私用网络传递的心跳信息,每台主机上的RoseHA软件都可监控另一台主机的状态。当工作主机发生故障时,心跳信息就会产生变化,这种变化可以通过私用网络被RoseHA软件捕捉。当捕捉到这种变化后RoseHA就会控制系统进行主机切换,即备份机启动和工作主机一样的应用程序接管工作主机的工作(包括提供TCP/IP网络服务、存储系统的存取等服务)并进行报警,提示管理人员对故障主机进行维修。当维修完毕后,可以根据RoseHA的设定自动或手动再切换回来,也可以不切换,此时维修好的主机就作为备份机,双机系统继续工作。

RoseHA实现容错功能的关键在于,对客户端来说主机是透明的,当系统发生错误而进行切换时,即主机的切换在客户端看来没有变化,所有基于主机的应用都仍然正常运行。RoseHA采用了虚拟IP地址映射技术来实现此功能。客户端通过虚拟地址和工作主机通讯,无论系统是否发生切换,虚拟地址始终指向工作主机。在进行网络服务时, RoseHA提供一个逻辑的虚拟地址,任何一个客户端需要请求服务时只需要使用这个虚拟地址。正常运行时,虚拟地址及网络服务由主服务器提供。当主服务器出现故障时,RoseHA会将虚拟地址转移到另外一台服务器的网卡上,继续提供网络服务。切换完成后,在客户端看来系统并没有出现故障,网络服务仍然可以使用。除IP地址外,HA还可以提供虚拟的计算机别名供客户端访问。对于数据库服务,当有主服务器出现故障时,另外一台服务器就会自动接管,同时启动数据库和应用程序,使用户数据库可以正常操作。

 

RoseHA主要功能特点

 

l  友好的界面
    RoseHA 提供了友好直观的图形安装界面和监控管理界面。通过直观而又方便的Java Applet管理界面,用户可以交互式地对集群系统进行配置、监控和管理,并可以利用Applet的网络特性,通过网络对系统进行远程管理,实时地显示出主机系统及服务的状态

l   灵活的Active-Active模式和Active-Standby模式
RoseHA支持Active-Active模式和Active-Standby模式。用户可指定每台服务器的作用(active or standby),指定要监控的服务和硬件部分,定义指定的服务发生故障后要采取的进一步行动(如是否重新启动该服务、允许的最大启动时间等)。

l   支持多条心跳路径
    可以将网线和RS-232串口线作为在RoseHA软件的心跳路径。配置多条心跳路径可以避免系统的单点故障。

l  自动切换
    当系统出现故障时(如:系统宕机、HA进程/应用进程被杀掉、RS-232、SCSI、光纤、网络线缆断开),RoseHA 将确定故障原因,并采取相应对策,并将这些应用切换到备份服务器上。而故障服务器中未受影响的应用不会被切换,既不会受任何影响。不需要系统管理员干预。

l  自动检测
    在集群系统的每一台服务器内,RoseHA具有两个核心进程,它们互相监控,如果其中一个进程失败,另一个进程会立即进行恢复。

l   服务器可靠性
    在主服务器出现故障(如掉电或宕机)时,另外一台服务器接管故障服务器上运行的所有的关键性应用。

l   网络可靠
    如果服务器的网络部分发生故障,会导致客户不能连接和访问到服务器,这同样是致命的故障。如果该服务器配备了冗余的网络接口,RoseHA会使用它来恢复网络连接。在没有配备冗余的网络接口,或者所有的网络接口均出现故障时,HA会将该应用切换到另外一台服务器上。切换完成后,客户在短暂的切换过程后能够继续访问所需的服务。

l  存储可靠性
    需要将应用的全部数据存储在两台服务器都能访问到的共享磁盘中。建议使用磁盘阵列来存储数据,这样可以避免单点固障,而且便于对系统的容量进行扩充。对由Volume Manager软件管理的磁盘阵列,RoseHA提供了相应的处理程序,以保证磁盘阵列及数据的可靠性。

l  应用可靠性
    在高可用性系统中可以运行多个应用。每一个应用是作为一个服务而存在的。在服务器中,当某个服务失败而其它服务正常运行时,RoseHA将处理这个失败的服务。在将这个服务切换到另一台服务器上时,该服务器上运行的服务也不会受到影响。对于与网络不相关的纯数据应用,只需要切换数据存储和数据处理软件。而在与网络相关的客户机/服务器应用,除了要切换数据存储和数据处理软件外,还需要切换相关的虚拟IP。如果希望两个服务独立地进行切换,则此两个IP地址不能相同。如果使用了相同的IP地址,在发生切换时,RoseHA会将所有使用该IP的服务都切换到另外一台服务器上去。

l  丰富的附加功能

提供不同的针对特定应用的Agent程序,使服务监控更切实际,更加有效;提供用于开发Agent程序的应用程序界面(API),使用者可针对特定的服务编写Agent程序,执行与特定服务相关的状态诊断及错误恢复工作的。

 

RoseHA(Multi-node)多节点群集软件正式发布,该软件延续了RoseHA成熟、稳健的系统监控技术,并从2节点平滑升级到多节点的集群环境,它通过监控应用程序、数据库、操作系统、存储资源、客户端访问资源等各类计算机软件和硬件资源的运行状态,实现核心信息系统高可用性。当某个节点不可用或执行操作系统升级、应用程序补丁等需要主服务器脱机操作的日常维护工作时,RoseHA(Multi-node)会自动将该节点的业务作业转移到集群中的其他可用节点继续运行,有效地减少计划内和计划外宕机时间,大大加强了常见应用服务(数据库、应用、Web服务等)连续运营的能力,提高业务信息系统高可用性和稳定性。同时密切配合Rose数据容灾产品(RoseDR、RoseReplicator(Enterprise)),能更好的帮助企业实现核心业务系统严格的RTO与RPO运营标准。

RoseHA(Multi-node) 针对现代企业实际的应用环境,具备如下特点:

  • 系统部署环境灵活,全面支持域环境、工作组、独立服务器等应用环境

  • 群集节点动态增减,群集节点按需拓展

  • 存储环境支持FC、ISCSI、SCSI等存储协议

  • 全面检测应用环境所有的软硬资源的运行状态,实现业务连续运营目标

  • 双核心服务运行机制,提供持续不间断的业务保护

  • 多类型心跳通讯协议,Socket、磁盘心跳等

  • 资源组的管理流程,业务连续性方案配置和管理更加灵活方便,易于理解

  • 独立的群集日志报表系统,群集运营状态查看,群集故障排除更加方便、快捷、直观

  • 集中统一的远程集中管理方式(GUI,CLI),大大降低业务系统的IT管理成本

  • 多种工作方式,双机热备、双机互备、1-N热备、N-1热备、级联热备等

  • 产品黏合度高,全面配合Rose容灾产品线(RoseDR、RoseReplicator(Enterprise)等)


 

 

相关推荐