高可用性的简介
(1)主从方式 (非对称方式) 工作原理:主机工作,备机处于监控准备状况;当主机宕机时,备机接管主机的一切工作,待主机恢复正常后,按使用者的设定以自动或手动方式将服务切换到主机上运行,数据的一致性通过共享存储系统解决。
(2)双机双工方式(互备互援) 工作原理:两台主机同时运行各自的服务工作且相互监测情况,当任一台主机宕机时,另一台主机立即接管它的一切工作,保证工作实时,应用服务系统的关键数据存放在共享存储系统中。
(3)集群工作方式(多服务器互备方式) 工作原理:多台主机一起工作,各自运行一个或几个服务,各为服务定义一个或多个备用主机,当某个主机故障时,运行在其上的服务就可以被其它主机接管。
什么是高可用性(HA) 可用性的计算公式: %availability=(Total Elapsed Time-Sum of Inoperative Times)/ Total Elapsed Time elapsed time为operating time+downtime。
可用性和系统组件的失败率相关。
衡量系统设备失败率的一个指标是“失败间隔平均时间”MTBF(mean time between failures)。
通常这个指标衡量系统的组件,如磁盘。
MTBF=Total Operating Time / Total No. of Failures Operating time为系统在使用的时间(不包含停机情况)。
设计系统的可用性,最重要的是满足用户的需求。
系统的失败只有当其导致服务的失效性足以影响到系统用户的需求时才会影响其可用性的指标。
用户的敏感性决定于系统提供的应用。
例如,在一个能在1秒钟之内被修复的失败在一些联机事务处理系统中并不会被感知到,但如果是对于一个实时的科学计算应用系统,则是不可被接受的。
系统的高可用性设计决定于您的应用。
例如,如果几个小时的计划停机时间是可接受的,也许存储系统就不用设计为磁盘可热插拔的。
反之,你可能就应该采用可热插拔、热交换和镜像的磁盘系统。
所以涉及高可用系统需要考虑: 决定业务中断的持续时间。
根据公式计算出的衡量HA的指标,可以得到一段时间内可以中断的时间。
但可能很大量的短时间中断是可以忍受的,而少量长时间的中断却是不可忍受的。
在统计中表明,造成非计划的宕机因素并非都是硬件问题。
硬件问题只占40%,软件问题占30%,人为因素占20%,环境因素占10%。
您的高可用性系统应该能尽可能地考虑到上述所有因素。
当出现业务中断时,尽快恢复的手段。
周期性的备份 软件升级 硬件扩充或维修 系统配置更改 数据更改 硬件失败 文件系统满错误 内存溢出备份失败 磁盘满 供电失败 网络失败 应用失败 自然灾害 操作或管理失误 通过有针对性的设计,可以避免上述全部或部分因素带来的损失。
当然,100%的高可用系统是不存在的。
在UNIX系统上创建高可用性计算机系统,业界的通行做法,也是非常有效的做法,就是采用群集系统(Cluster),将各个主机系统通过网络或其他手段有机地组成一个群体,共同对外提供服务。
创建群集系统,通过实现高可用性的软件将冗余的高可用性的硬件组件和软件组件组合起来,消除单点故障: 消除供电的单点故障 消除磁盘的单点故障 消除SPU(System Process Unit)单点故障消除网络单点故障 消除软件单点故障 尽量消除单系统运行时的单点故障
什么是高可用性(HA)?HA是什么
它与被认为是不间断操作的容错技术有所不同。
HA系统是目前企业防止核心计算机系统因故障停机的最有效手段。
高可用性(HA)的功能 1、软件故障监测与排除 2、备份和数据保护 3、管理站能够监视各站点的运行情况,能随时或定时报告系统运行状况,故障能及时报告和告警,并有必要的控制手段 4、实现错误隔离以及主、备份服务器间的服务切换 HA的工作方式:HA有主从方式和双工方式两种工作模式 高可用性与容错技术有什么区别? 容错(FT)技术一般利用冗余硬件交叉检测操作结果。
当发现异常时,故障部件会被隔离开而不影响用户的操作。
高可用性方案则利用更少的冗余部件同时由软件检测故障,一旦故障发生立即隔离损坏部件,通过提供故障恢复实现最大化系统和应用的可用性。
容错技术随着处理器速度的加快和价格的下跌而越来越多地转移到软件中。
未来容错技术将完全在软件环境下完成,那时它和高可用性技术之间的差别也就随之消失了。
什么是软件可用性?软件可用性都关注哪些因素
高可用性系统是指双机热备份系统,可以保障某台计算机出现故障时,系统依然能够正常运行。
纯软指的是纯软件实现的双机热备份系统。
纯软高可用性系统是在实时数据镜像基础上,实现了不需要共享存储的纯软高可用性系统。
在传统高可用性系统中需要通过共享存储来实现数据的共享并提升性能,但这也增加了可用性系统的成本,纯软高可用性系统通过现有的以太网络基础环境,通过TCP/IP协议,在两台主机之间实现了数据的实时镜像,不需要额外的硬件投资。
在充分利用已有资源的基础上,通过先进的软件技术,实现纯软件的高可用性系统。
高可用性(HA)的分类
一:网络高可用由于网络存储的快速发展,网络冗余技术被不断提升,提高IT系统的高可用性的关键应用就是网络高可用性,网络高可用性与网络高可靠性是有区别的,网络高可用性是通过匹配冗余的网络设备实现网络设备的冗余,达到高可用的目的。
比如冗余的交换机,冗余的路由器等二:服务器高可用服务器高可用主要使用的是服务器集群软件或高可用软件来实现。
三:存储高可用使用软件或硬件技术实现存储的高度可用性。
其主要技术指标是存储切换功能,数据复制功能,数据快照功能等。
当一台存储出现故障时,另一台备用的存储可以快速切换,达一存储不停机的目的。
双机热备软件有什么作用
NEC ExpressCluster? X 3.0 纯软热备方式简介1 概述 信息化建设的不断推进,各个企事业单位的活动越来越多的依赖于其关键的业务信息系统,这些业务信息系统对整个机构的运营和发展起着至关重要的作用,一旦发生宕机故障或应用停机,将给机构带来巨大的经济损失。
可见,对那些需要保障信息安全和提供不间断的信息服务的机构来说,业务系统的容错性和不间断性显得尤为重要。
如何保障各种关键应用持续运营,达到永续经营的良性循环,已成为当今企事业单位和IT领域急需解决的关键问题。
2 软件功能简介 荟萃NEC技术精华的EXPRESSCLUSTER是一款专业的高可用集群软件产品(双机热备集群软件),可为您提供Windows和Linux平台上完整的高可用性解决方案。
当集群中的某个节点由于软件或硬件原因发生故障时,集群系统可以把IP、客户业务等资源切换到其他健康的节点上,使整个系统能连续不间断的对外提供服务,从而为机构24x365的关键业务提供了可靠的保障,达到了系统99.999%的高可用性和可靠性。
NEC ExpressCluster? X 3.0 语言支持:中文、英文、日文。
NEC ExpressCluster? X 3.0 最大节点数:支持2~32节点NEC ExpressCluster? X 3.0 配置信息备份:集群配置信息可以导入、导出。
配置好NEC软件之后可以选择导出配置文件保存,如果出现系统宕机,无需重新配置NEC软件,即可恢复集群,可以通过导入配置文件,快速建立双机系统;对于系统更改主机名,IP地址等相应的信息,只需简单操作就可以完成NEC软件系统的修改。
NEC ExpressCluster? X 3.0 报警功能:不仅有event log输出、AlertView显示、还支持手机短信、Email、旋转灯方式的通报功能。
NEC ExpressCluster? X 3.0 BS架构管理工具:实现了Windows和Linux两个平台上的产品的管理接口的统一。
完全屏蔽了平台差异性。
只要有浏览器和Java运行环境,任何一台机器都可以进行监控,维护和配置操作。
可以在一个页面上同时显示多个集群的状态, 无论是Windows集群还是Linux集群,一目了然。
NEC ExpressCluster? X 3.0 日志收集功能:提供log自动收集工具,可在管理控制台自动收集所有集群服务器的日志信息,并且可供收集的log种类丰富,除了EC本身的内部日志以外,还可收集系统日志、注册表信息、系统诊断报告等等 NEC ExpressCluster? X 3.0 故障监视功能:可以对主机的网卡、本地磁盘、存储、应用程序、进程、服务、操作系统、服务器自我监视等。
当主机发生任何故障后,NEC ExpressCluster? X 3.0将自动、快速的把主服务器上的所有资源切换到备服务器上,确保应用程序持续可用性,保证公司业务的持续运行。
NEC ExpressCluster? X 3.0 的集群结构: 共享磁盘型、数据镜像型、共享磁盘镜像型、虚拟平台集群、无磁盘型、共享和镜像共存型、NAS型。
NEC ExpressCluster? X 3.0 的运行方式支持: Active/Standby 、Active/Active、N+1备份、M+N备份和远程集群:Active/Standby:其中一台服务器作为 Active 主机,运行重要的应用程序,向客户端提供各种应用服务,另一台服务器作为备机,实时监控 Active 主机运行情况,只有当 Active 主机发生故障后,备机才接管 Active 主机上的应用服务。
Active/Active :每台主机上运行各自的应用程序。
服务器在运行自身的应用服务时,同时也是另一台主机的备机,即两台主机互为备机。
N+1备份:有N台主服务器上运行各自的应用程序,1台服务器做为这N台主服务器的备服务器;当有任何一台主服务器发生故障,这台备服务器就会接管此主服务器上的应用程序。
M+N备份:有M台主服务器上运行各自的应用程序,N台服务器做为这M台主服务器的备服务器;当有任何一台主服务器发生故障,这N台备服务器中对应的那台应用服务器就会接管此主服务器上的应用程序。
远程集群:两座城市之间对应用程序做高可用保护,只有一座城市的应用服务器运行此应用程序,当此应用程序出现故障,另一座城市的服务器马上接管此应用程序。
NEC ExpressCluster? X 3.0 解决方案:双机双柜(数据镜像型)、双机单柜(共享磁盘型)、双机无柜(数据镜像型\无磁盘型)、多机单柜(共享型)等等。
NEC ExpressCluster? X 3.0 支持的操作系统:windows、linux等等。
NEC ExpressCluster? X 3.0 支持的数据库:oracle、mssql、sql server、DB2、sybase等等。
NEC ExpressCluster? X 3.0 支持的应用程序:如web、his、lis、pacs、erp、收费、语音、视屏等等,所有的应用程序都支持。
容错计算机与高可用性计算机有什么不同?
容错计算机是指在发生故障或存在软件错误的情况下仍能继续正确完成指定任务的计算机。
主要是针对于存在的错误而言;高可用性通常来描述一个系统经过专门的设计,从而减少停工时间,而保持其服务的高度可用性,也就是说他的服务质量比较高,很少出现错误,但是一旦出现错误就要立刻进行处理
windows群集的计算机配置问题
1群集可用性群集系统可使应用程序服务能够在发生硬件或软件故障时仍继续运行。
高可用性系统使用户不受软件故障以及系统处理设备 ,磁盘或局域网 组件的故障的影响。
当某个组件出现故障时,将由冗余组件接管操作。
群集和其他高可用性子系统负责协调各组件之间的切换。
2集群计算机集群简称集群,是一种计算机系统, 它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作。
在某种意义上,他们可以被看作是一台计算机。
集群系统中的单个计算机通常称为节点,通常通过局域网连接,但也有其它的可能连接方式。
集群计算机通常用来改进单个计算机的计算速度和/或可靠性。
一般情况下集群计算机比单个计算机,比如工作站或超级计算机性能价格比要高得多。
集群分为同构与异构两种,它们的区别在于:组成集群系统的计算机之间的体系结构是否相同。
集群计算机按功能和结构可以分成以下几类: 高可用性集群 负载均衡集群 高性能计算集群 网格计算 3负载均衡集群运行时一般通过一个或者多个前端负载均衡器将工作负载分发到后端的一组服务器上,从而达到整个系统的高性能和高可用性。
这样的计算机集群有时也被称为服务器群 。
一般高可用性集群和负载均衡集群会使用类似的技术,或同时具有高可用性与负载均衡的特点。
很高兴回答楼主的问题 如有错误请见谅