【5个9】公有云区块储存的可用性与持久性

数据储存的可靠性,是衡量公有云区块储存的应用时,不可忽略的关键环节。如果无法确保资料储存的可靠性,那么公有云储存服务无论成本效益再高、如何弹性,也难以承担企业级的应用。


 

公有云区块储存服务的可靠性,我们以可用性(availability)与持久性(durability)来衡量。

 

其中可用性的需求,是利用分布式储存架构的多复本镜像复写机制来实现,当前所有公有云服务商都是通过分布式架构来构建储存环境,并通过纠删码(erasure coding)之类的技术,在数据中心的多个储存节点间分散复写资料,以防止单一储存节点或元件的失效,从而造成资料遗失或存取中断。

 

至于持久性的需求,则是通过纠删码(erasure coding)与资料洗涤(Data Scrubbing)等技术的结合应用来实现,藉由持续地校验磁碟区资料,防止资料恶化(corruption)或位元衰减(bit rod)等现象,导致磁碟区中存放的资料出现错误。

 

整体来说,目前的公有云区块储存服务都能提供相当高的耐久性, 优于一般企业级硬盘或SSD,例如AWS EBS的年故障率(AFR)为0.10.2%,相较下,目前最新型的SAS硬盘与SSD的年故障率规格为0.350.45%左右,这也就是说,把资料存放在AWS EBS上,要比存放在本地端服务器的机器中更可靠。

 

但是在可用性方面,公有云区块储存服务的表现便平平,多数都只有99.95%或99.99%的服务等级,这意味着在一个月的使用周期中,含有多达21.5分钟或4.32分钟的潜在宕机时间(downtime),只有AWS EBSAzure储存服务可以达到更高的99.999%可用性等级,这相当于每月潜在的停机时间只有25.9秒。

 

整体来说,公有云区块储存服务的可用性,足以支持一般的企业应用,但若是对可用性极为敏感的关键应用,还是以本地端的高阶储存设备较为稳当。

 

一般而言,用户可以通过公有云区块服务内含的快照功能,来降低磁区不可用时造成的冲击,能通过快照复本迅速重建失效的磁碟区。快照同样也能帮助改善公有云区块服务的持久性,当原始磁碟区出现错误或故障时,可从快照复本还原资料。

 

参考:https://www.ithome.com.tw/tech/135599


END

Kubernetes  CKA线下班


评论