金融机构对分布式存储的“爱”与“恨”

2023-02-06

正文共3172字,建议阅读时间10分钟

撰稿人:陈耿升

过去十年里,数字经济的蓬勃发展,不仅带来了数据爆炸性增长,也让数据的重要性日渐突显。如果说数据存储是数字经济发展的数字底座,那么分布式存储就是底座中的基石,不可或缺。IDC预测,到2025年,中国的数据量将增长到48.6ZB,数据量爆炸增长,集中式系统矛盾凸显

银行科技一直走在各个行业科技创新前沿,以其数字化业务的丰富与快速升级迭代为特点,对数据中心的灵活性提出很高的挑战。新业务迭代的速度快,对云的要求更高、服务要求更敏捷。大量的数据将频繁的调用,带来了可用性的难题,也为金融行业带来很多新的挑战及思考。

中国人民银行印发《金融科技发展规划(2022-2025年)》中提出金融数字化转型的八大任务,其中明确指出“加快云计算技术规范应用,稳妥推进新型系统向多节点并行运行、数据分布存储、动态负载均衡的分布式架构转型。

金融机构对分布式存储“爱不释手”

在当前金融业数字化转型实践和IT基础设施建设的方法论中,显而易见集中式架构和软件定义数据中心的思想似乎已经逐步占据主流,传统存储尤其是集中式存储的增长呈现出相对疲软的态势,而分布式存储呈增长态势

分布式的核心思想是分而治之。用一组服务器集群通过网络协作,共同完成任务。

相比传统IT思路通过不断提升服务器性能、研发一代更比一代强的“超级存储柜”的处理方式,分布式存储解决问题的方式从“一夫当关、万夫莫开”演变为“人海战术”。 用一组服务器集群替换存储柜,集群中的每台服务器存储数据的一个子集,通过成百上千台服务器协作,实现与存储柜相同甚至更佳的效果。这便使得金融机构的科技部门开展做相关分布式存储的尝试。

分布式存储软件_云宏虚拟化

VS

传统存储_云宏虚拟化

金融业务应用系统的多样性,决定了数据存取的多样性,从而也决定了对存储设备选择的多样性。

金融机构的IT业务应用系统,从业务类型来看,有交易类系统、经营管理类系统、AI/BI等分析类系统、办公管理类系统等;从数据的全生命周期来看,可分为在线数据和离线数据,离线数据下又有备份数据和归档数据。

交易类系统是银行业最重要的IT业务应用系统,是直接面向客户提供金融业务服务。近年来,随着移动互联网、金融科技对金融行业的影响,金融应用系统也在不断互联网化,秒杀、购物节、线上贷款业务、交易银行等新的应用形态层出不穷,交易系统必须面对突发和不确定性的高并发,这对系统的稳定性、性能要求和业务连续性提出了更高的要求。

分布式存储则以高性能、高可用、高可扩展、易扩展等特点,成为金融机构“新宠”。

和集中式存储相比,分布式存储的性价比更高、处理能力更强、可靠性更高,同时具有很好的扩展性。分布式存储在其经济性、自主性、灵活性和扩展性层面较集中式架构有较为突出的优势,能确保业务的稳定性、和业务连续性。

存储一旦掉链,满盘皆输

计算、网络、存储构成IT系统三大基石。计算或者是网络出问题,通常是局部单机故障,大概率可通过重启来解决。然而,存储一旦出问题就是全局系统故障,轻则业务中断,重则数据丢失。存储作为IT基础设施的基石,责任至关重大。

非专业存储厂商或非分布式存储团队常会遇见三大问题:

1、 存储性能阻塞

未经过开发调优的开源分布式存储环境容易受到IO分布不均匀和木桶效应的影响,导致大延迟和响应迟钝的现象。服务器一般配备的是主流7200转的HDD,受到机械臂寻址限制,其单盘的读写性能极度有限,由于数据在OSD上随机分布,因而单个硬盘上的IO负载不会固定在平均值上,而是总体呈现为正态分布,少数HDD因正态分布的长尾效应,导致其IO负载远超平均值,以及远超单盘的性能阀值,造成拥堵;此外,分布式存储为保证数据完整性,必须定时进行数据完整性校验,而这些操作产生额外的IO负载,可能会加重磁盘阻塞现象。

2、 存储稳定性不高

未对分布式存储进行数据重建的规则开发设计,容易出现当存储扩容、硬盘或节点损坏、网络故障、OSD假死等多种因素叠加,可能导致多个OSD同时重建,引发重建风暴。

3、 数据丢失风险

两副本可抵御一个HDD或一个节点损坏。当系统处于扩容状态或一个节点处于维护模式时,此时另一个节点出现HDD故障,则该系统就会进入紧急状态,出现两个节点同时出现HDD故障,则可能导致数据丢失。在未有一定的磁盘健康监测机制的情况下,对于一个具有一定规模的分布式存储系统而言,出现两个磁盘同时故障的概率急剧上升。

金融机构如何对分布式存储“趋利避害”

对于分布式存储,最大顾虑便是随着服务器和网络设备数量的爆发增长,是否会影响存储的健壮性等一系列未检验的场景。

云宏分布式存储方案:CNware WinStore

数字化”与传统金融产业的叠加,势必会改变金融行业的传统IT基础架构。

▪ 全分布式和无共享(Share Nothing)架构设计优化数据存储性能

云宏自研的CNware WinStore分布式存储,采用业界先进的全分布式和无共享(Share Nothing)架构设计理念,将多台ARM/x86等服务器组成横向扩展型集群,通过先进的分布式技术将集群中所有服务器的固态硬盘和机械硬盘进行虚拟化,构建成一个统一的虚拟存储资源池,实现数据存储安全可靠,性能优越、管理方便。采用基于策略的分布式哈希表数据路由算法,通过计算就能直接寻址到数据所在的存储节点,无需查找元数据节点,大大缩短了数据IO访问路径,提升了系统性能。

▪ 块和对象存储服务应对数据高并发

CNware WinStore对外提供块和对象存储服务,可以支持各种数据库负载、虚拟化应用和云原生应用,也可以应用于生产业务系统、数据管理系统、数据分析系统,满足关键业务和形态各异的众多应用的不同存储需求,其优点如下:

1、高可靠

假设在真实环境下,硬件不是绝对可靠的,磁盘可能损坏、服务器可能宕机、网络可能失效等等。为处理这些不可预期的硬件错误,保证数据的完整性和业务的可用性,WinStore通过全冗余设计等一系列软件层面的可靠性设计,来弥补硬件不可靠带来的数据可靠性和可用性问题。

WinStore采用了如下机制保证数据的高可靠性:

◆ 基于策略的多副本冗余机制;

◆ 数据及其副本跨硬盘,跨存储节点,跨机架的存储;

◆ 通过强一致性复制技术确保各个数据副本的一致性,即便一个节点甚至整个机架停机,也完全不影响数据可靠性和可用性;

◆ 支持读取修复机制,当读取某一个数据块的某个副本数据失败时,可以通过从其他副本读取数据,然后重新写入该副本的方法进行恢复,从而保证数据副本总数不减少;

◆ 自动数据重建,在系统因为节点或者磁盘发生故障导致数据不一致时,通过内部的自检机制比较不同节点上的副本分片,自动发现数据故障并启动数据恢复机制,在后台恢复数据;

◆ 自动替换故障盘,在数据盘出现故障时,系统可以自动查找是否存在备用盘,如果存在备用盘,则自动使用备用盘替换故障盘,从而达到无人值守的要求。

2、高稳定

WinStore除了采用了去中心化架构、多副本机制和强一致性确保了数据的可用性之外,在性能方面,基于CRUSH算法,将所有的文件都做了分片处理,所有分片会均衡的分布到整个集群的所有磁盘中,确保所有的磁盘都能够同时对外提供IO。

当前各分布式存储厂商都是通过SSD提升集群的IO性能,而底层的HDD有两种用法,一种是将文件集中存储在某块或某几块HDD,另一种跟WinStore一样,将文件分片后均衡分布到所有的磁盘中。

WinStore的架构设计,考虑到了当SSD满载的情况下,底层的所有HDD都能够同时提供IO,不受限于某块或某几块HDD的性能,尽可能的确保集群性能的稳定性。

3、可扩展

考虑到客户大容量的场景,在存储容量已经无法满足业务的扩展,但是计算资源还是充足的情况下,WinStore除了支持以节点的方式进行扩展之外,还支持以磁盘为单位进行存储容量的扩展,比如一个资源池三个物理节点,每个物理节点8块数据盘,这时如果要给集群扩展存储容量的话,可以在每个物理节点上面新增磁盘,然后在存储管理界面进行存储池容量扩展即可。

4、高性能

WinStore的架构和数据路径完全为块存储系统而设计和优化,读写操作流程都非常简单,以尽可能少的占用资源。

WinStore组成的存储池通常由SSD和HDD组合而成,充分利用SSD的高性能特点,通过智能缓存算法,将热数据缓存到快速的SSD中,以应对随机I/O并发访问,SSD的读写缓存比例会智能的随着业务负载自动调整,比如在写少读多的场景中,WinStore会将SSD大部分的空间用来作为热数据读缓存,极大的提升前端业务的响应能力。

5、多存储类型

WinStore在同一个集群中,同时支持创建块存储池和对象存储池,在一个存储集群,既能给虚拟机提供块存储服务,也能够给业务提供对象存储服务,满足复杂的业务需求,对象存储支持常用的S3标准协议。

金融机构的分布式存储演进方向,一是根据金融各个应用场景的要求,与厂商进行产品联合创新和优化;二是演进方向结合银行私有云的建设,在技术上跟随公有云厂商的存储技术发展路线,进行技术归一化的规划。分布式存储对于银行降低运维管理成本、提供良好和丰富的存储服务能力等都有积极意义。

了解更多云宏分布式存储

立即拨打客服热线

400-6300-003

返 回

7*24小时服务热线

400-6300-003

电话咨询

400-6300003

关注微信

在线客服