非结构化数据时代下,看Dell PowerScale如何点数成金
- +1 你赞过了
【天极网企业频道】近年来,受人口增速放缓、人口老龄化加剧、企业用工成本上涨等因素影响,以数量型为主的人口红利已呈现出逐渐消散的倾向。与此同时,随着云计算、5G、大数据、人工智能等新一代信息技术的发展和应用逐渐走向成熟,推动着人类社会快速迈向数字时代。数据作为数字经济的新型生产要素,正不断释放新的红利,驱动经济高质量发展。
我国“十四五”规划和2035年远景目标纲要中多次提到数字化,要求充分发挥数据的基础资源作用和创新引擎作用,精准谋划、有序推进我国数据资源开发利用、数据要素价值释放迈上新台阶。由此可见,数字红利将成为中国经济增长的关键力量。
快速增长的非结构化数据带来存储挑战
进入数字经济时代,随着海量应用的兴起,数据呈现爆炸式增长,数据类型也更加多样复杂。据国际数据公司(IDC)预测,全球数据量预计2025年将达到175ZB,其中非结构化数据占比将高达 80%。另据Gartner预测,到2025年有75%的企业所生成的数据会在数据中心或云之外进行创建或处理。此外,数据的类型也在发生变化,随着技术的各种深入应用,视频、音频、影像等各种非结构化数据的增长更为迅速。
在中桥调研咨询高级分析师马燕看来,伴随海量非结构化数据的产生,将给企业存储和管理数据带来一系列前所未有的挑战,主要表现为以下几点:
第一,数据的存管分离。企业内部很多数据通常分布在不同的存储平台之上,包括本地、各种公有云等。由于数据存放杂乱无章,没有智能的数据标签、监控、管理,会导致给企业带来很多盲区,不仅导致企业的数据存储利用率比较低,而且还难以释放蔓延在各种孤岛上数据的价值。
第二,数据壁垒。随着大数据、人工智能、物联网、云计算等技术的快速发展,更多的数据产生和处理并不只局限于数据中心而是云端、边缘。企业如何跨越数据中心的障碍,实现核心、边缘、云的数据交换和处理,甚至在今后的出海业务中,如何跨地域、跨国内和国际,实现数据的交互和处理,都将是企业不得不面对的问题。
第三,高碳低效。以前数据中心的高能耗、成本很大程度是因为数据存储所消耗的电力资源,数据存储量越大能耗就越高。由于存储的数据基于各种目的,如协同办公、研发、测试等存在着大量的重复数据,占据了大量的存储空间。同时,企业只管生产数据,不管数据如何使用的粗放管理方式,使数据的存储规模不断扩大,随之能耗也不断增加。
第四,多样性和复杂性的问题。在数字经济时代,数据存储需求是一种多样化、复杂性的趋势,对于企业而言,一种存储可能无法满足多样和复杂的需求。
第五,数据安全。随着数据跨核心、边缘、云以及非结构化数据价值的不断凸显,如何在释放数据价值的同时来确保数据安全,直接关系到企业的生存和发展,尤其是非结构化数据量特别大,往往是以PB级为单位的情况下。
如何根据不同的工作负载,个性化界定资源,保证数据的可恢复性,是确保数据业务连贯的关键。
Dell PowerScale逐一击破痛点
基于此,戴尔科技集团推出了专为非结构化数据而生的分布式文件存储方案Dell PowerScale。
据戴尔大中华区非结构化数据存储事业部总经理刘志洪介绍,针对企业面临的存储挑战,Dell PowerScale集合了五大优势,予以层层击破,具体来看:
1、存管融合
在Dell PowerScale平台中,有一个名为DataIQ的软件,能够发现整个企业IT环境里所有的非结构化数据,不仅仅是文件,还包括了对象。利用DataIQ可以跨多个存储平台,实现数据的快速地搜索和查询。这不仅消除了数据孤岛,还可以根据实际的业务需求为非结构化的文件或者是对象添加标签,进而洞察数据实际的价值。
2、打破边界
Dell PowerScale部署非常灵活,可以部署在云端、数据中心、边缘端,通过DataIQ可以实现异构存储平台的数据的统一的管理,跨地域数据的交互和共享。
3、高效低碳
Dell PowerScale提供了重复数据删除、线内数据压缩、数据自动均衡、数据自动分层、精简数据快照等功能。带来了直接的效果就是性价比会更好,经济性会更好,对能源、整个场地的需求相对来讲就越来越能做到高效低碳。
4、精智平台
Dell PowerScale是一个横向扩展的平台,最高的集群可以扩展到252个节点,并且随着容量的增长,性能是呈线性增长的,不同类型的节点甚至不同代的节点,都可以部署在同一个集群中。通过数据湖支持不同的业务流程的混合负载,对于性能和容量的需求,以及多协议数据的访问都是Dell PowerScale平台的特点,一种协议写进去的数据,其他的应用系统可以通过其他的任何一种协议将它读出来,广泛地支持传统应用和现代应用。
5、全面防护
作为Dell PowerScale平台的核心部分,OneFS内置各项数据安全防护功能和可集成的防护软件,为数据提供全面的防护,确保数据安全。
据悉,戴尔于2018年在UDS内部发起了一个10PB俱乐部,以表彰和推广销售、合作伙伴和客户。值得一提的是,Dell PowerScale已在越来越多的场景中得到应用。
例如,在芯片设计方面,EDA作为芯片设计不可或缺的重要环节,是芯片制造最上游、壁垒最高的部分。随着晶体管集成度的提高,芯片设计复杂度在不断提升,对于EDA而言,不论是前端设计、后端设计,还是制造端,工作负载对存储提出了严苛要求。
第一,Dell PowerScale拥有一个大规模的横向扩展能力,可以根据性能和容量需求线性扩展;第二,芯片在设计的不同阶段对存储的要求也不同,Dell PowerScale实现了从全闪存、混合、归档类型节点灵活组合,智能的数据生命周期管理,从设计验证到归档的全流程覆盖;第三,Dell PowerScale具备非常优秀的跨代兼容的能力,来满足长期数据的永久保存;第四,Dell PowerScale具有高达N+4的冗余,经过验证的企业级数据备份和灾难恢复,确保存储平台高可用和高可靠;第五,Dell PowerScale目前全线的产品支持在线的数据缩减的能力,帮助客户降低存储成本、节省机房的机柜空间、能耗等等。另外Dell PowerScale是支持原生的Hadoop为HDFS大数据分析的文件系统,提供就地分析能力,通过这种方式加快数据分析的流程。
在人工智能、机器学习方面,各行各业与人工智能的深度融合落地正在不断进行,如精准营销、智能风控、智能安防、智能家居、在线教育、远程医疗、自动驾驶、智能物流等。这些基于人工智能对数据力量充分利用的过程中,不论是数据采集、准备,还是数据训练和推理,各个阶段读写的数据类型不同,工作负载不同,对存储的性能提出了苛刻的要求。
Dell PowerScale提供全闪高性能消除AI的I/O瓶颈,加快数据迭代,提供更快的AI模型训练和验证速度。构建了统一数据湖,支持多种协议接口,满足AI训练各阶段对数据的访问需求。根据数据类型和属性,自动进行数据分层,进一步提升存储性能。
在HPDA方面,疫情刺激了全球企业弹性远程办公的大升级。面对数千甚至上万的虚拟桌面的同时在线,企业既要能够快速地部署,以应对激增的流量,保证业务稳定,又要满足多功能远程协作办公的系统安全稳定需求,这就给存储提出了挑战。
Dell PowerScale多协议的互通能够保障不同的数据源的数据的快速地导入,能支持混合的工作负载。依据访问频度的不同,文件能自动地存储或者是迁移到最合适的存储层或存储的节点中。并且随着业务量不断增长,每扩容一个节点大概只需要一分钟的时间。另外,Dell PowerScale的全闪企业级功能,去重和压缩、快照等数据优化技术,进一步增加有效存储容量,降低IT新增采购开支。
写在最后:
目前,Dell PowerScale已经为客户提供了超过17EB的存储容量,不仅是IDC报告中排名第一的横向扩展NAS平台,而且还被Gartner连续六年评为魔力象限领导者。
随着数字化的快速发展,非结构化数据将扮演越来越重要的角色。可以肯定的是,Dell PowerScale将会在越来越多的场景中得到应用,助力更多的企业打破数据孤岛壁垒,全面释放数据的价值,在瞬息万变的市场竞争中保持领先。
最新资讯
热门视频
新品评测