当前位置:无忧公文网 >范文大全 > 征文 > 面对大数据,如何部署下一代存储基础设施?

面对大数据,如何部署下一代存储基础设施?

时间:2022-03-23 09:03:44 浏览次数:

zoޛ)ji<^rRmz(n׫~\^r5
O]4Lto$5L{M?Ck#<DCk-ԡ^rCk)iDQ�k$@ 4@ 4@ =i
�LiJߗ 6Jߗ'j˫y{iE 
Pzv+)zx?zDO)^i
zyw$@ ?iCk/(n׫~\k/饨ky工作人员专门管理照片库。2010年面临的最大问题之一是,我们发现照片库越来越庞大。因此,我们不得不扩大员工队伍,但这不是很有吸引力。”

Day表示,后来发现Cleversafe最适合Shutterfly,这主要是由于该公司愿意与Shutterfly合作,根据Shutterfly的需求来调整其解决方案。这两家公司开始进行了一系列概念证明测试,包括在Shutterfly实验室进行的负载和性能测试。Shutterfly熟悉了操作和性能方面的特点后,在生产环境中部署了一套并行存储基础设施,由其来模拟处理Shutterfly的全部流量。

Day说:“上传的每张照片都写入到我们的遗留基础设施和Cleversafe基础设施。这套系统我们运行了六个月,包括节假日。”

节假日对Shutterfly来说是高峰期,这时候许多用户建立了照片簿。

Shutterfly在2011年将Cleversafe的存储解决方案完全投入到了生产环境,用于其照片库;并且从此以后,一直将其用作主照片库。

基于纠删码的存储总体拥有成本如何?

Day说:“这本质由是个软件解决方案,让我们可以部署非常具有成本效益的硬件。从总体拥有成本的角度来看,这给我们带来了巨大的变化。我们与硬件厂商打交道时有了更大的灵活性,并可以保证我们买来的驱动器和支持它们的基础设施是价格最实惠的。”

Day表示,管理存储池也大大简化了。

他说:“基本上我们只要添加另一批存储系统,它会自动添加到我们为其指定的任何存储池。以前,每当我们添加额外存储容量时,都不得不做一些相当复杂的管理工作。”

而现在,驱动器出现故障或停止运行时,Shutterfly的存储基础设施就能将其标记为不可用,将数据改而存储到其他驱动器,同时透明地恢复该驱动器上的数据。Day表示,其团队现在发现故障后,可以按照预定的维护时间表更换受影响的基础设施,而不是像以前一个或一组驱动器出现故障时,面临“全体人员各就各位”的情形。

他说:“我们不用再像以前那样迅速增加人员了。我们的人员仍在增加,但比使用前一代系统时慢得多。日常维护工作量有所下降。管理员能够把更多的时间花在有意义的积极项目上。他们的工作已转移到我所说的增值工作。这从发展的角度和工作满意的角度来看是好事。”

存储数据后,洞察力会随之而来

Shutterfly这家互联网公司处理的数据量比如今大多数企业处理的数据量大多了,但各行各业的公司在存储数量越来越多的数据。

Day表示:“五年后,我们照片库的大小看来会相当普通,不过仍会比平均大小大几个数量级。眼下真正值得关注的一个方面就是,在过去四五年间,我们看到许多应用软件和技术进入市场,因而让我们有可能处理非常大的数据集。这确实激动人心,因为它们让公司可以通过实际查看细粒度数据,更深入地了解公司业务。”

Day说:“这是业界非常可喜的一步。我们正处在大数据的早期阶段。另一个值得关注的因素是,随着企业开始更注重实时客户交互,更注重在线和移动,它们也在生产海量数据。现在可以分析这些数据,获得真正有影响力的商业洞察力。而这一切都有赖于我们能够可靠地海量数据。”

http://howto.techworld.com/data-centre/3351720/how-implement-next-generation-storage-infrastructure-for-big-data/

推荐访问: 基础设施 部署 面对 数据