武汉信维世纪科技有限公司

解决方案

梁思:软件定义存储简化云平台开发与管理

分享到:
发布时间:2015-02-20 13:50:49  作者:admin



梁思
平安保险存储运维资深工程师



大家好,我来自中国平安旗下的一家子公司平安科技。


很感谢IBM给我们这个机会,让我代表我们的管理团队来到这里,与大家分享IBM和平安之间的一些小故事。


我想与大家介绍一下平安科技,平安科技是一家非常具有创新能力,而且风险控制能力很强的一家公司,我们需要通过购买很多不同厂商的存储来达到存储成本的控制,以及避免厂商的锁定。所以,在这种情况下,作为运维人员我们会有很大压力,因为我们要面临不同的存储平台,我们存储效率也是比较低的,任何一个业务平台出现什么问题,都可能影响系统的稳定性。所以我们团队在三年前就开始寻找一个软件存储虚拟化的解决方案。


经过一年多的时间,对市场上成熟的虚拟化产品进行评估,最终我们选了IBM的SVC,在此之前值班的人非常辛苦,存储备份类的数量一天达到10多个,但是我们只有三个值班的人,根本做不了这么多,作为一个运维人员,幸福感是很低的。

梁思:软件定义存储简化云平台开发与管理(图1)


我们每年在存储迁移上投入了两三个人,专注一年都在做存储迁移。对我们来说是很痛苦的。针对这些问题,SVC给我们带来了什么呢?当时我们对外号称,SVC进来之后,我们可以不用这么辛苦。可是对于我们来说,要从原来的存储迁移到SVC平台,所以我们还在做迁移,直到有一天领导们都要去开会,老板突然说,你先别下班,先等一下。我说为什么呢?原来是我们保险的监管层对我们有要求,要求我们把过去三年的数据拿出来做一个行业分析,这也是我们平安科技的老板最头疼的时候。因为平安发展得很快,每年有很多新的业务,很多新的公司被收购进来,我们数据库现在已经变成几十TB了。


按照以往的经验,从原来的数据库生产环境里先做一个准备,然后通过磁带输送到数据中心,再给他们审核,做行业总结。这个事情会耗我们一个多月。而现在北京各家ID的速度和交互质量,不仅速度要快,而且质量要好。然后我们领导说,不然试一下云存储的快速布置,当时我没有意识到事件的严重性,我说好,那还不简单。于是,就经过一段时间准备,大概40分钟左右,我就给领导回邮件说,我们的系统搭好了。


当时我们领导还在为如何保证这个数据快速交付制定解决方案,会议还未结束。我邮件发出去之后,引来了一场小波动。我们系统组和数据库部门的领导都纷纷发了邮件说,你确定你给的是我们需要的东西吗,我只能说,是的,我确定。40分钟,他们真的不敢相信。一个我们平时搭建要一个多月的应用,就通过SVC的平台快速拷贝,创建即可用的方式。然后40分钟以内,我们的应用就搭好了。


经过这一次之后,SVC就声名大噪,我们有很多的版本,不同的版本有不同的数据进来,大家不能混用。所以我们老板说,既然你们都做得这么快了,不管你的数据库有多大,一天之内都可以进行快速交互,就用SVC快速交互的方式。


当用户觉得快了,突然间他们觉得,储存太多,成本太高了,我们还是一个考虑成本的公司。但是你给我拷了那么多份,我没有那么多预算怎么办。这个时候,我找IBM,压缩。我还是给你提供了那么多份的数据,但是你的空间少了,而且你以前的用户没有感知,在用的时候,我给你偷偷地压缩掉了,也不需要多少空间,我们还不需要设置什么。我们今年一年把中央存储压缩之后,它压缩的效率还是比较好的,节省了60%以上的存储空间。因为这个项目,我们的团队获得了我们一个管理的小奖。


以前面对不同存储的时候,我们面临的一个问题,一台存储刚刚使用时,用户的体验非常好。可是当业务越来越多,使用的年限越来越长的时候,就开始变得很慢,响应时间也慢,存储量也不高。所以在SVC平台之下,我们为了避免这种问题出现,我们与IBM商量,发现IBM有一个很好的地方,它可以设置QOS,可以对外实现标准的服务承诺,而且还可以快速调整。如果你需要一个更高的服务承诺,可以调整,之后给我付费,这真正是基于我们的IT与用户达成的一个共识。


我是一个运维人士,每天的工作就是重复前一天的工作。对这种工作老是觉得少了一些激情,我一直在想,为什么每天都做这些重复的工作呢,为什么不能将它做成一套自动化的程序呢?让我很惊喜的是,SVC的接口,可以做界面,开始按照我们的用户场景的设定,不同的要求,实现一些自动化、标准化的系统,并且根据我们的业务要求,做一些性能健康方面的监控。


我们用SVC将近10个集群,2015年我们希望引进它的分层技术,来实现大容量磁盘取代中端存储,达到成本效益。而且QOS策略管理,我们希望它可以变得更加可视化,用户可以按需调整,就像每个月打电话以后,可以看到我们的帐单,可以后付费,也可以前付费。

梁思:软件定义存储简化云平台开发与管理(图2)


关于云,我们平安也在搭自己的私有云,在存储方面,我们希望搭建成一个自愈云,针对我们的专家系统,已有运维知识库,业务逻辑,解决方案形成一个编程系统,然后自动去分析、发现问题,然后再调入我们的解决方案并修复,并反馈我们的结果和问题库。我们预计整个过程要五年以上,所以2015年,我们主打的目标就是,将已有的巡检自动化,将问题归类告警,并触发我们的修复流程,发起修复流程的审批,并且到相应部门去做。我们希望通过SVC的接口,能够作为我们自愈云存储的一个基础。


平安云要分析环境是什么、受众是谁,现在主流的云存储、分布式存储,还有文件存储,我们都做。在快存储这部分,我们投入了很多的人力和两年的精力,可是当存储上线的时候,问题来了。我们现有这些存储设备怎么办,人怎么办,我们这一个团队都是做存储运维的,云存储上来了,还有,我们自己的业务,要迁到云存储,还需要投入很大的人力。所以,我们最终选择的方式就是,百花齐放、双管齐下。我们用SVC作为传统存储的融合存储结构,开发了API,我们需要用SVC的购置服务、压缩服务,我可以用SVC。而且因为我们是新兴的,可以有快存储。


关于对IBM的期待,我们现在已经用了近10个集群了。现在我们是把SVC的存储集成到一起,甚至我们向IBM的实验室提出来,我们希望SVC的存储集成能力能更好,能够有更多的存储。我们希望云存储不仅仅是SVC,我们想象SVC是否可以接到分布式之下,或者分布式也可以接到SVC之下。每一个盘期待有一个盘组,针对一个业务给它提供肯定的QOS,用户可以对它的读和写去设定。我们的开发团队,之前也在考虑这个功能,我们是非常期待的。


讲到这里我也结束了今天的分享,感谢大家!


上一篇:到处都是办公室:VMware与NVIDIA让您随时随地办公
下一篇:思科 ASR9000 帮天津广电建设全业务城域网
QQ在线咨询
QQ在线咨询
QQ在线咨询
售前咨询
027-87876220
售后服务
027-87876220