前位置: 主页 > 合肥热点网 > 新闻资讯 > 正文

云途腾携MagicStack惊艳亮相OpenStack Days

来源: 未知  2016-07-21 合肥热点网
   2016年7月14—15日,久负盛名的OpenStack Days全球巡展登陆北京,超过2000位云计算产业从业者齐聚国家会议中心,共同探讨OpenStack技术的发展趋势与技术特点,分享OpenStack在不同行业的应用实践最佳案例和成果,通过互相借鉴来优化各自技术选型和业务运营。大亮点频出,极大激发了中国OpenStack的技术热情及推动OpenStack在更多行业和企业的普及。 

    作为本次会议的黄金赞助商T2Cloud云途腾,除了以OpenStack“企业云途,即刻开启”的形象呼应整个大会的基调,在第二天的行业实践主题分享中,来自云途腾的系统架构师——季文轩为大家带来开源云计算中的全自动化运维产品——MagicStack的运维主题分享。 

    以下是关于基于OpenStack的全自动化运维产品MagicStack的现场分享总结,特别值得关注的是,这是国内首个基于OpenStack开源自动化运维的产品,T2Cloud云途腾也非常明确地表明希望秉行开源开放的精神与国内OpenStack用户和国内生态产商共同推进开源产业在中国的落地与腾飞。 

    MagicStack的意义。 

    随着信息时代的持续发展,云化背后的IT运维已经成为云服务行业中重要的组成部分。而面对越来越复杂的业务、越来越多样化的用户需求,不断扩展的IT应用需要越来越合理的模式来保障IT服务能够灵活便捷、安全稳定地持续保障。传统IT运维存在被动、孤立、半自动式的IT运维管理模式,这种状况经常让IT部门疲惫不堪。 

    根据中国开源云计算产业联盟刚刚披露的白皮书所揭示的:开源云计算产业要继续大规模且顺利普及,尤其是针对OpenStack的开源云计算产业,必将面对的一个瓶颈性的问题就是厂商如何为客户提供高效便捷的运维机制。 

    因此,全自动化运维的产品是一个时事所然的结果,既是一个趋势,也是往后开源云计算产业继续蓬勃发展必备的要素。 

    MagicStack要针对的几个实际问题 

    首先是爆炸式增长的基础设施,持续交付的几个云化数据中心的客户中,在短短的一年的时间中,从30台物理服务器的规模就可发展到两百多台服务器,一万五千多台虚拟机。 

    其次是缺乏高效的运维机制及高效的运维工具。在小规模的情况下,传统方式通常使用各种开源的运维工具来帮我们解决日常的工作,但是随着业务的增长会发现简单地使用这些工具已经没有办法再适用于大规模的生产集群的维护,需要一套高度整合的运维平台。 

    最后是运维人员存在被动、效率低的状况。通常来说,相信大部分的运维人员都是等待报警,等待被告知有故障,而对于大规模的生产,这样的告警方式和处理方式的效率十分的低下。 

    在实际运维中,还会碰到例如在OpenStack的运维中,经常会有一些不必要的升级流程,来帮我们处理一些临时故障,也会接到来自基础设施的大量事件告警,用过开源监控软件的运维人员应该会深有体会,各种各样的事件都会告警,有时候忙的时候运维人员会选择性忽略报警,而造成解决时间和告警时间较长,最终将导致违反sla。 

    MagicStack产品如何解决运维背后系统性的问题。 

    MagicStack产品的自动化运维体系引ISO20000中的四化原则,在开源中确定统一的标准,提高后续的开发和使用的效率。同时管理体系化、工作流程化、任务自动化、人员专业化、不得不说传统运维也好,自动化运维也好,想要提高运维效率和质量,必须拥有一套符合业务场景的运维体系和流程。 

    MagicStack运维将着重解决以下几个点,第一个就是由监控来驱动运维,建立一套完善的自动化监控体系,尤其是对于OpenStack来说这会变得至关重要。通过有效的监控来驱动运维,升级,维护,变更等工作。从而提升运维人员的工作效率‘减少不必要的生产操作。降低维护成本,故障流程化规范化处理。 

    再通过一个例子来具体说明下。 

    云途腾在产品开发中遇到过这样一个客户,目前的规模有北京、上海、香港,三个数据中心,有284台物理服务器,在这个OpenStack生产集群中有4078个触发器,18000多个监控项目。那么在这个环境下对于OpenStack自动化运维的一些实践是怎么做的。 

    在这个OpenStack集群中,用了以下的几个开源工具来解决自动化运维的相关的一些工作,首先是用Cobbler批量的装机,批量的初始化我们的云计算的基础环境,然后是Zabbix的自动化监控,和自动化告警,目前来说云计算厂商也都是在用Zabbix进行监控,除此之外也尝试过其他的监控软件,如Nagioszenoss等,最后发现Zabbix的扩展能力和监控能力都是比较适合于OpenStack这种复杂的云环境。Ansible的批量运维管理,最开始是使用Saltstack来进行配置管理的,相比于Ansible来说,Saltstack的学习成本要更高,高门槛使得基本上都是开发研究人员在玩,运维投入也较大,后来云途腾的运维人员选择了Ansible十分轻量的配置管理工具。用Elk来进行日志收集和分析,Ansible的用户集中管控,对于用户这一块,也推荐去使用Nis或者Kerberos这样的用户管理工具。选择用Ansible是因为当时整个运维团队对Ansible的使用是比较熟练。最后是上MagicStack的超级高效联动功能。 

    MagicStack在这复杂的环境下是如何做到多工具的高效无缝联动呢?季文轩告诉我们,这里会有一个Master的前端控制机,在前端机中导入物理服务器的IPMI的管理地址和用户名密码,设置物理服务器的的静态IP地址和操作系统口令,提交之后会,Master会自动调取Cobbler的API进行启动物理服务器并且自动的分发操作系统下去,在分发操作系统的同时,前端机也会调取Zabbix的API初始化所需要的监控项目,在Cobbler的KS中也定义了一些其他动作,比如初始化物理服务器的一些配置,比如Kernel的参数,打开文件句柄数,同时也会帮我们把Zabbix的Agent部署到每一台物理服务器中,并帮我们做一次优化,当操作系统安装完成后重启,Zabbix的Agent会自动上线,Zabbix会根据上线的Agent的自动的添加模板,添加相应的监控项目和图形数据,同样的Elk的Agent也已经部署到了操作系统中,也会自动的加入Master上已经部署好的Elk的集群中。到这个时候,前端机会感知到服务器的一次性初始化的操作完成。这时候就可以在Master的前端机上用Ansible进行OpenStack环境的部署。直到整个环境的完成上线操作。当上线完成后。部署脚本也会通过设置的调度器进行周期性的常规巡检,来做到整个OpenStack的集群的强一致性的同步。 

    在季文轩的主题演讲完毕后,现场增设了关于MagicStack的观众提问环节。其中,多位邀请嘉宾就云途腾的自动化运维提出了非常有意义的应用层面的问题,并使全场与会者都开启深度思考模式。 

    云途腾因为开源OpenStack起家,因为开源的信仰走在一起,所以更希望用开源的产品、理念回报始终坚持的开源精神。云途腾也正通过开源的技术和心态解决行业的一个棘手又瓶颈的老问题,相信未来会有更多的企业像他们一样用包容的视角和务实的理念为云计算带来更多的助力。 

[责任编辑:]

网友评论:

已有1条评论

验证码: