如何做好云计算的运维工作
随着工业4.0的兴起,云计算已经从实验阶段转化为具体实施阶段。除了部署相应的软件、硬件和虚拟化资源,还有一个问题摆在我们面前,如何运维云?如果没有清晰的云运维规划和手段,云数据中心将难以高效的运转起来,所以云运维对于云建设者来说是至关重要的一环。
那么,云数据中心与传统的数据中心运维有什么共同点和差别?做好云运维应该关注什么?该如何选择一个合适的云运维工具?上述问题都是应该是云运维过程中会遇到的。下文会针对这些问题展开详细论述。
一、云运维与传统数据中心运维比较
“云是数据中心的新IT形态”,云与传统数据中心的建设目标是一致的,都是为企业提供IT服务。运维人员的职责都是保障IT服务的质量,围绕服务等级协议SLA展开各种运维活动。然而在运维技术、管理模式、财务流程、服务分级、业务要求、运维职责划分等方面两者又有所不同。
相对于传统的数据中心,云数据中心的服务特征更加明显,云数据中心将基础设施(IaaS)、平台(PaaS)、软件(SaaS)以服务的形式提供给最终用户,它利用虚拟化、SDN等技术将网络、计算、存储以及应用等资源池化,通过自动化技术按需为用户分配IT资源。因此在云运维中IT请求交付(Request Fulfillment)流程的地位不断突出,也使得云运维显示出明显的运营性质。
云也改变了传统数据中心的财务管理模式和采购模式,传统数据中心原来的采购流程变为了服务审批流程。要申请云数据中心资源,面向云业务的计费系统也应运而生。云计费除了用于真正的收费场景外,更多的时候应用于企业内部,通过内部核算,也就是经济杠杆去有效约束IT资源需求,形成在服务质量和IT资源间的平衡,有效提升IT资源利用率。
云数据中心对IT服务交付速度提出了更高的要求,然而云数据中心的基础结构却比传统数据中心更加复杂,手工交付难以满足云服务交付的速度要求,更容易发生故障,自动化交付就成为了云服务交付的必要手段。
在传统数据中心,运维人员需要关注基础设施的维护,而在在混合云和公有云应用场景中,应用管理的地位更加突出。运维人员不必关心部署在公有云上的业务所依赖的基础设施,而业务监控的职责也转移给公有云提供商。公有云提供商不但要保障IT基础设施本身,还要更加关注承载业务的运行状态。
二、云数据中心运维简介
在云数据中心维护过程中,云服务请求交付系统、计费组件以及自动化部署组件已经从云运维系统中剥离出来,形成相对独立的运营平台—云平台。云平台提供了服务目录、自助服务台、云服务自动部署、以及一体化的计费和核算功能,因此云平台对云数据中心的正常运转至关重要。而传统的网络监控、服务器监控、机房监控、业务监控、事态管理、变更管理、问题管理、配置管理对云数据中心而言依然不可或缺。
云平台是云数据中心的对外服务和展示窗口,是云租户对云数据中心的直观体验。云数据中心运维是云服务水平的后台保障,二者就像客机上的空乘和地勤一样,在云数据中心缺一不可。
1、云运维过程中需要关注哪些问题?
选择开放架构
云虽然已经到达了可实际部署阶段,但是云平台架构、计算虚拟化技术、网络虚拟化技术、云与大数据的配合等技术依然发展迅速。为保障云运维的持续发展,应该优先选择正在不断演进的开放平台作为基础架构。
CMDB作用愈加明显
在私有云和混合云应用场景中,高度集中的业务、高度集中的设施、广泛应用的虚拟化技术、众多的云设施和软件供应商、多样的云服务消费者,以上这些因素组合在一起,使云运维的复杂度成指数级增长。云数据中心的设备信息、应用信息、策略信息、维保信息、组织信息、负责人等各维度的信息交织成复杂的关系网,实际运维时如果能从这张关系网中将所关注的信息抽丝拨茧,将大幅提升云运维的效率。反之如果没有有效手段管理这些关系,云运维可能会变得混乱和无序,运维效率低下,使云服务体验大打折扣。设计合理的CMDB(配置管理数据库)恰恰是解决这个问题的最佳途径。CMDB自动同步配置项信息,将割裂的各维度信息关联在一起,帮助云运维人员全面、准确和及时地了解业务相关的组织、资源、环境和服务等不同维度信息,使运维人员快速准确地了解事件影响范围,作出正确的决策。
文章来源:中国云计算