当前位置:首页 >> 关于我们 >> 新闻动态

紫羚云秦鸿林:数字化时代,如何认识和对齐ITSM价值?

发布者:  超级管理员 发布时间: 2022-11-01

作者:秦鸿林  紫羚云 CGO兼SaaS负责人


编者在最近发表的一篇文章《大中型企业实施IT服务管理(ITSM)的几大难题》中,谈到的“十一个”难题的第一个就是“关键干系人的支持不够”,其本质上就是大家对实施IT服务管理,“上ITSM”这个价值没有更好的认识,或者说没有对齐。


最近又在年底了,到了年底的总结和新一年度规划的节点,一些客户朋友咨询ITSM,其中反馈的一个痛点是如何体现ITSM的价值,如果说服领导认可实施ITSM的价值,并同意项目立项。那么IT服务管理(IT Service Management)的价值,尤其是在数字化时代,实施ITSM/ITIL项目的价值是什么?编者准备从实施ITSM项目四个常见场景来探讨这个问题,因为不同的场景下实施ITSM/ITIL项目,其价值侧重点略有不同。

>>>>>>

注意:除了场景之外,还有一个重要的维度是行业维度。不同行业的客户,实施ITSM/ITIL项目的价值也是侧重,例如金融行业:面临着监管红线的安全稳定, 金融科技等互联网创新敏捷, 数字化转型诉求,信创实施路线与风险等,所以其本身的主要价值诉求是关注业务、运营风险、运营成本、投资回报。

>>>>>>



>场景1:IT基础设施和数字化产品的运维,也就是基础和系统运维层面。

image.png

对于IT基础设施和数字化产品的运维,来保障高可用及业务连续性,是实施ITSM的首要价值。随着信息化、数字化的深化,企业对IT基础设施和数字化产品的可用性提出了更高的要求,99.99%已经是一个基本要求(如果99.99%意味着一年只可以中断53分钟,平均到每月也就是4.38分钟)。

为保障IT资源尤其是核心、重要数字化产品的可用性,应对庞大且复杂的基础设施和数字化产品的运维工作,构建实施ITSM/ITIL项目和ITSM平台就显得非常必要。

只有在重大事件发生时,加强不同运维团队之间的快速协同,并持续做好问题管理,减少低级和重复事件的发生,提高运维效率与水平,才能保障系统安稳运行,只有遵守变更发布的最佳实践和流程要求,才能尽可能减少变更事故。同时,应用系统从建设正式转入运维团队持续运维,也需要良好的运维体系和平台工具来保障可用性与业务连续性。 

>场景2:建立面向共享式服务运营中心,提升用户满意度,成为实施ITSM的典型场景诉求。

image.png

要实现IT服务的统一受理、分派、协同、跟踪、反馈和应用监控,需通过ITSM项目建设和运营,促进各项运维活动和支持工作的规范化与标准化,帮助企业构建共享式中心,形成资源共享机制,提升服务水平和用户满意度。这有利于建设成一二三线的运维体系,从而降低成本,减少资源分散和浪费,以达到降本增效提质的目的。

编者之前所经历的某家世界500强企业,高峰时间一线运维团队200余人,面向HR、财务、数字化、采购、审计等各类数字化系统的集中、共享的运维,有数字化产品的咨询和请求、也有HR和财务等各类业务的咨询和请求,日均流程三千余单。面对这样的共享式服务中心的建设, 没有统一和规范的IT服务管理体系和ITSM平台是不可想象的,体系和平台是一个非常核心的支撑。

在监控系统的基础上,第一时间发现故障、快速响应和处置,从而提高共享运维团队一线解决率,降低整体成本,提升业务用户的满意度和用户体

>场景3:数字化部门的内部数字化管理,是实施ITSM项目最根本的诉求,这个是我本文重点探讨的方向。

数字化部门作为企业数字化支撑部门,完成自身数字化的数字化是非常必要的,否则怎么能担负牵引企业数字化转型的重任呢?所以,我一般把ITSM叫做数字化部门的数字化平台。

ITSM首先为谁服务?我们认为首先是为CIO服务,让CIO的管理决策有依据,让科技运营更有序,让生产更安全。

image.png

CIO和IT部门管理团队,经常需要一些统计报表和报告,ITSM可以让数字化管理的数据上报更可视化,成为CIO数字化管理的“抓手”,比如基础设施可用性,数字化产品的重大故障和业务中断,也就是业务连续性的数据等,这些数据,从手工搜集和手工统计变为系统自动汇总和上报;另外,ITSM也是业务部门和数字化部门的中间窗口,联系了业务和数字化部门的纽带,比如生产系统的重大变更,特别是投产往往都需要业务部门的参与,通过ITSM可以让这样的管理更加有序,最后是让生产更安全更具有可跟踪性,更符合行业监管和ISO20000的要求,ITSM也可以打通内部的APM、基础监控、日志监控、DevOps等平台,甚至和OA系统,起到一个集成的统一管理的作用,例如一个严重的告警会自动触发生成一个事件,事件会升级为问题,问题可能最终可能通过开发形成一个变更和发布来解决,甚至会调用DevOps的自动化的能力和集成和部署上线。

除此之外,ITSM还有提升效率降低成本,降低风险和参与数字化创新的多重作用:

image.png 

l 统一IT和业务部门的服务接口

尽管不同的行业、规模的企业,不都有7*24小时服务的强烈诉求,但是ITSM作为一个为业务部门集中、统一的、24小时在线的技术服务入口,对于提升用户的体验和解放IT部门的压力,同时规范入口,还是非常有价值的。在我服务的众多客户中,有一类诉求,就是统一服务入口,可以想象一下,不同部门和层级的用户有不同的入口,在不知道或“故意不知道”IT部门的入口的情况下,而直接找数字化部门的负责人或者特定的“熟人”,IT部门内部再传来传入是多么常见和不正常的情形啊。这一提单和查询的入口(我们一般称为ITSM的自助服务入口),还是7*24在线的,而且基于移动化、多渠道的。比如在ITSM自助服务的网站、基于企业微信、钉钉、飞书等已经普及的IM工具,尤其是类似于紫羚云的自助服务提单入口完全是“傻瓜式”的简单,体现当然会非常好。

l 规范和固化IT服务管理流程

image.png



对于一般企业,本身可能缺少规范和固化的的IT服务管理流程,对于大型集团型企业,更是如此,需要顺应当前及未来应用集中化部署模式的运维需要。

随着企业信息化建设的发展,以及当前虚拟化及云计算技术的快速发展,为控制信息化建设投资成本以及后续运维成本,集团型企业应用部署模式将逐步从多级部署方式转向集中化部署模式转变,而当前的分级的运维模式难以顺应信息系统集中化部署的运维管理要求,集中化的部署要求。

运维组织架构及职责分工需要明晰。在信息系统集中化部署的条件下,信息化内部和各级运维团队直接的协调、组织以及分工需要进行必要的调整与整合。

需要在集团内形成统一的工作流程与工作方式。在信息系统集中化部署的条件下,各级运维团队之间和协作和联系将更为密切,这需要在集团各成员企业之间形成相对一致的工作流程与工作方式。在非集团化企业,在IT部门也需要有清晰和一致的工作流程和工作方式。

运维管理的集中化,需要在集团内部和业务部门、分子公司的工作状态透明化。随着应用集中化部署,集团内各级成员企业的协作需要各成员工作的运维工作状态透明化。

这里,分享一个编者曾经历过的某家省级农联社的ITSM项目案例。当时我们在梳理流程时,发现在众多的服务请求、变更发布流程上,非常缺乏清晰和一致的流程。一个表现是同样一类事情,走着完全不同的流程。即使是同一个流程,也存在的有些需要科技部门的总经理审批、有些是副总级别审批、有些更简单的情况,流程怎么走,完全取决于申请人发起时的选择和上一个审批人的意见。这就不是一个好的案例,这个解决办法就是梳理清晰的服务目录和审批流程和交付流程,并通过ITSM来固化,该什么岗位审批、该哪几个人批就审批,完全做到清晰和固化,申请人只管选对服务目录审批,审批人和交付人员只管按照流程审批和交付,不用关心这个流程“是否还需要李总过一下”、“这个流程是否需要让张总批一下”之类的问题。这个案例最终的结果当然是效果非常好。

l 降低系统的运行风险,管理成本和技术成本

企业的信息化建设过程,是从系统和基础架构的建设开始的,往往对于配套的管理规范和即将面临的问题缺乏全面的考虑和准备,随着IT规模的扩张而“摸石头过河”发展自身的管理体系,这些体系之间往往存在各种漏洞和冲突,给信息系统的运维管理带来了很大风险和制约。很多时候,管理也是重要生产力。

而大多数企业的运维团队已经在运维管理方面做了大量的工作,但在组织结构、管理规范、管理流程和技术支撑方面,还没有构建一个完整的、基于最佳实践的IT运维管理体系。对基础设施、数字化产品、桌面服务、用户等的管理和服务是分散的、不关联的,没有实现数据、信息和知识库的共享,没有实现规范化和流程化。这种管理模式将越来越难以适应企业信息化的发展要求,更别说数字化转型的诉求。

因此,需要梳理运维管理需求、规范运维管理流程,开发和建设一套科学有效的融合组织、制度、流程、技术的IT运维管理体系,从粗放和分散式管理,逐步过渡到科学、规范和专业化管理,使IT运维管理体系成为信息化工作的重要组成部分,这不仅对核心应用系统顺利运行和应用有重要意义,也为将来其他重要业务应用的上线提供重要的服务保障。

尤其是,对于已经高度依赖IT系统的企业来说,IT运维管理体系的缺失使得面临经验不少,知识不多,过度依赖核心人员,而且运维风险大等诸多问题。

在运维工作过程中积累了不少经验,但是在实际工作中积累的、有价值的经验仅存在于个别人的头脑之中,未能作为书面的知识记录规范地保存下来。经验始终仅能在小范围内得到传播和继承,无法在更大的范围内体现其价值。这种局面又进一步造成了一些IT运维工作过分地依赖某些核心技术人员,一旦核心技术人员离职或者调岗,对当前的业务连续性会造成了较大影响。

紫羚云有这么一案例:某快递行业TOP级别的快递企业,在选择上紫羚云并实施了ITSM后,相较于原先的IT系统,紫羚云ITSM系统显著提高了这家快递企业的报修工单处理效率,每月测算可节省千万元级的IT人力成本。

l 量化考核将为持续改进服务提供洞见

传统的运维服务模式,在缺少ITSM等工具支撑的情况下,运维价值凸显不出来,领导认可程度和客户满意度较差。

作为业务运营支撑的重要部门,运维工作理应受到足够的重视和尊重,可事实表明,运维的价值无法得到有效的体现,领导认可程度较低,客户满意度较差。这些又导致运维人员积极性差、服务意识缺乏,容易形成恶性循环,同时更加妨碍了运维团队的健康发展。

对IT管理人员的绩效考核缺乏“抓手”,考核不能真正落地。

由于IT服务是一项跨部门、跨组织的团队协作工作,如何从考核运维团队整体IT服务绩效向考核IT员工个人的工作绩效深化,是IT运维管理人员不得不面临的又一大问题。可是,CIO和IT运维管理各级负责人往往为进行这样的考核缺乏“抓手”(考核指标体系的设计)而感到苦恼。

没有数据支撑,就不便于做绩效考核,没有数据支撑,PDCA就缺乏一个基准。回到前面说的,ITSM是数字化的数字化,IT部门自身都做不好,又如何去牵引业务做数字化转型呢?

>场景4:提升用户体验和满意度水平,是实施ITSM项目,上线ITSM平台的重要驱动力。

image.png

其实这是一个比较综合的场景,当然第一个,也就是面向基础设施和数字化产品,由于和直接用户的触点比较有限,所以对提升用户体验和满意度水平更多是在保障可用性和业务连续性这个核心SLA之后而已。

这里有一个重要的逻辑就是:“满意的员工”会变成“忠诚的员工”和“高效的员工”,进而为企业的客户提供“优质的服务”,而“优质的服务”又促成“满意的客户”,“满意的客户”最终带来客户的维系、组织成长和组织利润。看看,满意度不仅仅是不是“减少投诉”和抱怨的问题,而是涉及到企业发展和利润增长的问题,所以管理也是生产力啊!

数字化运维团队,在监控系统的基础上,第一时间发现故障、快速响应和处置,从而提高一线解决率,降低整体成本,提升业务用户的满意度和用户体验。 

此外,合理的容量规划,必要的应急演练、定期的健康检查和日常维护,需要在标准化、流程可控的基础上,尽可能提升自动化和智能化的水平,降低人为风险,也可以提升用户满意度和用户体验。

当然了,提升用户体验和满意度水平,体现在各个方面,例如引入ITIL等最佳实践,建立面向服务的文化,规范和固化的流程,让IT部门内部管理更有序,服务台的值班机制和专业的话术、更高的系统在线率,快速的响应的处置、闭环的事件和服务请求流程,定期的服务满意度调查都很重要。

实施ITSM的价值其实不限于此,这些在ITIL4都有答案,在紫羚云的众多行业头部客户的案例中也有答案!

AXELOS在2019年初发布了最新的ITIL 4版本,在ITIL 4版本中对原有的理念、模型、方法和流程进行了大量的革新,更加强调面向最终价值的协同与价值共创。相信,在未来至少3~5年内,更多企业会基于ITIL 4的模型和方法来重塑企业的IT服务管理。

除了在ITIL最佳实践这样的理论和标准层面,在实施层面也需要有效的、科学的实施方法论来落地实施ITSM带来的价值。

image.png

伴随着云计算、大数据、AI等的快速发展及企业自身的数字化转型战略,IT服务管理体系需要对运维组织、运维流程及制度、运维支撑工具等方面进行梳理和分析,根据企业自身的特点与对未来规划,自上而下逐层进行运维体系顶层架构设计,平台实施和推广,包括:

>培训,建立对ITIL最佳实践的理解,解决人的问题,提高全员遵从最佳实践的意识和能力,包括建立服务文化,具备ITIL/ISO20000的基础知识等;

>梳理、搭建适合ITIL运维最佳实践的运维组织架构,结合ITIL和运维行业经验,建立事件、问题、变更发布、知识、值班、服务请求、配置资产、投产指挥、应急演练等运维管理制度;

image.png

>根据咨询成果进行系统建设规划,贴近规划和业务场景,实施ITSM平台;

>结合运维体系和ITSM工具平台完成推广。

在解决了企业IT部门上下对ITIL/ITSM的价值的对齐的问题,又解决了实施方法论的问题之后,其实还有2个常见的问题需要对齐,也就是:

> ITSM工具感觉就是流程平台,那和OA到底是什么区别?

> ITSM是否可以通过OA或低代码平台来自定义实施?自己干。

这两个问题,在后续再专门分享。