仪表板

12个需要干预的地方使用系统思维视角重

发布时间:2024/12/28 12:21:20   

麦肯锡最近对FinOps的一项研究表明,69%的组织优先考虑战术举措,而不是影响力更大的战略举措。

原因之一可能是这69%的组织中的大多数都没有意识到这些战略举措或没有意识到它们的重要性。

因此,继续我在Medium上发表的文章(从社会技术角度探讨云成本管理问题),在这里我将通过系统思维的视角来分析如何确定解决这些问题的优先顺序。

为什么要采用系统思维进行云财务管理?

任何组织或其一部分都可以被视为社会技术系统,因为任何组织都雇用具有一定技能的人员,他们致力于实现既定目标,遵循既定流程,使用特定技术,在基础设施上运行,并共享某些文化规范。因此,云财务管理是一个社会技术系统,需要通过系统思维从社会和技术角度进行分析。但在深入讨论之前,让我先介绍一些系统思维的术语。

通过系统思维视角进行云财务管理

库存——一段时间内信息或材料的积累。这里,就是云的成本。

流量-由于流量的作用,存量随时间变化。流入量增加库存,流出量减少库存。这里,就是云资源的利用和优化。

反馈循环-每当库存发生变化时,流量就会随着时间而变化。平衡反馈环稳定了库存水平,而强化反馈环则加强了变化。

我们同意“云财务管理”是一个社会技术系统。但我们如何带来改变呢?

当我们分析问题时,我们经常尝试寻找某些可以集中精力的点或地方,以最大程度地利用系统来实现我们期望的结果。例如,如果您要举起一辆倒下的摩托车,您不会从所有可以抓住的部件上拉起来。相反,您会找到最好的零件和保持方式(根据自行车设计和您的优势)以最少的努力和损坏来拉起。

同样,对于复杂的社会技术系统,DonnellaMeadows在她的《系统思考》一书中提出了12个可以“干预”以实现最大影响的地方。这些被称为杠杆点或干预点。

那么,什么是对系统的干预呢?

系统干预是有意改变或改进系统的行为、过程或结果的努力。它涉及发现问题并实施变革以改善系统的整体功能。

我将探讨12项干预措施中的每一项,并详细说明每项干预措施如何与云财务管理以及优化支出的相应措施相关联。

系统冰山——可见和不可见的干预措施

DonellaMeadows按杠杆升序(从最低到最高)介绍了12个杠杆点。我们可以根据影响范围将这12点分为四类,即参数、反馈、社会设计和心智模型。

参数分类涉及系统的相对有形部分,而反馈则涉及系统的内部动态。社会设计涉及系统内的社会结构。最后一种是心理模型,指的是相关人员的价值观、目标和心态。

12个杠杆点(从最低到最高)

参数12.常数和参数

大多数组织的运营假设是设定目标就足够了。但现实情况是,设定目标是最无效的干预方式。在某些情况下,设定目标会变得违反直觉。例如,资源数量、使用持续时间和资源价格是可以确定云系统成本的一些参数。在这些参数上设定目标是一个杠杆点。

该类别的优化措施正在实施

%的成本标签资源。

0%的闲置/僵尸资源。

非工作时间0%的测试环境。

确定%成本预算。

所有资源利用率为80%。

%预留实例用于生产。

参数通常不是一个可以带来系统行为变化的有效杠杆点,除非它们有助于推动其他一些更高的杠杆点(例如目标)。我们将在目标部分介绍更多内容。

11.缓冲区

缓冲区的目的是提高系统处理输入/输出流变化的能力。

例如,提高技能水平并提供专门的时间或额外的人员可以增加团队的缓冲能力。

可以增加缓冲区容量的优化措施是

引进更多员工来开展成本优化计划。

向优化成本的团队引入激励措施。

为团队分配专门的时间(例如优化周五)来进行成本优化。

灌输预测技能。

引入FinOps专家来咨询产品团队。

创建大部分缓冲区需要时间并且不容易改变,因此这个杠杆点被保留在列表中。

10.存量和流量结构

系统中的存量和流量的结构对于系统的运行起着至关重要的作用。这个杠杆点是指构建或修改系统的结构(如基础设施、产品或流程)以降低解决问题的工作量。例如,管理云的团队结构、云的结构以及团队之间的责任结构都属于这一类。

落在该杠杆点以下的措施是

建立客户策略(与业务保持一致)以设定责任和所有权。

引入FinOps工具来访问成本信息、闲置/未充分利用的资源信息、自动化等。

执行容量/成本规划和评估。

根据历史数据洞察进行成本预测。

存量和流量的结构很少能快速或简单地改变,因此这个杠杆点最终位于列表的底部。

反馈

反馈循环-系统的基本操作单元-DonellaMeadows

反馈回路

9.延误

延迟是指与系统变化速率相关的纠正系统所需的时间长度。它在系统的行为中起着至关重要的作用。延迟会在您想要实现的预期目标和实际状态之间产生振荡。

例如,如果您的团队仅在月底才能获得成本超支信息,则优化操作将仅在每月周期内发生。同样,对反馈信息的响应也应该及时,不能有任何拖延。

减少系统延迟的措施有

定义成本阈值和警报,以便在发生违规时立即向相应团队发出警报。

设置资源利用率仪表板。

设置成本跟踪仪表板。

采用自动化来减少对成本警报采取行动的响应时间。

如果系统的延迟是可变的,则更改它们可能会造成很大的影响。

8.平衡反馈循环

平衡反馈循环是根据实际库存水平和期望库存水平之间的差异将系统状态保持在安全边界内的循环。加强平衡反馈环主要是提高系统的自我纠错能力。

任何平衡反馈环路都包含一个目标、一个检查目标偏差的观察者以及一个响应行为。

以下是一些可以增强系统自我纠正能力的措施:

自动化管理(孤立或未标记)资源。

自动执行成本异常检测及其响应行为。

设置成本预算警报。

自动执行标记策略。

自动进行费率优化(预留、节省计划、现货实例)。

自动进行支出预测。

自动提供合适的规模建议、实例购买建议。

定义调度策略和自动缩放策略。

自动化云支出仪表板和支出报告。

FinOps工具可以实现上述大部分自动化。

7.加强反馈循环

加强反馈循环是使系统不断增长或崩溃的原因。它工作得越多,它就越能发挥更大的作用。强化循环有两种——恶性循环和良性循环。

在云中,DDoS(分布式拒绝服务)攻击期间会发生恶性循环,其中攻击流量会触发资源的自动配置,从而引发更多的攻击流量,而随着更多资源的配置,攻击流量又会重新启动该循环。这种指数级的资源使用最终会产生巨额费用。即使性能测试脚本错误也可能导致这种情况。

可以限制这些增强环的生长的步骤是

设置可配置资源的配额限制(最大数量)。

识别并保护资源免受DDoS攻击。

在自动扩展策略中设置合理的限制。

实施有效的云财务管理可以触发良性循环,节省成本会增加对云服务的投资,从而增加其整体价值,从而有更多动力优化支出并实现更多成本节省。

任何不间断增长的系统都会自我毁灭。稳定系统的更好方法是削弱增强环。

社会设计6.信息流

将反馈信息流向正确的人群可能会导致截然不同的结果,这与参数调整或加强/削弱现有反馈循环不同。这是关于将反馈信息级联给那些能够立即、适当地采取行动的人。

以下是您可以采取的一些改善信息流结构的措施:

首先,在各个团队层面分摊成本,并定期向各个团队发送成本报告。这将提高成本可见性并在团队之间建立问责制。

随后,允许产品团队的各个成员访问云支出仪表板。

在财务、应用程序/运营和业务团队之间建立运营节奏,以改善协作并建立期望。

由于这种干预通过提供缺失的反馈信息来建立问责制,多内拉观察到这种干预总是受到大众而不是权势者的欢迎。

5.规则

规则形成了一个高杠杆点。标准、指南和政策在这里可以称为规则。例如,架构委员会必须事先签署设计和架构才能开始编码。

您可以采取一些措施来利用这个杠杆点:

定义清晰的帐户和标记策略。

定义托管策略,以便在IaaS、PaaS和SaaS等多种托管模型之间进行选择。

建立FinOpsCoE来制定标准和指南。

制定策略来定义每个应用程序的成本预算。

定义退款或退款的程序

4.自组织

自组织是一种强大的干预措施,使系统能够不断发展。它相当于改变系统中影响力较小的任何方面,例如规则、物理结构、信息流等。

您可以采取的一些措施是

组建FinOpsCoE,让产品团队成员为标准和指南做出贡献。

授权产品团队通过FinOpsCoE的咨询(而不是审核)来决定其优化计划。

使产品团队能够定义其产品的成本预算。

制定那些有助于在系统内发展和维持自组织的规则是一种强有力的干预。制定这些规则的权力应该属于团队。

心理模型3.目标

目标是比存量流、反馈循环甚至自组织更高的干预措施,因为即使采取了其他上述干预措施,错误的目标也会导致截然不同的结果。

因此,使系统与更高的目标保持一致将带来更好的结果。

改善成本管理体系目的的措施之一是追求提高云消费的价值,而不是控制云支出。

基于这个更高的目标,可以在托管策略中引入的更改是根据工作负载在组织价值链中所扮演的角色来选择托管模型。例如,面向客户且具有差异化优势的核心业务流程应用程序应托管在IaaS上(即使它会产生更多成本)。但属于价值链中支持性业务流程的应用程序应托管在PaaS/SaaS上(成本较低)。

单位经济效益是衡量云支出价值的一种方法。例如,在物流组织中,即使包裹数量增加或减少,处理一个包裹的云成本也可以显示包裹处理的真实成本。每个包裹成本等单位成本指标可以用作优化举措的北极星,以提高云消费的价值。

2.范式——心态

从目标和规则到系统的延迟和参数,一切都源于一种思维方式,即该系统的范式。因此,这个杠杆点,即思维方式的转变,可以引发整个底层系统的变化。

范式的改变通常被认为是很难完成的,但心态的改变只需要一个实现的时刻。

云支出管理需要转变思维方式(管理本地基础设施时就需要转变思维方式)。

您可以采取以下措施来转变心态

引入云/FinOps专家/团队(具有新思维)担任高度可见的职位和权力。

领导者应该谈论基础设施管理的新方法,其中成本是一个适应函数。

应该处理的一些误解(心态)是

云中托管/设计工作负载的方式与本地相同。

云始终比本地基础设施便宜。

1.超越范式

范式并不是一成不变的。因此,您需要超越当前的范式。在这种情况下,云是您当前的范例,但它不是最终的。

您需要考虑的不仅仅是云支出优化。您需要将其视为基础设施支出优化。如果您从这一点开始,您将探索其他可用的选项,例如Dropbox在年所做的事情(目前的状态)-Dropbox将其大部分工作负载从公共云转移到主机代管设施,两年内节省了近万美元,这毛利率从33%上升至67%。对于DropBox来说,公共云在早期比较便宜,但随着公司的发展,后期成本会更高。

结论

需要注意的一点是,随着杠杆点有效性的增加,变革的阻力也会增加,这意味着杠杆点较高的举措将面临来自系统的更大阻力。

在本文中,我讨论了您可以在何处进行干预以更改云财务管理系统的进程以及每个干预点的有效性。但如何干预取决于您,因为每个系统都是独特的并且不断发展的。



转载请注明:http://www.aideyishus.com/lkcf/8423.html
------分隔线----------------------------