FinOps團隊的職能

FinOps 職能代表FinOps所進行的活動與知識領域。 每個採用 FinOps 的組織都在所有 FinOps 知識領域開展活動。 每個 FinOps 職能都包含 FinOps 能夠做些什麼。

FinOps 職能代表支援其相對應 FinOps 的工作領域。 職能活動是允許員工通過生命週期階段迭代地滿足 FinOps 實踐需求的任務或流程。 這些職能活動和流程主要是為了支援、教育、知識共享、宣傳、可運作的任務、業務目標和 FinOps 成熟度改進服務。

FinOps 領域代表了組織在 FinOps 實踐中必須執行的能力。 每個組織都將在其 FinOps 實踐中使用每個領域。 每個領域內實現的特定功能組合對於組織來說可能是獨一無二的,並且取決於他們的 FinOps 成熟度。

FinOps 的每個領域不是個自獨立的流程步驟。 "在組織的 FinOps 實踐的任何階段都可以進行多個領域的實踐"

這些領域是有相依性的,並且共同提供了運行 FinOps 實踐所需要的職能活動的high level overview。 實行這些領域的組織的結果將顯示在成本和使用報告中,將對績效產生影響,並將能夠看到新的機會,這些機會可以作為 FinOps 後續階段迭代的input。

以下為FinOps的六大知識領域

  • 理解雲端的使用與費用
  • 效能追蹤與效能測試(Benchmarking)
  • 即時決策
  • 雲端費用的優化
  • 雲端資源的使用優化
  • 使FinOps計畫與組織的策略一致

理解雲端的使用與費用

在這一部分,組織將努力收集有關其雲端使用和成本的所有必要資訊,對其進行正規化以供審查,包括將它分發給將在其他領域中使用它的那些角色。

這個領域內的職能"側重於理解和分配組織內的成本和使用情況",而不是為特定目的而採取行動。簡單來說就是組織內所有雲端的情報與資料收集.

這個領域使組織能夠了解其使用的雲端服務、費用支出的因素以及誰負責這個費用支出。 它以適合組織當前雲端成熟度層級的細緻度一致地提供關鍵資料,以支援當前雲端使用情況和歷史趨勢視圖,以便來支援第二個領域:效能追蹤與效能測試

這個領域的核心是回答這個問題:“我們在雲端上花費了什麼,我們在使用什麼雲端資源?”

以下是要得到這一類資料的需要實行的事項

1.費用資料對應的業務

我們需要的是對組織有意義的費用分類.費用分類可能是根據組織階級,部門/團隊/功能(application)/成本中心(cost center)/專案或其他對組織是有意義的分類.這些沒有定義出來之前我們是無法做出正確的 cost chargeback.

2. 設定標籤策略與合規

在雲端中什麼的資源是需要貼標籤的?又是什麼的資源在雲端之外也要貼標籤的?我們如何管理未被標籤的資源與沒有標籤的費用?如何管理下標籤的合規作業?

技術團隊設置的標籤和帳戶通常與財務團隊所需的認知不一致,也不包括高階管理層所要求的匯總資料。下標籤的策略既是一門藝術,也是一門科學,我們將在後面介紹。 即使具有強大的帳戶層次結構,也必須儘早與我們的標籤策略具ㄧ致性,以獲得更細致化的資料。 沒有這個,標籤很快就會到處都是,而變得無法集中使用。

3.建立費用的Showback 與Chargeback

隨著組織採用將費用支出的責任推到組織邊緣(每一個雲端使用者)的 FinOps 模型,我們會發現chargeback和showback模型對於推動費用支出的所有權和成本回收變得越來越重要。

我們需要定義在內部團隊之間的成本回收,如:

  • 每個月雲端服務的直接費用
  • 前期的費用( 例如AWS 的 RI — All Upfront )
  • 共同的成本(例如共同的功能 — File server)

Showback 模型從中央帳戶/預算中支付共同成本和前期費用(upfront cost),但使用的資源成本顯示給各個部門/團隊以進行planning/budgeting。 Chargeback 模型實際上是在向內部使用雲端的團隊收取費用,並在每個會計期間分配預付費用的攤銷和共同功能的成本.重要的是讓團隊隨時了解他們所產生的成本.

4.定義預算與預估(Forecasting)

運用其他正在使用雲端的部門所產生的資料,FinOps 團隊應該能夠為不同的專案產成雲端使用預估,並提出不同專案的預算應該是什麼樣的。 這些預算和預估應該考慮雲端架構的所有方面,包括容器,網路,資料庫等等。 根據預算管理團隊可以讓我們知道何時需要優化或加預算進去,我們還可以就費用支出發生變化的原因進行討論。

我們對每個團隊的費用應該是根據全部的成本和適當分配的費用支出、服務或工作負載進行花費預測,並能夠根據歷史資料和成本基礎等不同輸入對預測的變化進行建模。

5.動態的計算我們自己的成本費用和成本攤銷

報告成本的各種方法、追踪RI(instance)的預付款以及雲端平台商提供的各種折扣模型要求 FinOps 團隊能夠以包括所有相關折扣的方式準確有效的向雲端團隊報告使用情況 ,進行成本調整和成本攤銷。

效能追蹤與效能測試(Benchmarking)

在這一部分,組織設定雲端使用(usage)和成本並將其對映到預算,歷史資料進行預測,並建立和衡量 KPI 和其他績效指標,包括效能測試。

這裡需要查看我們過去和當前的費用支出、設立baseline和預算,然後進行預估的能力,以幫助我們了解我們的支出是否符合預期、是否被理解,以及是否達到了我們的組織目標。

這個領域的核心是回答這個問題:“我們正在使用/花費的雲端資源是否能讓我們實現我們的戰略和組織目標?”

所以我們需要取得以下三項資訊

1.趨勢圖與多樣態的分析

我們能夠隨著時間的推移來追踪雲端資源使用的情況並且是根據我們的費用支出來預測,測隨著時間的推移來追踪雲端費用至關重要。 當我們看到趨勢線的差異時,我們可以確定我們是否有效地控制了成本,或者我們是否有效地進行了預測,FinOps 團隊可以確定要採取哪些措施來修正我們的行為。

2.建立計分卡(scorecards)

計分卡讓雲端團隊和高階管理層可以看到我們在持續在雲端投資上的表現。 FinOps 團隊在雲端團隊中推廣的良好行為並建立具有明確目標的計分卡有助於所有團隊了解他們的工作方式並取得積極成果。

3.對不同產業的效能測試

基於組織內部計分卡的概念,更進階的 FinOps 團隊擴展了他們的效能測試,用的是比較其他業產的費用支出資料,以確定跟具有標準化費用支出特徵集的其他資料來比較其效率。

即時的決策

當我們了解我們的費用支出並建立了我們的期望和標準時,我們就可以在收到新資料時使用這些資訊做出及時決策。

這裡的目標不是著重即時資料的本身,而是利用一致的成本與雲端資源的使用資料來進行持續調整。

這個領域通過在整個跟雲端有關的利害關係人脈絡中管理資料、迭代地提高決策速度並使組織流程與雲端中營運的現實保持一致,從而提高了利害關係人的支持。 隨著時間的推移,我們努力將這一決策進一步推向組織的邊緣(也就是每一個使用雲端的使用者),從而為後續領域提供活動。

這個領域的核心是回答這個問題:我們現在可以採取什麼行動來讓我更好地實現組織的目標與目標成果?

在這一部分我們有三項作業需要進行:

1.提供給利害關係人即時且具一致性的費用資料

雲端的利害關係人應該能夠定期查看他們的預算是如何花在雲端上的。 每日或每周資料可見性為他們提供了一個回饋循環,使他們能夠為業務做出正確的決策。 這會產生“Prius Effect”,其中即使沒有明確的指示,只要能看到費用支出和雲端使用的資料,通常也會提高使用效率。最好是針對組織的每一種角色客製化他們所需要的報告資料.

2.辨認異常

異常偵測不僅僅是識別雲端費用警戒線。 識別異常的使用高峰也很重要。 鑑於雲端平台商提供的各種不同收費模式的服務急劇增加,異常偵測可以監控任何費用支出偏差,幫助我們在一大堆雲端服務中找到可能需要快速修復的項目。 能夠近乎及時地執行此操作至關重要,而不是在收到每月帳單之後才去標記異常的項目。 應考慮使用自動化平台和工具來有效地標記成本異常。並且在確認異常後與對的人溝通,而通常是對這個資源下標籤的人.

3.搜尋與移除未充分利用的資源

在團隊可以看到他們正確分配的支出和使用情況後,他們可以開始識別所有主要費用支出驅動因素(如運算、資料庫、存儲或網路)中未使用的資源 — — 並關閉它們以立即獲得效益和省錢。主要是搜尋並消除浪費。我們需要記住,“在雲端中,我們不需要為沒用到的資源付費,而是為正在運行的資源付費,無論我們是否正在使用它.”

雲端費用的優化

在這個部分,組織致力於定義其定價模型(pricing model)的目標,分析歷史資料後購買與雲端平台商協商後的折扣來調整定價模型,並致力於管理其在雲端中使用的服務定價。

費用優化領域包含健全我們購買雲端服務的方式,並確保我們的定價模型、購買選項和承諾使用(committed use)與我們的業務目標一致。

這個領域的核心是回答這個問題:我們如何改變我們支付的費用以及我們如何購買我們在雲端中使用的資源以實現更好的性價比?

以下是在這個部分需要執行的工作

●平衡各種費率類型使用
○ On-Demand
○ Reserved/Committed/ SavingPlan的容量
○ Spot、Pre-emptible或Instant market

● 隨著前期費用的增加,折扣上升,彈性下降
當我們更確定我們將使用什麼雲端資源時,減少我們的雲端資源使用的彈性,增加我們的固定資源的使用期限

● 不同供應商對預購容量的處理方式不同 :

AWS的RI, GCP的CUD, Azure的Savings Plans

● 大量批發的折扣/資源持續使用(GCP的SUD)
● Licensing
○ Marketplace
○ OS License
○ Licensed Software 對比 Cloud Native的選擇

雲端資源的使用優化

在這一個部分,組織識別並採取行動,將正在運行的雲端資源與在任何特定時間內運行的工作負載的實際需求相匹配。 這項工作涉及資源的預測性調整、管理工作負載以需要與正確的擴展資源數量保持一致、在不使用時關閉資源。

使用優化的領域包含一組功能,以盡可能地將我們的實際工作負載需求與我們在任何特定時間使用的雲端服務相匹配。 使用合適的資源,以合適的規模,只有當我們需要雲端資源來產生業務價值時,才是最終雲端的“變動使用模型”允許我們為組織的業務實現價值最大化所做的事情。

這個領域的核心是回答這個問題:我們如何改變我們正在使用的雲端資源以及何時在雲端中使用它以更好的滿足組織目標?

以下有三項工作需要被執行

1.Rightsizing — 找到工作負載運行的資源

在決定instance type和size時在“標準化”“客制化”之間作出平衡。Rightsizing在雲端遷移的方法-“lift and shift”是常見的,因為有時很難匹配地端機房的虛擬機的類似規格。在遷移完成並觀察了雲端中的完整操作週期後進行調整,使技術團隊能夠根據工作負載適當到調整規模大小。在遷移的期間內由於技術團隊還不清楚工作負載適合哪些雲端資源,可能會到處的嘗試.這段期間的費用支出可能會異常的升高.

而調整規模大小是 FinOps 流程中最具協作性的,因為它需要分析雲端中運行資源的效能,評估從一種資源大小/類型更改為另一種的價值,以及這樣做對可行性和難度的技術投入。

與 買RI不一樣 ,Rightsizing 需要更動運行資源,並且可能對公司系統的健康和營運產生影響。但這不應該阻止我們這樣做,我們只需確保我們能夠仔細處理每個合適的Rightsizing機會。

調整規模的機會應始終被視為與 FinOps 團隊討論的機會,而不是一定要的的省錢。例如,在技術團隊成員驗證在這個instance上運行應用程式的情況下可以進行變更之前,不要投入過多的時間來估計insatnce family變動的成本影響。

Rightsizing的總結是:

  • 持續性的雲端資源的低使用率創造了節省成本的機會
  • Rightsizing不只有compute, 同時也要針對Database, Storage, Managed services

2. 管理工作負載

工作負載管理( Workload Management)建議我們,每當我們是以秒/分鐘/小時支付變動的雲端資源成本時,我們應該只在需要運作時運行該資源。

每當在雲端中建立資源時,請考慮何時可以關閉它們。所有雲端平台和許多第三方工具都為公司提供了在不使用資源時能夠關閉它以節省成本的能力。通常,這更多地適用於開發和測試環境,這些環境在一周的大部分時間裡都不會使用。一些應用程序和系統可能無法做這種開開關關的動作,所以尋求最小化運行這些的資源的大小以降低成本。

某些環境(例如用於解決生產問題的Stage/UAT環境)可能非常重要而無法關閉。這裡沒有硬性規定。 FinOps 團隊可以在“成本(cost)、速度(speed)和品質(quality)”之間做出明確的權衡決策,並且可能有非常正當的理由讓這個環境一直處於開啟狀態,因為考慮到在生產環境發生事件時不讓環境運行的潛在成本發生,而這樣的使用成本是可以接受的.因為潛在成本大大高於了使用成本.

管理工作負載也給我們兩個啟示:

  1. 當離開房間時,最後一個人請關燈.
  2. 如果是混合雲,我們有沒有把地端的資源用好用滿.如果沒有,哪麼為什麼要用到雲端資源並確認自己能夠管好雲端資源的使用?

3.自動化雲端資源的優化作業

自動化允許一致的建立資源和刪除資源。自動化有助於消除 FinOps 所涉及的流程中的一些人為錯誤,並能利用團隊的能力。自動化流程能使作業更加一致。 如果我們不能完全了解關鍵流程,通常很難設立自動化.FinOps 團隊具有跨職能思維,是能夠發展這種認知的團隊。

雲端資源的優化策略

方法有以下幾種

可以100%避免的

  • 刪除我們確定已經用不到的資源
  • 刪除我們確定已經不需要的,像是備份/快照/PoC環境
  • 關掉我們用不到的資源,像是很多環境在週末或晚上都用不到.使用自動化做開啟/關閉功能

可以節省50%費用的

買CUD/RI/Saving Plan等確定會長久使用的雲端資源

可以節省25%費用的

  • 當該雲端資源跨越成本節費的閾值時來調整大小(Rightsizing)
  • Rightsizing對於 sprint 的最後幾個point來說是一個great story

可以節省1–100%費用的

  • 將應用程式或單一服務重新架構(通常稱為refactor)為 Continer或Serverless.但這通常是一個大工程.
  • 將Cloud native services用作商用版產品的類似物

使FinOps計畫與組織的策略一致

在這一個部分,組織採取行動並自動化管理使用因雲端資源而產生的相關IT財務作業,並將 FinOps 功能任務與現有組織流程、各個單位和技術整合。

這個領域包含我們將用於持續改進、變更和調整組織本身(包含人員、流程和技術)的能力,以便用最有利於公司的方式來使用雲端。 此處的行動可能是增強以角色為中心的支援、FinOps 用這幾種方式:訓練/適應/調整 — 組織現有流程以更有效的支援雲端的使用。

這個領域的核心是回答以下問題:我們可以在組織內進行哪些變動以更有效地使用雲端?

我們可以有以下的方式來與組織的策略保持一致

  • 進行一個小型的業務案例
  • 追踪和趨勢
  • 對每個團隊的溝通策略
  • 每個建議都是討論的機會
  • 平衡工程成本和工作量與整體節費(設置最低節費的閾值)
  • 對於每個機會,企業都可以採取行動,有充分的理由決定不採取行動,解釋為什麼這不是節省成本的機會。 這些行動中的任何一個都是一個好的結果
  • 利用的現有流程、工具與自動化

--

--

運用"雲端服務"加速企業的數位轉型願景
運用"雲端服務"加速企業的數位轉型願景

Written by 運用"雲端服務"加速企業的數位轉型願景

我們協助您駕馭名為"雲端運算"的怪獸,馴服它為您所用。諮詢請來信jason.kao@suros.com.tw. https://facebook.com/jason.kao.for.cloud

No responses yet