Observability 3 本柱＋Profile 打造完整可觀測性解決方案

Elastic 產品資訊產品資訊 2023 年 3 月 3 日 最後更新時間 : 2025 年 12 月 30 日

在現代化的雲端原生環境中，識別效能瓶頸和低效的 CPU 使用率是一項極具挑戰的任務。

隨著環境越來越複雜，使用者急需一套高效的可觀測性解決方案。企業通常可透過可觀測性的三大核心資訊 —— 指標（Metrics）、日誌（Logs）與軌跡（Traces）——來優化應用程式與基礎架構的可靠性與效能。

然而，雖然這三種訊號提供了大量有價值的資訊，它們仍無法完整呈現系統的全貌。

本文將探討為何不間斷剖析訊號（profiling signals）是可觀測性工具棧中不可或缺的元素，以及如何利用剖析訊號彌補指標、日誌與軌跡的不足。

此外，我們也會說明將這四項可觀測性訊號整合至統一平臺，而非分散於獨立工具中的重要性。

可觀測性的四大訊號

在進入細節前，我們先簡單地介紹 4 種可觀測性訊號的形式以及它們常見的應用範例。

剖析信號是一種堆疊追蹤 (stacktraces)，它提供代碼於何處耗費資源的詳細資訊（通常為 CPU 週期或記憶體）。

剖析訊號能提供系統中最耗資源區域的總覽，以及單行程式碼的細節。

指標是代表系統在特定時間狀態和性能的數值。

這種訊號通常被用於監測系統健康狀況、識別趨勢以及觸發告警訊息。

日誌是系統產生的事件和訊息紀錄，它們提供對系統行為的洞察，並協助識別異常。

軌跡是系統中請求路徑（Request Path）的詳細記錄，它們被用來了解系統物件中彼此的相依性和互動關係。

可觀測性不僅僅是監測工具，而是全面理解整個 IT 系統的關鍵，幫助 IT 人員解答各種「為什麼」的問題。

隨著雲端環境的複雜性增加，開發人員、SRE（站點可靠性工程師）和雲端工程師需要對系統中的運算資源有更細緻的能見度，特別是那些潛藏在表面之下的未知因素。

剖析訊號在可觀測解決方案中扮演著關鍵角色，儘管指標、日誌和軌跡各自提供系統效能的洞察，但剖析訊號能揭示隱藏在細節中的問題，例如：資料結構和記憶體配置的相關性，以及核心空間與使用者空間的代碼能見度。

可以將指標、日誌和軌跡比作人體的重要生命跡象，這些資訊提供健康狀況和效能的基礎指標，如體溫、體重和心率。

而剖析則如同 X 光，讓使用者能夠深入了解系統內部運作及不同系統之間的相互作用。

剖析訊號提供的資訊更為詳細，幫助使用者發現宏觀指標無法識別的問題，並賦予使用者揭示系統中未知因素的能力。

這種全系統的深層能見度使使用者能夠迅速觸及「為什麼」問題的核心，例如：為何 X ％的 CPU 資源被用於功能 Y？為何 Z 現象會發生？

Elastic Universal Profiling 可以協助 DevFinOps（開發、維運和財務團隊）更好地理解特定程式碼對雲端運算資源和碳足跡的影響。

透過 Elastic Universal Profiling，DevFinOps 能夠識別資源浪費的具體區域，並採取行動以優化成本，減少應用程式對環境的影響，最終實現成本節省和降低碳足跡。

總結來說，指標和軌跡為系統中的「可見潛在變因」提供能見度，日誌則為「已知可解決因素」提供能見度。

可觀測性的三大支柱為系統提供宏觀層面的洞察，但若缺乏剖析訊號，系統中的能見度將出現重大缺口，因為總會存在「未知的潛在風險」。

剖析訊號透過提供微觀的能見度，幫助減少系統中的未知漏洞，這在現代雲原生環境中尤為重要。

在接下來的段落中，我們將探討如何利用周哈里窗架構深入理解「未知潛在變因」這一概念。

周哈里窗（Johari Window）這個框架，是由 Joseph Luft 和 Harry Ingham 二人共同提出，該框架被國防和風險管理領域中的專業人士廣泛採用以評估威脅和風險。

根據該框架，系統的資訊分類為：

1. 已知又可解決的因素（Known-Known）
2. 可見的潛在變因（Known-Unkown）
3. 潛在風險（Unkown-Unkown）

可觀測性旨在透過搜集和分析資料，以獲得系統中的洞見，因此我們利用周哈里窗將可觀測性訊號進行以下分類：

已知又可解決的因素（Known-Known）：泛指我們知道也能察覺的變因。我們能將已知又可解決的因素比喻為可觀測性中的日誌。因為唯有已知的資訊才能被其記錄下來。
可見的潛在變因：是指當我們意識到自己不了解某些事情的真相，透過進一步地調查，將這些未知找出。我們能將可見的潛在變因比喻為可觀測性中的軌跡和指標。例如：指標讓我們監測預定義的測量值，例如：平均回傳值和端點吞吐量（Calls-per-minute），而軌跡則能協助調查系統中一個特定的請求在系統中的流向。
無法歸類的未知因素：指的是經由上述分類後仍無法歸類的未知變因，而這些未知的潛在風險在造成傷害前都能隱蔽自己的蹤跡。這與軟體工程中的黑天鵝理論有些類似。因此 IT 人員需要剖析訊號來破解系統中的未解之謎。

總而言之，雖然指標、日誌和軌跡提供使用者以宏觀的視野監測系統資訊。

但剖析訊號卻能提供使用者更詳細、更細粒度視角來監測系統內部的運作流程。

這種深層的可觀測性可以幫助更好地識別潛風險並降低平均檢測時間（MTTD）。