fbpx

Elastic Observability 解決方案提供即時且可操作的洞見

Elastic Observability 提升解決問題的效率

Elastic observability logo

2021 年 ElasticON Global 大會上,Observability 產品副總裁 Tanya Bragin 和 Elastic Observability 團隊展示如何繼續提供可操作的洞見和更快速的根本原因檢測,從而縮短平均解決時間 (MTTR)。

雲端、微服務和暫存基礎架構的採用正在增加複雜性,需要 Observability 解決方案來提供端到端的視覺化。 Elastic Observability 得到 GartnerGigaOmEMA 的認可,透過提供以下相關功,繼續建立全面的解決方案:

  • 統一 agent,以集中管理的方式提取所有遙測資料
  • 與原生雲技術(例如 Kubernetes)整合
  • 與主要原生雲供應商的整合,包括 Amazon Web Services、Microsoft Azure 和 Google Cloud Platform
  • 利用機器學習在應用程式性能監控(APM)中自動進行根本原因分析
  • 整合日誌、第三方相依性和後端服務的增強型 APM 除錯工作流程 
  • 用於語境除錯的直觀地圖服務
  • 支援 OpenTelemetry (OTel)
  • 加強合成技術和使用者監控 (RUM) 

我們對開源社群的承諾意味著 Elastic Observability 將始終是一個開源且可擴展的平台。我們致力於採用開源標準和計劃,並為之做出貢獻。目標是為客戶提供全面性 observability 平台,最大限度地提高用戶靈活性,並達到永續服務,開啟更多未來合作夥伴的可能性。

observability structure

使資料具有相關性、關聯性和可操作性

維運和開發團隊經常面臨無法擴展的 metrics, logs 和 traces。即使使用單一工具,資料也經常處於孤立狀態,沒有語境或缺少相關 metadata(維度),這會增加平均檢測時間 (MTTD) 和平均修復時間 (MTTR)。 Elastic Observability 可無縫擴展到具有高維度和基數的大量資料,幾乎沒性能或成本上的損失。
透過 Elastic Agent 和集中式管理實現無障礙導入,可簡化所有遙測資料的收集,包括 Kubernetes 等原生雲技術。我們還添加了與 Microsoft Azure 和 Google Cloud Platform 的整合,以在地端提取遙測資料,並將有更多的整合。
為了高效、快速地除錯,語境是必需的。 Elastic APM 地圖服務使應用程式拓樸視覺話,並透過查看服務狀態、檢測異常以及交易語境下的日誌,加速除錯。此外,也可以比較任何歷史基線的服務性能,從而輕鬆檢測效能異常的服務。我們最近對第三方服務相依性的性能視圖,可以消除環境中的性能盲點。我們正進一步擴展 APM 功能到行動 iOS agent ,但仍在技術驗證階段。

observability redis

我們的下一步是在應用程式和基礎架構之間提供語境。通常,應用程式性能由於基礎架構中的性能問題而降低。我們將提供在應用程式性能和相關日誌的語境中查看基礎架構性能的能力,提供統一的 observability。並且,我們提出比較跨版本、雲端、可用區和其他 metadata 服務性能的要求。未來這些功能將有助於比較 A/B 或 canary 部署之間的性能,並對部署問題快速進行除錯。

observability checkout service

即時分析與機器學習

由於現代應用程式的分佈式特性,和每天生成的數 PB 遙測資料,沒有任何團隊或個人能夠全面了解所有相依性。為了有效地解決複雜的問題,團隊需要機器學習來提供可操作的洞見,同時還能夠對他們的資料進行分析。
Elastic 提供豐富的開箱即用機器學習,以及建立自定義機器學習的能力。我們的 APM 功能在後台利用機器學習來分析應用程式性能的偏差,以識別不當的服務。減少了搜尋和分析資料的需求,從而減少停機時間,並提高了開發人員的工作效率。

observability latency

我們意識到系統很複雜,IT Ops、SRE 和 DevOps 團隊需要分析和調查資料以了解未知的情況。即將推出的一般可用性 (GA) 是一個新的直觀 UI,它能夠為不同的族群提出洞見和策劃資料的探索。此功能允許您開始覆蓋、過濾和探索來自各種來源以及不同資料類型的資料。互動式和策劃的即時資料探索視圖可以深入研究資料,了解未知因素,並減少調查根本原因所需的時間。

observability explore data

開源是 Elastic 的 DNA

Elastic Observability 的基礎是開源的,為資料性能監控提供的完全的控制和靈活性。我們對開源項目的持續支援,幫助塑造和定義我們的產品路線圖。從 OpenTracing 和 OpenMetrics 到 Jaeger、Prometheus,再到現在的 OpenTelemetry,我們一直是開源標準和協議的早期採用者。

Prometheus 是業界的標準 metrics,並為客戶提供儲存 metrics 的開源標準選擇。 Elastic Observability 與 Prometheus 的整合,提供儲存和分析 metrics 的選擇。 OpenTelemetry (OTel) 是一個 CNCF 項目,為 metrics, logs 和 traces 開發通用和開源的標準。Elastic 透過 OTel 端點協議 (OTLP) 或透過 Kafka 串流到 Elastic 平台,提供對 OpenTelemetry 的本機支援。Elastic Observability 繼續投資和支援開源平台,因為我們認為客戶應該對他們的營運擁有選擇權和控制權。

elastic support for open standard
本文翻譯自:https://www.elastic.co/blog/elasticon-global-observability 
參考更多 Elastic 相關資訊:https://www.omniwaresoft.com.tw/elastic/ 

相關文章