鄭州做網(wǎng)站優(yōu)化電話seo基礎(chǔ)入門(mén)
企業(yè)始終面臨著確保 IT 基礎(chǔ)設(shè)施和應(yīng)用程序全年可用的壓力?,F(xiàn)代架構(gòu)(容器、混合云、SOA、微服務(wù)等)的復(fù)雜性不斷增長(zhǎng),產(chǎn)生大量難以管理的日志。我們需要智能應(yīng)用程序性能管理 (APM) 和可觀察性工具來(lái)實(shí)現(xiàn)卓越生產(chǎn)并滿足可用性和正常運(yùn)行時(shí)間目標(biāo)。其中包括分析應(yīng)用程序運(yùn)行狀況、性能和用戶(hù)體驗(yàn)。采用機(jī)器學(xué)習(xí)技術(shù)來(lái)識(shí)別異常和行為模式將有助于及早發(fā)現(xiàn)根本原因并滿足客戶(hù)服務(wù)級(jí)別協(xié)議 (SLA)。
APM和可觀察性工具市場(chǎng)無(wú)疑是火熱的。這些工具攝取多個(gè)遙測(cè)數(shù)據(jù)源,并且是強(qiáng)大的分析平臺(tái),提供對(duì)應(yīng)用程序和基礎(chǔ)設(shè)施健康狀況(包括系統(tǒng)性能)的重要見(jiàn)解。采用可觀察性的軟件開(kāi)發(fā)團(tuán)隊(duì)能夠更好地迭代發(fā)布他們的應(yīng)用程序代碼。根據(jù)“MarketsandMarkets”的研究,可觀測(cè)工具和平臺(tái)的市場(chǎng)規(guī)模預(yù)計(jì)將從 2023 年的 24 億美元增長(zhǎng)到 2028 年的 4 億美元以上,復(fù)合年增長(zhǎng)率 (CAGR) 為 11.7%。
什么是可觀察性?
可觀察性是指收集有關(guān)分布式應(yīng)用程序、基礎(chǔ)設(shè)施以及其內(nèi)部和外部組件和服務(wù)之間的通信的數(shù)據(jù)的能力,使團(tuán)隊(duì)能夠勤奮地調(diào)試他們的系統(tǒng)。它使站點(diǎn)可靠性工程 (SRE)、軟件工程和運(yùn)營(yíng)團(tuán)隊(duì)能夠分析客戶(hù)影響并對(duì)服務(wù)中斷進(jìn)行分類(lèi)??捎^察性和監(jiān)控有時(shí)可以互換使用??捎^察性(主動(dòng))使數(shù)據(jù)可訪問(wèn),并允許您提出任何系統(tǒng)問(wèn)題以更深入地了解代碼的行為方式。監(jiān)控(反應(yīng)式)是收集和顯示數(shù)據(jù)以及確定系統(tǒng)整體狀態(tài)的能力的任務(wù)。
可觀察性可以進(jìn)一步細(xì)分為三個(gè)關(guān)鍵支柱:日志、跟蹤和指標(biāo),這對(duì)于 SRE 可觀察性至關(guān)重要。
? 日志幫助我們?cè)\斷問(wèn)題并告訴我們問(wèn)題發(fā)生的原因。
? 跟蹤幫助我們隔離問(wèn)題并告訴我們問(wèn)題發(fā)生的位置。
? 指標(biāo)幫助我們發(fā)現(xiàn)問(wèn)題并告訴我們發(fā)生了什么。
市場(chǎng)工具、能力和挑戰(zhàn)
Gartner 的 APM 和可觀察性魔力象限已識(shí)別出 20 多個(gè)提供 APM 和可觀察性功能的供應(yīng)商產(chǎn)品,包括自托管、供應(yīng)商管理或 SaaS 部署。這些產(chǎn)品提供多種功能,包括應(yīng)用程序性能指標(biāo)、事件監(jiān)控和警報(bào)、可追溯性、異常檢測(cè)和漏洞等。
企業(yè)業(yè)務(wù)應(yīng)用程序包括自主開(kāi)發(fā)的應(yīng)用程序(例如.NET、Java、Python、SQL、NoSQL DB 等)、第三方/現(xiàn)成產(chǎn)品(例如 Salesforce、HubSpot 等)和集成(例如 Stripe、PayPal 等)。自行開(kāi)發(fā)的應(yīng)用程序托管在本地?cái)?shù)據(jù)中心或由 AWS、GCP 或 Azure 等云供應(yīng)商托管。現(xiàn)成的產(chǎn)品基于 SaaS 或通過(guò) API 集成。高度分布式的應(yīng)用程序跨越數(shù)十個(gè)和數(shù)百個(gè)節(jié)點(diǎn)、服務(wù)和實(shí)例。
? 工具過(guò)多:企業(yè)應(yīng)用程序使用各種工具來(lái)監(jiān)控應(yīng)用程序運(yùn)行狀況和性能(例如New Relic、Data Dog 等)、錯(cuò)誤日志記錄(例如Splunk)以及云供應(yīng)商提供的工具(例如CloudWatch)。這些產(chǎn)品在功能上重疊,維護(hù)和管理這些工具(采購(gòu)、學(xué)習(xí)曲線等)可能很麻煩。
? 不可預(yù)測(cè)的數(shù)據(jù)量:想象一下根據(jù)應(yīng)用程序流量、使用情況、對(duì)外部產(chǎn)品的依賴(lài)性等收集的可觀察性數(shù)據(jù)(日志、跟蹤、指標(biāo))的數(shù)量。整合這些數(shù)據(jù)源所需的數(shù)據(jù)存儲(chǔ)量可能會(huì)快速增長(zhǎng)。控制。
? 定價(jià)復(fù)雜:這些供應(yīng)商產(chǎn)品還提供不同的定價(jià)模型,例如按主機(jī)收費(fèi)(例如Splunk、Data Dog、Dynatrace)、按用戶(hù)收費(fèi)(例如New Relic)、按攝取收費(fèi)(例如SumoLogic、AppDynamics)。定價(jià)模型的復(fù)雜性使得比較供應(yīng)商之間的總擁有成本 (TCO) 并確定適合您的要求和預(yù)算的正確工具具有挑戰(zhàn)性。
為什么選擇開(kāi)源可觀測(cè)平臺(tái)?
基于開(kāi)源的可觀測(cè)性工具旨在提供一種標(biāo)準(zhǔn)的、與供應(yīng)商無(wú)關(guān)的方法,用于攝取、轉(zhuǎn)換數(shù)據(jù)并將數(shù)據(jù)發(fā)送到可觀測(cè)性后端。開(kāi)源可觀察性工具可以作為節(jié)省許可成本的替代方案,并將多個(gè) APM 工具與適合您的要求和預(yù)算的工具整合在一起。
但是,維護(hù)開(kāi)源系統(tǒng)可能需要付出努力來(lái)設(shè)置和維護(hù),并且會(huì)增加您的初始運(yùn)營(yíng)成本。但從長(zhǎng)遠(yuǎn)來(lái)看,您將節(jié)省許可費(fèi)用并避免供應(yīng)商鎖定和合同協(xié)議。
Gartner 預(yù)測(cè),到 2025 年,70% 的新云原生應(yīng)用監(jiān)控將使用開(kāi)源工具而不是特定于供應(yīng)商的代理來(lái)提高互操作性,并且 70% 的新云原生應(yīng)用將采用 OpenTelemetry 來(lái)實(shí)現(xiàn)可觀察性而不是供應(yīng)商。特定代理和軟件開(kāi)發(fā)工具包 (SDK)。
使用開(kāi)源生態(tài)系統(tǒng)擴(kuò)展可觀測(cè)性
可觀察性的開(kāi)源格局非常動(dòng)態(tài)。有多個(gè)云原生計(jì)算基金會(huì) (CNCF) 開(kāi)源工具用于可觀察和監(jiān)控。這篇文章將主要關(guān)注 OpenTelemetry 框架和 LGTM 技術(shù)堆棧。
OpenTelemetry:
上述“工具太多”的挑戰(zhàn)給遙測(cè)數(shù)據(jù)收集帶來(lái)了新的挑戰(zhàn)。每個(gè)工具供應(yīng)商都有自己的 API、SDK、日志、指標(biāo)和跟蹤代理和收集器。我們需要使用 OpenTelemetry 框架的統(tǒng)一遙測(cè)收集來(lái)創(chuàng)建和管理遙測(cè)數(shù)據(jù),例如日志、跟蹤和指標(biāo)。
CNCF 贊助的 OTEL 項(xiàng)目提供了一套統(tǒng)一的與供應(yīng)商無(wú)關(guān)的 API、SDK 和工具,用于生成和收集遙測(cè)數(shù)據(jù)并將其導(dǎo)出到各種分析工具。您可以獲得每種編程語(yǔ)言的一個(gè) API 和 SDK 來(lái)提取應(yīng)用程序的可觀測(cè)性數(shù)據(jù)、一個(gè)標(biāo)準(zhǔn)收集器、一個(gè)傳輸協(xié)議 (OTLP) 等。
LGTM:
最流行的基于開(kāi)源的可觀測(cè)性和監(jiān)控是使用 LGTM 技術(shù)堆棧實(shí)現(xiàn)的。
在LGTM 堆棧中,我們利用:
? Loki 用于日志聚合
? Grafana 儀表板用于遙測(cè)可視化
? Tempo(或 Jaeger)用于跟蹤聚合
? 托管 Prometheus 用于指標(biāo)聚合
結(jié)論
可觀察性是指整個(gè)系統(tǒng)的完整可見(jiàn)性以及將業(yè)務(wù)指標(biāo)與技術(shù)數(shù)據(jù)聯(lián)系起來(lái)。監(jiān)控是為了了解事情是否正常工作,而 AIOps 是為了從這種可見(jiàn)性中獲取意義??捎^察性和監(jiān)控對(duì)于確保應(yīng)用程序順利運(yùn)行并滿足客戶(hù) SLA 至關(guān)重要??傊?#xff0c;通過(guò)投資開(kāi)源 OTel 框架和 LGTM 工具,SRE 團(tuán)隊(duì)可以有效監(jiān)控其應(yīng)用程序并深入了解系統(tǒng)行為和潛在問(wèn)題。這些工具提供成本效益和定制以滿足特定要求。它促進(jìn)供應(yīng)商中立,這對(duì)于避免供應(yīng)商鎖定至關(guān)重要。