夜先锋av资源网站,国产精品极品美女在线观看免,欧美亚洲精品电影在线观看,日韩在线精品强乱一区二区三区

首頁 資訊 > 資訊 > 正文

火山引擎云平臺前端穩(wěn)定性建設(shè)實踐

近日,在??WOT全球技術(shù)創(chuàng)新大會2023“大前端最佳實踐”??分論壇上,火山引擎云平臺前端負(fù)責(zé)人蔣雷分享了主題為“火山引擎云平臺前端穩(wěn)定性建設(shè)實踐”的演講。此次分享以火山引擎云平臺為例,從業(yè)務(wù)端切入,通過介紹前端穩(wěn)定性對云平臺的重要性,探討了前端穩(wěn)定性建設(shè)的目標(biāo)、整體思路、建設(shè)流程及評價體系,分享了前端穩(wěn)定性建設(shè)過程中面臨的挑戰(zhàn)和難點,以及利用新技術(shù)和工具來提高前端穩(wěn)定性的方法。


(資料圖)

近日,在WOT全球技術(shù)創(chuàng)新大會2023“大前端最佳實踐”分論壇上,火山引擎云平臺前端負(fù)責(zé)人蔣雷分享了主題為“火山引擎云平臺前端穩(wěn)定性建設(shè)實踐”的演講。

此次分享以火山引擎云平臺為例,從業(yè)務(wù)端切入,通過介紹前端穩(wěn)定性對云平臺的重要性,探討了前端穩(wěn)定性建設(shè)的目標(biāo)、整體思路、建設(shè)流程及評價體系,分享了前端穩(wěn)定性建設(shè)過程中面臨的挑戰(zhàn)和難點,以及利用新技術(shù)和工具來提高前端穩(wěn)定性的方法。

火山引擎是字節(jié)跳動旗下的云服務(wù)平臺。云平臺是一個多邊平臺,可以為多個不同角色用戶提供服務(wù),它不僅為客戶服務(wù),還為包括財務(wù)、稅務(wù)、法務(wù)的火山引擎內(nèi)部運營,以及外部生態(tài)合作伙伴服務(wù)。因此,對于云計算平臺而言,穩(wěn)定性建設(shè)至關(guān)重要。蔣雷表示,在云計算業(yè)務(wù)中,官網(wǎng)和控制臺距離客戶最近,用戶與云平臺和云產(chǎn)品控制臺的交互幾乎都發(fā)生在前端,前端穩(wěn)定性對于整個云平臺的可用性和客戶體驗至關(guān)重要。

一、火山引擎云平臺穩(wěn)定性建設(shè)的整體思路

火山引擎云平臺業(yè)務(wù)的穩(wěn)定性建設(shè)就像下一盤棋,而行棋的最高原則就是火山引擎整體的穩(wěn)定性建設(shè)。其中,云平臺的穩(wěn)定性作為火山引擎整體穩(wěn)定性范疇的關(guān)鍵部分也不可小覷。

由于云平臺業(yè)務(wù)多邊性的特點,云平臺穩(wěn)定性建設(shè)的第一要義便是保證云產(chǎn)品服務(wù)的穩(wěn)定性,提升MTBF(平均無故障運行時間),降低MTTR(平均故障修復(fù)時間),保證云業(yè)務(wù)安全、可靠、高效地運行。

云平臺行業(yè)SRE實踐可以細(xì)分為Pre-MTBF、MTTI(發(fā)生故障到故障被識別的平均時間)、MTTK(發(fā)生故障到了解故障根因的平均時間)、MTTF(故障出現(xiàn)后的平均解決時間)、MTTV(故障修復(fù)完成后重新驗證系統(tǒng)正常運行所需的平均時間)、Post-MTBF等環(huán)節(jié),為了保證云平臺運行的穩(wěn)定性,火山引擎云平臺前端團隊采用了以下措施進行維護:

在事故發(fā)生前,通過故障演練、容量評估、自動化測試等方式,進行故障預(yù)防;當(dāng)事故發(fā)生后,利用監(jiān)控告警、客戶反饋、輿情感知等工具發(fā)現(xiàn)故障,通過日志分析、鏈路跟蹤、根因定位等方式進行故障定位,再采取容災(zāi)切換、服務(wù)降級、服務(wù)限流、異常熔斷等措施進行故障恢復(fù);當(dāng)然,故障恢復(fù)之后,故障復(fù)盤、改進驗收以及故障模擬等環(huán)節(jié)也是必不可少的。

此外,火山引擎云平臺依照行業(yè)SRE實踐進行前端穩(wěn)定性維護的同時,還進一步精進了企業(yè)內(nèi)部的云平臺維護方法論。

一是文化建設(shè),由于工作人員的意識在云平臺穩(wěn)定性建設(shè)中起著重要作用,火山引擎內(nèi)部開展了一系列培養(yǎng)工作人員穩(wěn)定性意識的工作,包括穩(wěn)定意識建設(shè)的月會、培訓(xùn)、考試、復(fù)盤等。這些工作的實行有效地提高了工作人員對故障預(yù)防的積極性與主動性,從而有效增加了云平臺無故障運行時間。

二是通過控制操作管理流程來提升MTBF,降低MTTR,比如事故前的預(yù)防流程,包括變更的規(guī)范、事故演練的規(guī)范;事故中的管控,比如發(fā)現(xiàn)故障后的處理方法,事故的及時定位等;事故后的治理,復(fù)盤要遵循的規(guī)范等。

二、火山引擎云平臺前端穩(wěn)定性具體實踐

前端是云平臺與客戶直接的接觸點,客戶對操作類故障的感知更加明顯,也更容易發(fā)現(xiàn)體驗類的問題,因此前端反饋的信息更能代表客戶的真實體驗。此外,前端幾乎覆蓋全部的用戶場景和終端場景,但在測試的過程中又會遇到非必現(xiàn)問題等特殊情況,使得前端復(fù)現(xiàn)路徑成為難點。

火山引擎云平臺前端團隊通過建立前端底層技術(shù)基座,接入統(tǒng)一的渲染、頁面托管服務(wù),從而解決前端建設(shè)多站點、多域名、多語言以及多客戶端支持的問題。在向上涉及到業(yè)務(wù)層面時,也能解決業(yè)務(wù)統(tǒng)一埋點的問題。此外,在統(tǒng)一的架構(gòu)基礎(chǔ)上,火山引擎云平臺前端團隊還建設(shè)了統(tǒng)一的監(jiān)控告警和性能體驗,多方位保障前端業(yè)務(wù)的穩(wěn)定運行。

此外,火山引擎云平臺前端團隊還精心設(shè)計前端的服務(wù)架構(gòu)。當(dāng)用戶在瀏覽器發(fā)起請求時,靜態(tài)資源會直接請求CDN,動態(tài)資源會直接請求DCDN。根據(jù)前端頁面的渲染方式不同,請求不同的后端服務(wù)層,再進一步對接下游服務(wù),從而在架構(gòu)設(shè)計上促進前端業(yè)務(wù)平穩(wěn)運行。

官網(wǎng)的穩(wěn)定性建設(shè)

云計算官網(wǎng)是觸達(dá)云計算客戶,以及完成客戶轉(zhuǎn)化的主要平臺。其中包括產(chǎn)品介紹頁面、活動營銷等功能,但同時也會有一些強依賴后端的業(yè)務(wù),比如搜索、文檔、產(chǎn)品體驗等。

火山引擎云平臺前端團隊從前端接入層、服務(wù)層、數(shù)據(jù)層、基建層各方面協(xié)調(diào)布局,從官網(wǎng)服務(wù)面和管理面雙管齊下,推進服務(wù)穩(wěn)定性監(jiān)控、網(wǎng)絡(luò)鏈路治理、頁面穩(wěn)定性治理。通過接入APM和TLS服務(wù),建立前端服務(wù)的監(jiān)控體系,實現(xiàn)頁面請求、渲染、JS、黑白屏等指標(biāo)和異常的上報功能,并使用自定義事件來補充定制業(yè)務(wù)指標(biāo)的上報功能,使用自動化歸因工具來輔助研發(fā)人員排查定位告警問題,告知錯誤信息(觸發(fā)的用戶環(huán)境、URL、發(fā)布版本、狀態(tài)碼,堆棧信息等)。此外,通過頁面代碼巡檢根據(jù)特征匹配防止上線時出現(xiàn)錯誤,利用E2E巡檢進行通用CV監(jiān)控、白屏檢測等有效降低官網(wǎng)頁面MTTR,提升用戶體驗。

火山引擎控制臺穩(wěn)定性建設(shè)

火山引擎云控制臺主要分為三部分,分別是客戶側(cè)、云控制臺、云產(chǎn)品??蛻粼谑褂迷飘a(chǎn)品時,首先會涉及火山引擎控制臺的基礎(chǔ)功能,例如賬號注冊、登錄、賬單查詢等。其次是依托IaaS、PaaS、SaaS等云控制平臺而運行的各種云產(chǎn)品。讓云產(chǎn)品通過平臺對外進行服務(wù),并且保證云產(chǎn)品的穩(wěn)定性,是火山引擎控制臺穩(wěn)定性建設(shè)中非常重要的話題。

火山引擎控制臺前端團隊為各云產(chǎn)品提供了前端頁面服務(wù)接入和托管的方案。在前端BFF場景中,主要使用三個內(nèi)部工具進行全鏈路穩(wěn)定性監(jiān)控和治理。其中,Rhino用于壓測,ByteHAS用來進行故障注入,Argos則是服務(wù)監(jiān)控告警平臺。通過這些工具,可以幫助團隊快速定位問題、驗證評估方案并監(jiān)控服務(wù)狀態(tài),從而提高系統(tǒng)可靠性。

隨著業(yè)務(wù)不斷發(fā)展,BFF服務(wù)規(guī)模和復(fù)雜程度越來越高,服務(wù)間調(diào)用鏈路也越來越長。因此,維護BFF層的穩(wěn)定性就變得至關(guān)重要。為此,火山引擎云平臺前端團隊從確定監(jiān)控指標(biāo)、監(jiān)控可行性驗證、實施監(jiān)控方案到分析結(jié)果、改進優(yōu)化,不斷精細(xì)化BFF 穩(wěn)定性評估指標(biāo)類型,并制定了全方位的BFF層穩(wěn)定性建設(shè)方案,不斷推進火山引擎穩(wěn)定性建設(shè)的可操作性和科學(xué)性。

此外,所有云產(chǎn)品的控制臺都需要火山引擎云平臺前端團隊提供服務(wù),比如頁面通用的頂部導(dǎo)航、側(cè)邊欄以及Web SDK功能。其中,Web SDK的接入使得所有控制臺頁面、云產(chǎn)品頁面具備了異常監(jiān)控的能力。火山引擎云平臺前端團隊基于此來進行頁面的資源檢測、HTTP的Error監(jiān)控、白屏檢測等統(tǒng)一的前端情況監(jiān)控以及數(shù)據(jù)收集工作。再將數(shù)據(jù)匯總到Slardar平臺,由Slardar平臺判斷性能分析的情況以及是否進行告警。Slardar平臺一旦分析出異常情況就會立即發(fā)出告警,再經(jīng)由團隊內(nèi)部嚴(yán)謹(jǐn)?shù)墓芸亓鞒踢M行告警處理。

火山引擎云平臺前端團隊在進行前端穩(wěn)定性維護時,利用先進的監(jiān)控管理工具,采納周密嚴(yán)謹(jǐn)?shù)氖鹿暑A(yù)防和解決流程,不僅注重團隊技術(shù)上的專業(yè)性,也從未忽視意識上的能動性,前端架構(gòu)和團隊文化兩手抓,形成了一套專業(yè)、具體、可操作性強的前端穩(wěn)定性建設(shè)方法論,火山引擎云平臺前端團隊的前端穩(wěn)定性建設(shè)實踐也成為眾多前端工程師學(xué)習(xí)的范本。

本文整理自火山引擎云平臺前端負(fù)責(zé)人蔣雷在WOT2023大會上的主題分享,更多精彩內(nèi)容及現(xiàn)場PPT,請關(guān)注《清一色技術(shù)棧》公眾號,發(fā)消息【W(wǎng)OT2023PPT】即可直接領(lǐng)取。

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團隊 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - www.ossf.org.cn All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號-3