大家好,我是阿里云云原生 ARMS 產品經理徐葛,今天給大家帶來可觀測系列課程的第三節課 -《業務&數字化體驗管理場景解讀》。本文主要分為三部分,第一部分是數字化體驗的必要性,從數字化體驗管理對業務的影響和數字化體驗管理對企業的價值兩個方面來介紹其必要性;第二部分,ARMS 在數字化體驗管理上的產品能力介紹;第三部分,結合客戶案例進行最佳實踐分享。
數字化體驗管理的必要性
為什麼我們需要數字化體驗管理呢?國外調研報告顯示,70% 使用者反饋網頁開啟速度會直接影響使用者在線上網站進行購物的意願。亞馬遜也發現網站載入速度每增加 100 毫秒,整體銷售額將減少 1%。 總的來看,使用者體驗將會直接影響到業務表現。那麼數字化體驗對於企業來說,會帶來哪些價值?我們認為數字化體驗的價值體現在三個方面:
第一個就是量化,相信大家都可能聽過一句話 --「如果說你不能夠量化它,你也沒辦法最佳化它」因此,把主觀的使用者體驗量化成具體指標,同時提供視覺化的分析能力,來幫助企業瞭解整體使用者終端的體驗水平與存在的問題。同時除了能夠量化我們自身產品的使用者體驗指標,我們也可以獲得所在行業的基準指標,甚至是競品體驗指標。有了量化資料,我們可以透過數字化體驗工具實現對資料的洞察與利用。比如說,對可用性和頁面效能的問題定位,對問題影響面的定界,去分析這個問題到底是地域問題、運營商問題,還是說裝置問題造成的。最後,有了這些洞察結論以後,ARMS 使用者體驗互動工具也會對體驗問題提供最佳化建議,幫助我們去針對性的修復問題。更快的發現問題,減少業務影響,同時降低整體故障修復時間。
由於數字化體驗對企業來說是如此重要, ARMS 在數字化體驗場景提供了比較全方位的工具,針對數字化體驗一般有兩種方式,一種叫合成觀測,我們比較熟知的概念叫撥測。另外一種叫真實流量觀測。針對於合成 ARMS 這邊提供了雲撥測產品,針對於真實流量,ARMS 這邊提供了前端效能分析與 APP 效能分析兩款產品。
簡單來說,雲撥測就是透過預先建設好的不同地區、不同運營商、不同裝置和不同型別的檢測點,對目標網址進行主動式模擬訪問,獲知可用性以及效能相關指標。同時,得益於雲撥測的黑盒模式,還可以對競品的體驗指標進行採集和分析。在真實流量觀測方面,ARMS 分為針對於 web 的前端效能分析和針對於 APP 的效能分析。針對 web 前端觀測,ARMS 支援對網站、H5、小程式進行管理,第一是提供運營相關的分析能力,包括 PV/UV 等資料以及頁面效能相關的分析,另外還可以針對於 API 請求結合 ARMS 應用效能分析提供端到端的鏈路關聯分析能力。在移動端上,APP 效能分析可針對於 iOS 應用和 Android 應用實現崩潰分析、效能分析、遠端日誌拉取,以及不同裝置、不同運營商、不同網路的多維分析能力。
那麼這兩者有什麼區別,它們分別適合於哪些場景呢?這裡簡單總結一下:
首先,從流量角度來看,雲撥測其實不是真實流量,它是模擬訪問流量。前端效能分析和 APP 效能分析基於真實流量進行效能分析,所以,從這裡可以看出雲撥測不需要流量,也能實現對網站或 API 介面進行效能管理。前端效能分析與 APP 效能分析,需要有真實流量才能夠實現數字化體驗管理。
其次,從形式上看,雲撥測是主動手段,它會主動對網站或者是 APP 的提供商進行訪問,更快、更早的發現體驗或其他相關問題,能夠在使用者之前去解決和修復這些問題。前端效能分析與 APP 效能分析更多的是被動式手段,有了使用者訪問流量以後,才能夠獲知相關指標,從而實現對應分析。
最後,從資料量來看,雲撥測訪問頻率和訪問次數都是能夠設定好,事先可控的,資料量相對來說較少。而前端效能分析和 APP 效能分析,因為採集的是真實流量資料,所以網站及 APP 上的互動事件都會產生對應指標、日誌,這都將產生大量資料。
總結來看,雲撥測更多適用於獲取基準體驗指標,例如某地區如果沒有使用者流量的話,透過雲撥測對網站進行撥測,獲知這個地區整體性體驗指標。同時,還可以對行業競爭對手網站進行撥測,獲取到行業基準體驗指標。而前端效能分析和 APP 效能分析由於基於真實流量,獲取的都是網站或者 APP 的真實體驗指標。比如針對某新版本釋出以後,驗證整體體驗是否達到了預期效果。另外,雲撥測適合診斷及短期關注的體驗問題,前端效能分析和 APP 效能分析適合長期跟蹤 APP 或網站效能,並識別出潛在問題。也就是說雲撥測能夠幫助我們回答的是已知問題的答案,比如說這個網站到底是可不可用?但是沒辦法回答潛在的問題,也就是說當你還不知道問題出在哪裡的時候,這種場景比較適合真實流量效能分析。
所以,在數字化體驗管理場景下,兩者進行結合才能夠為企業提供全方位數字化體驗管理。
ARMS 數字化體驗管理產品能力介紹
接下來,我們針對雲撥測、前端效能分析、APP 效能分析分別講解其核心能力。 概括來說,雲撥測就是透過部署在全球各地的觀測點去儘量模擬真實使用者,從全球各地區訪問目標網站或者 APP 掌握其可用性和效能。
雲撥測具備以下優勢:
- 分佈於全球的海量檢測點,既有 IDC 機房檢測點,也有網民 LasMile 檢測點。
- 相對於應用效能分析,既不需要專業技能,也不需要嵌碼,是一種非侵入式的手段,對網站進行撥測時,不需要研發配合,三分鐘就可以完成撥測配置。
- 作為主動式手段,7×24小時和分鐘級別的測試,先於使用者發現問題。
- 雲撥測具備多種檢測模型,包括可用性分析、網頁效能分析、DNS劫持分析、CDN質量效能分析。
首先介紹一下可用性效能分析。對於數字化體驗管理來說,可用性效能分析是首先需要解決的體驗管理問題,有了可用性以後,才能講後面的訪問效能以及錯誤、異常相關分析。對於雲撥測來說,可以選取不同地區、不同運營商的觀測點,對網站進行主動式訪問,把成功的訪問標記為一次有效訪問,透過有效訪問除以總觀測次數,可以得到網站的具體可用率。對於可用性,我們也提供長期趨勢分析;另外也提供下鑽能力,針對於某一次撥測,具體瞭解這一次撥測的訪問詳情,來幫助我們去定位到具體造成可行性問題的關鍵點。
第二個場景就是效能觀測。雲撥測效能觀測可以分為三個方面,第一是針對網頁效能,包括首屏用時、100K 耗時,以及網路層的 DNS 用時、TCP 用時、下載用時、SSL 握手用時以及阻塞用時;第二是針對網路效能,網路效能主要體現在時延和 DNS 查詢用時上;最後,針對檔案傳輸,雲撥測可以掌握到檔案平均傳輸速度以及首包用時等指標,對需要檔案傳輸的場景進行效能觀測。
第三個場景就是劫持分析場景,雲撥測針對於常見劫持型別,包括 DNS 劫持、流量劫持和元素劫持進行劫持分析。另外,雲撥測可以針對於 DNS 和 CDN 質量進行檢測,包括對 DNS 解析策略及各個主機節點的效能狀況進行實時分析,並根據分析結果來對 DNS 解析策略進行調整。
雲撥測還能在進行 CDN 選型時對 CDN 提供商的服務質量進行評估,輔助進行選型決策。在採購 CDN 服務以後,也可透過雲撥測持續對 CDN 進行檢測,獲取到 CDN 解析的檢測資料,來對 CDN 排程策略進行調優。
最後,由於雲撥測的主動式黑盒能力,還可以實現競品分析。針對於行業裡競爭對手的網站發起主動式撥測,獲知體驗性相關指標,指導自身網站最佳化,促使我們在競爭中處於相對比較有利的位置。
接下來我們講一下 ARMS 在真實數字化體驗管理上的產品能力,主要包括前端效能分析和 APP 效能分析。前端效能分析和 APP 效能分析都是基於真實流量的訪問資料,面向不同終端的數字化體驗管理工具,可以從頁面效能、錯誤和異常分析、網路請求等多角度對數字化體驗進行分析,同時提供地域、裝置、網路運營商等多維的分析能力。
ARMS 的真實數字化體驗管理產品具備以下幾個特點:
一、相容多平臺,支援 web、H5、小程式。常見平臺像微信、支付寶、釘釘還有小程式都支援。同時它在 APP 上支援 iOS 和安卓等多種使用者終端。
二、結合ARMS應用效能分析和鏈路追蹤,能夠實現端到端的分析,可以將一個頁面的API請求與後端的呼叫鏈進行關聯,實現端到端的效能分析和問題定位。
三、接入簡單,無需埋點,也支援多種接入方式。
四、除了分析能力,也提供線上診斷能力,來輔助定位到問題的根因。
前端效能分析第一個要講到的能力就是 ARMS 端對端的效能分析,我們既可以在 ARMS 前端效能分析裡面透過多個維度,比如說版本、作業系統、裝置、瀏覽器、地域和網路等多種維度對 API 效能進行分析,還可以與應用效能分析進行聯動,實現端到端的呼叫分析,幫助使用者定位到造成 API 請求錯慢的具體應用和程式碼。
第二個能力就是前端效能分析多維分析的能力。支援從地理維度、終端維度包括瀏覽器、裝置、作業系統、解析度、網路等維度對效能指標進行分析。能夠在一些場景下定位到具體出現問題的維度,是裝置問題、地域問題,還是網路問題,為業務決策提供資料支撐。
最後,就是前端效能分析的 JS 錯誤分析能力。ARMS 從不同維度去統計 JS 錯誤數、錯誤率,以及這個錯誤對業務的影響,輔助我們進行業務決策。
針對 APP 的數字化體驗管理產品,這裡也簡單介紹一下。
首先是 APP 穩定性相關分析,ARMS APP 效能分析,針對於穩定性問題分為三個型別。第一是崩潰分析,包括 crash 和 aboard;第二是異常分析,我們會主動去發現你的異常,包括記憶體洩漏,主執行緒 IO 的這種異常;另外,在穩定性的這方面,我們也會支援多維的分析能力,包括具體是哪個版本,哪個裝置,哪個運營商,哪個地域,哪個網路,統計出不同維度的佔比,能夠幫助我們去確定根因和影響面。同時,支援穩定性問題的明細下鑽,幫助我們定位到具體的原因。
其次是 API 的效能分析能力,可以結合 ARMS 應用效能分析實現端到端的網路效能分析。除了統計出 APP 端的網路效能以外,還可以一鍵關聯到後端的應用呼叫鏈路,實現快速定位到造成這種慢呼叫的具體是哪個微服務或元件,甚至是哪行程式碼。
最後講一下 APP 效能分析遠端日誌拉取能力。針對於這種日誌,ARMS 的 APP 效能分析相對輕量,無需進行埋點或採集,或接入全文的搜尋系統,只要整合 APP 的 SDK,ARMS 會按需拉取崩潰日誌,還原出錯現場,快速定位複雜問題。也可以指定裝置、版本、系統,去新建拉取任務,主動拉取使用者 APP 裝置的日誌。同時,也會把當時日誌執行時,機器記憶體、CPU 這種環境拉取出來輔助進行問題定位。除了主動式拉取以外,針對崩潰場景也可以實現智慧拉取,檢測到這種 crash 事件後,自動建立任務,智慧選取裝置,預先獲取到問題裝置的日誌,保留現場,節省問題排查時間。
數字化體驗管理最佳實踐
以上是 ARMS 在數字化體驗管理上的產品能力介紹,最後我們結合幾個客戶案例分享一些最佳實踐。
第一個案例是節卡機器人,節卡機器人是國內智慧機器人制造服務提供商,與全球超過了 300 家自動化的航空公司緊密合作服務全球客戶。節卡機器人為了更好地服務全球客戶,將線上營銷作為重要的市場營銷手段之一,在谷歌上進行了大量海外廣告投放。為了保證線上營銷效果,節卡機器人首先要確保官網落地頁能夠正常訪問。如果頁面或官網出現可用性或效能問題,不但會影響轉化率還可能會造成谷歌停止對他們提供服務。經過與可觀測團隊溝通,節卡機器人決定採用 ARMS 雲撥測對海外官網進行持續性檢測,選取了主要客戶所在地域,包括北美、歐洲、南美洲以及東南亞等地區的網民檢測點,基於瀏覽器的撥測任務,對官網進行持續效能檢測,最後發現兩個問題:
第一,部分地區 CDN 排程不太準確,主要是集中在美東和東南亞地區。CDN 排程並沒有實現最最佳化排程方案。第二,官網存在一些體積較大的圖片檔案,影響網站載入速度。基於這兩個判斷及定位以後,節卡機器人與 CDN 供應商溝通後,全面最佳化美東、東南亞的 CDN 調動邏輯,同時也推動研發團隊對頁面圖片進行壓縮,整體問題修復上線以後,透過雲撥測檢測到網站開啟速度提升了 50%,全面保證了線上營銷效果。
第二個案例是 ARMS 的前端效能分析案例。核桃程式設計作為國內少兒程式設計教育行業的領導者,整體業務量發展非常快。隨著業務發展,系統架構也變得越來越複雜,後端採用的是微服務分散式架構,如何提升分散式系統可觀測性是當時面臨的大問題。
對於線上教育行業來說,使用者體驗是非常重要的。因為使用者體驗會直接決定著品牌形象和轉化率。但由於採用了微服務架構,在一個教學場景下,一個使用者的簡單教學可能會涉及到不同的應用與應用之間的呼叫,甚至還有一些第三方服務介面。所以任何環節出現故障或者線路瓶頸,都可能會影響到使用者體驗。核桃程式設計經過考察了開源方法和企業級方案後,最終決定採用 ARMS 的前端效能分析,同時結合應用效能分析來實現對教學終端的數字化體驗管理。當時打動他們的第一點是前端效能分析的快速接入能力,不需要進行埋點,只需要在客戶前端程式碼中引入一段指令碼,就能夠實現檢測資料上報。第二是結合應用效能分析的端到端效能洞察能力,去快速地定位到問題根因。第三就是多維分析的能力,ARMS 的前端效能分析能夠從地理位置、作業系統、解析度、網路運營商等多個維度對效能進行聚合分析,具體定位到造成效能瓶頸的原因。最後就是 ARMS 的告警能力,在遇到體驗問題時,能夠第一時間讓運維團隊感知。真正實現 5 分鐘內發現問題,10 分鐘內隔離和 30 分鐘內解決。對於核桃程式設計來說,ARMS 的可觀測體系幫助他們減少 30% 以上的運維工作量,同時也縮短了 60% 的故障定位平均耗時,極大的提升了使用者體驗,為業務持續發展打下了堅實的基礎。
以上是針對數字化體驗管理不同產品的使用者案例分享。
作者:徐葛
原文連結:http://click.aliyun.com/m/1000318164/
本文為阿里雲原創內容,未經允許不得轉載。