然後今天話我們給大家分享的內容有四大塊。
1、什麼是使用者行為資料及其重要性
2、如何在公司裡面去搭建採集體系
3、如何規範這個埋點的業務
4、我們常見的工具以其他人的產品有哪些
透過這幾個部分了解到在一箇中大型的公司裡面去完成一個數據平臺,以資料採集體系平臺的搭建這個完整流程,在一個小公司中借用一些開源的工具以及第三方的 SaaS 的服務,能夠進行一個簡單的行為分析平臺的搭建。
01
行為資料及其重要性
比如說今天中午 11: 50 的時候,在這個美團的首頁進行了一個外賣按鈕的點選。那這個時候話美團公司它會記錄到我中午十五十一點五十分在這個美團 APP 的首頁,點選了這個外賣的按鈕,然後會傳一條資訊包含類似截圖右側的格式資料就會發送給這個美團的伺服器。
所以我們在這個不管是 APP 也好,還是比如說這個 APP 或者是我們在網頁上面,我們在家裡面 B 站上看這個 PC 端的影片,這些所有的這個行為話都會被記錄下來。這一些資料就是我們所說的行為資料。
1
基礎名詞解釋
2
行為資料常見的應用場景
1、最簡單的話我們會去做這個公司裡面的產品迭代,然後功能模組使用分析。
2、是說我們做了一個線上的活動,然後使用這一些資料來進行評估。
3、使用使用者的行為資料,去做使用者畫像
4、根據這個使用者的偏好去推薦廣告
這個是使用者的行為資料,它常見的應用的場景這一塊話,相信大家在公司裡面最常見的應該是第一個跟第二個就是我用這個資料去衡量上線的好壞,這個是他的應用場景會有這一些。
02
如何搭建一個埋點採集體系
在整個過程中有三個重要的因素
- 資源
- 人員
- 流程規範
在埋點採集到應用過程中涉及到各個不同角色相互配合,會有各自的分工。
從業務需求方開始。比如說市場運營產品開始提需求,資料產品根據產品對這個業務同學這裡的需求進行評審以後,梳理出這個使用者的業務路徑,然後抽象出場景元件,完成這個指標體系的搭建。輸出埋點的需求文件 DRD 然後我們把這個文件交付給到開發。
開發這裡的話會把埋點需求文件跟產品技術文件一樣,做一個需求的可行性方案優先順序一個評審這個埋點能不能做,這個資料能不能採集,採集採集的量有多大等等
關於埋點需求文件展開一些細節講講
上面這個是一個比較典型的埋點需求文件樣例,包含事件名、屬性資訊、觸發時機、示例等等基礎的埋點資訊,在實際設計埋點需求文件時需要考慮命名的規範、屬性資訊的複用等等。
1
實現方式之--採購第三方產品
目前一般有透過採購和自研 以及採購後增加自研進行
接下來是說我們在工具上面會有兩種實現的路線。第一種我們是基本上有非常多的第三方的資料治理、資料視覺化、資料監測的這種工具。
2
實現方式之--自研產品
第二種以自研為主的實現方式
中間會有幾個關鍵的環節,資料採集、資料儲存(含計算引擎)、資料視覺化
- 資料採集
對行為資料採集部分我們一般封裝為埋點採集的 SDK,然後嵌入到不同的客戶端中。SDK 的作用在於封裝好一些公共的引數資訊、上報方式以及幫助各端開發簡化資料上報的過程。同時也在基礎層面上支援類似視覺化埋點、圈選埋點、全埋點等不同的埋點方式。
- 資料儲存(含計算引擎)
在行為分析領域裡面,現在最熱門的是使用 Clickhouse 做儲存及計算引擎,這個筆者所在公司,每日千億級別的資料增量可以比較高效從容的進行行為資料分析。對於資料並沒有那麼大的公司也可以根據自身情況選擇諸如 Durid、Impala等計算引擎
- 資料視覺化
分析的結果在大部分團隊內部都希望能以可直觀檢視的方式進行展示,包括一些簡單的圖表、資料看板等。這部分如果選擇完全自研的話成本比較高,一般的處理方式有兩種,一種採用開源的圖表元件進行二次開發,例如使用範圍比較廣的 Echarts、AntV 等進行定製化的圖表開發。另外也可以直接在上游的分計算引擎上直接接入傳統意義上的 BI 視覺化產品進行最終資料結果的展示。
這類產品開源和和商用的都比較豐富,國內大多是以敏捷 BI 的Title宣傳,在開源側則可以選擇使用受眾比較多的 Superset和 Metabase,前者功能豐富,後者顏值互動更高。
03
如何規範埋點業務
針對如何規範埋點業務,我們也是從組織和工具兩方面進行,組織層面上我們劃分為業務相關和技術相關,各自都需要一個關鍵對接人。
- 對業務對接人
業務對接人主要是對業務需求的彙總抽象,高效的設計埋點採集事件及公共引數等。提升整體資料採集的可複用性和規範。這個角色也需要一些比較突出的特質 既要有資料相關的基礎,又要業務流程熟悉,能幫助業務產品梳理清楚需要採集的資料內容,檢視的指標範圍。
- 技術對接人
對技術對接人來說,核心職責是能在採集上報層面做到技術高效實現。藉助開源或者自研的埋點採集 SDK 完成資料底層支援。
整個實操過程中需要有相關工具產品的支援
- 埋點管理
在初期階段使用線上表格文件方式進行管理,後期逐步開發穩定的後臺產品並且和埋點分析下游使用資料方的系統打通,方便埋點元資料資訊對接。
- 埋點開發
這塊最簡單的方式就是使用程式碼埋點,比如點選繫結 Onclick 函式上報自定的欄位資訊,進階後使用全埋點、視覺化圈選埋點等方式提升埋點採集效率
- 埋點測試
埋點測試是在開發完了以後需要在測試工具上去做資料的驗證。最原始的就是去做人肉的view, 就是我們拿一個小板凳蹲到開發工位旁邊去看一下這個程式碼,它觸發你看資料,這個對不對?這個是最原始的。另外有Kibana 之類的查詢工具可以協助快速的做埋點日誌的查詢提供簡單的視覺化展示。另外也可以嘗試做自動化測試,自動 mock 資料生成測試報告,版本回歸測試效率都極高。
04
常見的產品和服務
整個環節的話就講完了,然後會有幾個不同的文件跟工具,這個會的話給大家分享一下我們常見的工具跟市面上可以用的開源的產品。
我這邊分了三個型別給大家分享列出來
- 第一個是行為分析的產品
國內外都有很多行為分析產品可以採買,但是每家的擅長點以及費用都略有不同,可以試用一下相關的產品然後決定是否採購
- 第二個是通用的 BI 的工具
這類產品在資料平臺搭建的時候也是非常重要,通常我們在初期會將行為資料和 BI 工具合併在一起進行業務支援,到後期後會拆分出來成為兩條不同的業務產品線。
- 第三個是資料整合服務商
05
總結
總的來說在一個團隊裡面搭建一個埋點採集到應用的體系有多種實現的路徑和方法,並不存在最好,只有在當前階段最合適的方案。選擇合適的方法,再配合適當的運營落地實現動作便可以完成對業務的高效支撐。