網(wǎng)站關(guān)注代碼(網(wǎng)站關(guān)鍵詞在哪設(shè)置)
導(dǎo)讀本文將分享京東在數(shù)據(jù)指標體系構(gòu)建方面的理解和實踐。
包括以下三個部分:
1.如何理解指標體系
2.如何搭建及應(yīng)用指標體系
3.指標體系有效落地的關(guān)鍵保障
分享嘉賓|焦文健 京東 大數(shù)據(jù)產(chǎn)品總監(jiān)
編輯整理|菊
內(nèi)容校對|李瑤
出品社區(qū)|DataFun
01
如何理解指標體系
1.指標和指標體系的基本含義
每個人不管是不是做數(shù)據(jù)的方向,都對指標有一定的理解,或多或少地能夠說出來幾個指標。這是因為指標存在于我們每個人的生活當中。
比如體檢時,會用各種指標描述身體的客觀條件,像身高、體重、血常規(guī)等等,它會告訴你正常范圍是多少,如果有異常,超出閾值,會給一些提示。相應(yīng)的指標體系,就是把身體健康相關(guān)的各種指標整理起來,建立一個完整、客觀、有分類地呈現(xiàn)我們身體健康情況的體系。
在企業(yè)中,指標是通過對數(shù)據(jù)進行采集、分析后得到的一個匯總結(jié)果,是將業(yè)務(wù)單元拆解和量化后的度量值,使得業(yè)務(wù)目標可描述、可度量、可拆解。通過指標能反映出客觀的業(yè)務(wù)表現(xiàn)。
展開全文
指標體系是通過客觀的指標描述和度量對象的性質(zhì)、特征、變化等方面的一種體系化的描述工具。全面和完整只是它的基礎(chǔ),更重要的是業(yè)務(wù)域的理解,對指標的分類、分級和標準化的管理。這個時候就涉及指標體系與下游的數(shù)據(jù)模型層和上游數(shù)據(jù)分析層之間的銜接和聯(lián)動。
2.指標和和標簽的區(qū)別
一般談到指標,大家也會聯(lián)想到標簽。在企業(yè)中,基本上是通過指標和標簽來搭建數(shù)據(jù)的底層基礎(chǔ)。指標和標簽有一些明顯的區(qū)別,清晰地了解兩者之間的差異,才能更好地規(guī)劃指標體系和標簽體系的搭建和應(yīng)用。
指標與標簽的區(qū)別,包括三個方面:
①基本含義
指標是對業(yè)務(wù)過程和業(yè)務(wù)效果的度量。當對指標做分類、歸屬的時候,一般會按照不同的主題進行劃分。比如在電商領(lǐng)域,會劃分成流量、交易、用戶、以及供應(yīng)鏈等業(yè)務(wù)主題。一般是結(jié)合企業(yè)的實際業(yè)務(wù)過程來劃分。
標簽是對實體對象的全面刻畫。如用戶標簽、商品標簽以及在線上場景中各種場域的標簽,分別用來刻畫用戶、商品及各場景的特性。
②加工方式
指標,以統(tǒng)計開發(fā)為主,基于采集的數(shù)據(jù),通過一定的處理邏輯計算出來。
標簽,存在多種加工方式:
統(tǒng)計開發(fā):用來加工統(tǒng)計類標簽。如 RFM,客觀地統(tǒng)計用戶的購買頻次、上一次購買時間、購買金額,以此來描述用戶的粘性和購買力。
人工打標和提報:用來加工事實類標簽。如商品標簽,如商品的屬性、口味、適用人群、尺寸等信息,大部分是來自于商家或運營同學的提報和描述,也常常在使用企業(yè)相關(guān)工具時,用戶自己填報。
算法預(yù)測:用來加工預(yù)測類標簽。如,用戶的購買力、品類偏好標簽,常常通過一些人工智能算法來實現(xiàn)。
統(tǒng)計開發(fā):用來加工統(tǒng)計類標簽。如 RFM,客觀地統(tǒng)計用戶的購買頻次、上一次購買時間、購買金額,以此來描述用戶的粘性和購買力。
人工打標和提報:用來加工事實類標簽。如商品標簽,如商品的屬性、口味、適用人群、尺寸等信息,大部分是來自于商家或運營同學的提報和描述,也常常在使用企業(yè)相關(guān)工具時,用戶自己填報。
算法預(yù)測:用來加工預(yù)測類標簽。如,用戶的購買力、品類偏好標簽,常常通過一些人工智能算法來實現(xiàn)。
③應(yīng)用方向
指標,主要應(yīng)用在分析業(yè)務(wù)過程。如監(jiān)控考核、業(yè)務(wù)的下鉆分析、診斷歸因等方面。
標簽,更多幫助運營實體對象。如用戶標簽用來做用戶精細化運營;商品標簽輔助進行盤貨選品。
3.理解指標體系在數(shù)據(jù)鏈路中的位置和作用
指標體系并不能孤立地發(fā)揮作用,需要理解它在數(shù)據(jù)鏈路中的定位。先把整個數(shù)據(jù)流串起來,然后再進行數(shù)據(jù)挖掘、數(shù)據(jù)分析、數(shù)據(jù)科學等工作。
根據(jù)大數(shù)據(jù)應(yīng)用的不同層次鏈路來抽象,可以把數(shù)據(jù)分為金字塔型一樣的四層,自下而上分別是:
Data 數(shù)據(jù)層:整合數(shù)據(jù)并加以理解;
Information 信息層:從眾多數(shù)據(jù)中發(fā)現(xiàn)信息;
Knowledge 知識層:將多維信息提煉為知識;
Wisdom 洞見層:通過分析,將知識轉(zhuǎn)化為洞見,結(jié)合業(yè)務(wù)對數(shù)據(jù)洞察的結(jié)果,輔助業(yè)務(wù)運營。
Data 數(shù)據(jù)層:整合數(shù)據(jù)并加以理解;
Information 信息層:從眾多數(shù)據(jù)中發(fā)現(xiàn)信息;
Knowledge 知識層:將多維信息提煉為知識;
Wisdom 洞見層:通過分析,將知識轉(zhuǎn)化為洞見,結(jié)合業(yè)務(wù)對數(shù)據(jù)洞察的結(jié)果,輔助業(yè)務(wù)運營。
指標體系對應(yīng)信息層,在數(shù)據(jù)驅(qū)動業(yè)務(wù)提升中,起到承上啟下的作用。它向下牽引底層的數(shù)據(jù)采集和建模,向上支撐甚至是驅(qū)動業(yè)務(wù)的分析體系。
指標體系向下,和數(shù)據(jù)層聯(lián)動,能反推數(shù)倉模型體系的建設(shè),提高數(shù)據(jù)資產(chǎn)的質(zhì)量。
指標體系向上,設(shè)計來自于對業(yè)務(wù)的深入理解,通過劃分業(yè)務(wù)域、主題域來搭建主題模型。
當理解一個指標的口徑時,既需要理解上層業(yè)務(wù)應(yīng)用流程,也需要理解底層的數(shù)據(jù)采集邏輯。在此基礎(chǔ)上,才能夠清晰了解一個數(shù)據(jù)指標是怎么來的,當它有一些波動的時候,才能夠理解其背后的原因。
指標體系建立后,可以客觀地監(jiān)控業(yè)務(wù)的目標和 KPI 是否達成,差距多少。通過大數(shù)據(jù)平臺和可視化平臺的產(chǎn)品矩陣,實現(xiàn)數(shù)據(jù)采集與洞察分析,然后進行業(yè)務(wù)歸因與診斷,分析目標達成情況、判斷差距的原因,并提出改進建議。這就是指標體系對業(yè)務(wù)的推動作用。
4.流量指標體系
業(yè)務(wù)同學,對指標有一些初步的認知,但是往往容易把維度跟指標搞混。以廣告流量場景為例,有很多指標,包括曝光量、點擊量、PV、 UV、訪問量、訂單量、跳出率、轉(zhuǎn)化率、退出率、加載效率等,以及 CPC、 CPM 等廣告效果分析相關(guān)指標。維度用來說明分析對象或分析范圍,比如流量來源、產(chǎn)品大類等,以廣告領(lǐng)域的是否付費、廣告形式、點位形式等。搭建指標體系需要明確維度和指標的區(qū)別,針對指標口徑和維度口徑,分別進行標準化管理。
在流量場景中,數(shù)據(jù)是非常繁雜的,上圖呈現(xiàn)的只是其中的部分內(nèi)容,也還沒有形成指標體系。建立指標體系,首先要對重要指標進行分類、分級,明確當前業(yè)務(wù)中最核心的指標。確定后,做報表或監(jiān)控等應(yīng)用時,建議報告中的指標不要超過 10 個,每個指標需明確背后的業(yè)務(wù)目標。
對于流量指標,從指標定義上分,可以分成原子指標和衍生指標。原子指標就是PV、UV、跳出次數(shù)等,從底層數(shù)據(jù)源中直接匯總計算得來的。衍生指標,是依賴原子指標進行了一些加減乘除等計算形成的,如跳出率、轉(zhuǎn)化率等。
從指標功能上分,包括數(shù)量指標,如 PV、UV、訪次等,從規(guī)?;驍?shù)量角度上描述業(yè)務(wù)的指標。質(zhì)量指標,如跳出率、平均訪問深度、平均停留時間、頁面加載時間等描述一個頁面的表現(xiàn)好壞的業(yè)務(wù)質(zhì)量指標。最關(guān)鍵的是轉(zhuǎn)化類指標,包括引入訂單量、轉(zhuǎn)化率等電商網(wǎng)站關(guān)注的效果類指標。
建立整個指標體系,有幾個原則:
科學性。指標的設(shè)計要嚴謹、有效,測量結(jié)果要具有客觀性和穩(wěn)定性。
完整性。指標體系要能完整地覆蓋整個業(yè)務(wù)過程。比如流量場景中,從數(shù)量、質(zhì)量和轉(zhuǎn)化三個環(huán)節(jié)進行分類,這是一個整體的分析鏈路,覆蓋完整,且能支持從上到下的可拆解、可追溯。結(jié)合維度管理,通過維度間的上下層級關(guān)系,可以向上聚合,也可以向下拆解,從而適應(yīng)不同粒度的管理單元和經(jīng)營單元。
導(dǎo)向性。指標體系在落地時,要能夠支撐業(yè)務(wù)目標和方向,能夠輔助業(yè)務(wù)做決策,判斷重點關(guān)注點以及下一步的工作計劃。
科學性。指標的設(shè)計要嚴謹、有效,測量結(jié)果要具有客觀性和穩(wěn)定性。
完整性。指標體系要能完整地覆蓋整個業(yè)務(wù)過程。比如流量場景中,從數(shù)量、質(zhì)量和轉(zhuǎn)化三個環(huán)節(jié)進行分類,這是一個整體的分析鏈路,覆蓋完整,且能支持從上到下的可拆解、可追溯。結(jié)合維度管理,通過維度間的上下層級關(guān)系,可以向上聚合,也可以向下拆解,從而適應(yīng)不同粒度的管理單元和經(jīng)營單元。
導(dǎo)向性。指標體系在落地時,要能夠支撐業(yè)務(wù)目標和方向,能夠輔助業(yè)務(wù)做決策,判斷重點關(guān)注點以及下一步的工作計劃。
符合這三個原則的指標體系,才是一個比較好的指標體系。
在流量場景,對于移動端的場景,指標內(nèi)容更多更復(fù)雜。指標可以從用戶分析、用戶使用行為、運營分析、應(yīng)用質(zhì)量以及搜索等業(yè)務(wù)場景進行定義。指標體系落地和產(chǎn)生價值,需要對應(yīng)到不同維度上,如內(nèi)容頁面、用戶、終端等維度,這些維度可以進一步細分,如用戶可以從會員級別、新老訪客、地域等不同維度細分。
5.指標體系如何向上支撐業(yè)務(wù)應(yīng)用
指標體系要向上支撐業(yè)務(wù)應(yīng)用,進行數(shù)據(jù)分析時,不能只是單純看指標的數(shù)字和看板,還需要結(jié)合主題場景綜合分析。
上圖是綜合分析的幾個例子。
左上圖表現(xiàn)了在流量場景中,某個頁面的用戶來源和下游去向。它的上一級頁面是從哪些地方來的,哪些頁面引流較多,往下走有哪些去向。
右上圖通過熱力圖的方式,直觀地呈現(xiàn)出每一個頁面上區(qū)域或元素的關(guān)鍵指標,比如,某模塊的引入訂單量、點擊轉(zhuǎn)化率。基于熱力圖,可以判斷這個頁面里哪些位置熱度好,哪些位置有問題,如何及時調(diào)整、優(yōu)化。
下面的圖是常見的漏斗分析,用戶從業(yè)務(wù)鏈路上串聯(lián)下來。
左上圖表現(xiàn)了在流量場景中,某個頁面的用戶來源和下游去向。它的上一級頁面是從哪些地方來的,哪些頁面引流較多,往下走有哪些去向。
右上圖通過熱力圖的方式,直觀地呈現(xiàn)出每一個頁面上區(qū)域或元素的關(guān)鍵指標,比如,某模塊的引入訂單量、點擊轉(zhuǎn)化率?;跓崃D,可以判斷這個頁面里哪些位置熱度好,哪些位置有問題,如何及時調(diào)整、優(yōu)化。
下面的圖是常見的漏斗分析,用戶從業(yè)務(wù)鏈路上串聯(lián)下來。
這些是搭建完指標體系之后,為了進一步支撐業(yè)務(wù)應(yīng)用需要具備的一些分析能力和模型。
指標體系,不能直接只看指標本身,還要從業(yè)務(wù)層去思考,如何更好地指導(dǎo)業(yè)務(wù)做運營。
營銷場景中 AIPL 模型是指標體系支撐精準運營的典型方法論,它是 70 年代營銷管理學提出的。將用戶對于品牌認知的過程,劃分成認知階段、興趣階段、購買階段和忠誠用戶四個階段。最終目標,是用戶盡量多地到達忠誠階段。在認知階段,可以統(tǒng)計人群覆蓋多少用戶,分析如何 push 用戶轉(zhuǎn)變成興趣人群;針對興趣人群,分析如何讓用戶購買,進而轉(zhuǎn)化為購買用戶;針對購買用戶,分析如何讓他更擁護我們的品牌,轉(zhuǎn)化為忠誠用戶。
在大數(shù)據(jù)時代,可以對 AIPL 模型的各個階段進行客觀量化,并基于這套模型,支撐業(yè)務(wù)進行用戶運營,完成業(yè)務(wù)動作。
認知階段。對于有瀏覽行為,但是還沒有搜索購買過的用戶,作為認知階段的人群??梢酝ㄟ^品牌曝光或品牌廣告,面向這些人群進行投放。
興趣階段。統(tǒng)計有關(guān)注行為或搜索行為,甚至是加購行為,但是沒有購買的用戶,作為興趣人群。這些用戶轉(zhuǎn)化概率較高,可以通過投放定向優(yōu)惠券,或傳遞品牌價值,來促進轉(zhuǎn)化。
購買階段。針對有購買行為的用戶,分析如何對他做影響,使他們重復(fù)購買,或者分享產(chǎn)品。
6.理解指標體系背后的數(shù)據(jù)加工邏輯
除了向上支撐業(yè)務(wù)應(yīng)用外,還需要向下深挖,理解指標背后的數(shù)據(jù)加工和采集邏輯,在此基礎(chǔ)上,才能進一步明確指標的口徑和含義。當數(shù)據(jù)出現(xiàn)波動時,才可以快速確認,是數(shù)據(jù)本身的問題,還是業(yè)務(wù)某個環(huán)節(jié)的問題。
以流量場景為例,流量采集的流程如上圖所示,一個網(wǎng)站會有一段前端 JS 代碼,當這個頁面被瀏覽器打開時,會向服務(wù)器端發(fā)送一個請求,這個前端服務(wù)器會把當前頁面上用戶的一些信息(誰,什么時間進入這個頁面,在這個頁面停留了多長時間,以及其它一些描述當前訪客的信息)記錄下來,發(fā)回后端的日志。有些企業(yè)業(yè)務(wù)系統(tǒng)中,會進一步解析日志,用業(yè)務(wù)數(shù)據(jù)庫來記錄相關(guān)信息,并進一步加工流量類的數(shù)據(jù)指標。
下圖是一個具體頁面的例子,打開頁面,里有一段發(fā)往后端服務(wù)器的經(jīng)過加密處理的編碼,解碼后,再進一步的通過$解析,拆分出各個字段,如 PIN(用戶登錄賬號)、用戶的 UUID。
如何計算用戶數(shù)和 UV 呢?對于沒有登錄的用戶,瀏覽器也會根據(jù)規(guī)則生成一個 UID;對于登錄用戶,可以直接使用賬號來計算。在日志中,還會記錄很多其它信息,清洗、解析后變成一張大寬表,可進行結(jié)構(gòu)化表示,如請求時間、訪問 ID、URL、會話編號等。在有了基礎(chǔ)數(shù)據(jù)的大寬表后,就可以進一步地加工指標。如下圖所示,包括 UV、PV、訪次、跳出率等。其中,UV 表示去重后的用戶訪問次數(shù),PV 是指頁面訪問次數(shù)。
02
如何搭建和應(yīng)用指標體系
為了更好地構(gòu)建良好的數(shù)據(jù)指標,需要理解數(shù)據(jù)指標體系的基本含義,需要理解指標體系如何對上層業(yè)務(wù)做支撐與下層數(shù)據(jù)采集、數(shù)據(jù)建模串聯(lián)。對數(shù)據(jù)鏈路有了完整清晰的認識后,下面介紹如何搭建和應(yīng)用數(shù)據(jù)指標體系。
1.指標體系建設(shè)方法- OSM 模型
指標體系的建設(shè)要先從業(yè)務(wù)的目標出發(fā),聚焦業(yè)務(wù)的目標是什么,業(yè)務(wù)過程是怎樣的,實現(xiàn)該目標需要采取的業(yè)務(wù)策略有哪些,然后再定義通過哪些指標和客觀的度量來支撐業(yè)務(wù)目標和業(yè)務(wù)策略,完成業(yè)務(wù)過程。
我們通常使用 OSM 模型來指導(dǎo)指標體系的設(shè)計。它不僅要求從數(shù)據(jù)的角度,定義指標的類型、口徑、看板等;更要求從業(yè)務(wù)的角度,結(jié)合實際業(yè)務(wù)現(xiàn)狀、所處環(huán)節(jié),以及業(yè)務(wù)的目標、策略,通過業(yè)務(wù)過程的拆解,進行指標體系的設(shè)計。
2.提煉能夠描述產(chǎn)品目標的北極星指標
首先,要提煉能夠描述產(chǎn)品目標的北極星指標。北極星指標的選擇有以下幾個原則:
能反映用戶從產(chǎn)品中獲得核心的價值;
能反映用戶的活躍程度;
直觀、可拆解;
能夠為產(chǎn)品或者業(yè)務(wù)的長期的目標奠定基礎(chǔ)。
能反映用戶從產(chǎn)品中獲得核心的價值;
能反映用戶的活躍程度;
直觀、可拆解;
能夠為產(chǎn)品或者業(yè)務(wù)的長期的目標奠定基礎(chǔ)。
比如,彭蕾在支付寶啟動時,確定的北極星指標“兩億三次”,表示一年之內(nèi)達到2億用戶,并且用戶平均使用次數(shù)要超過三次。這是一個非常有牽引性的,面向長期目標的指標。
這個指標,既考慮了用戶覆蓋維度,又考慮了支付場景的特點。對于支付場景,用戶在支付過一次甚至是兩次以后,用戶習慣才能養(yǎng)成。這樣復(fù)合性的指標,考察了規(guī)模和質(zhì)量兩個維度,可以避免單一規(guī)?;蛸|(zhì)量的 KPI 指標使大家從單一維度上去推進業(yè)務(wù),采用短期手段達成目標而忽略長期影響的情況。這是北極星指標和 KPI 的區(qū)別。北極星指標的維度一般在1-3個,超過3個則太多了,也不利于優(yōu)化。
3.基于 OSM 將指標體系與業(yè)務(wù)策略結(jié)合
基于 OSM 模型將指標體系與業(yè)務(wù)策略結(jié)合。我們需要思考為保證業(yè)務(wù)在某方面實現(xiàn)高質(zhì)量增長和提升的業(yè)務(wù)目標,具體的方式和策略是什么?業(yè)務(wù)的工作流是什么?
如在京東物流終端攬收場景中,重點關(guān)注運營的效率和體驗,進一步可以拆解工作流,然后在此基礎(chǔ)上,圍繞著業(yè)務(wù)目標、工作流,再搭建數(shù)據(jù)流。數(shù)據(jù)流可以支撐和反應(yīng)工作流,如指標可以分為效率類指標和體驗類指標兩大維度。對于攬收業(yè)務(wù),指標包應(yīng)攬收量、攬收及時率、取消率、催收率等效率指標,分別對應(yīng)攬收工作流各個環(huán)節(jié)上的表現(xiàn)。在派送業(yè)務(wù)中,關(guān)注的效率手續(xù)費標是到貨量、妥投及時率等。相應(yīng)的,也可以關(guān)注整體上的體驗如何。結(jié)合起來,就構(gòu)成了京東物流在運輸和配送業(yè)務(wù)中的指標體系。
當需要去分析某業(yè)務(wù)場景時,不是直接從指標入手,有哪些指標,用哪些指標。而是從業(yè)務(wù)的目標和流程出發(fā),一步步得到指標體系。
不同的業(yè)務(wù)流程的目標,對應(yīng)的崗位和角色都不太一樣。可以通過不同的策略來實現(xiàn)業(yè)務(wù)目標。在每個環(huán)節(jié),都有對應(yīng)的分析方法,也有各自核心的影響因子。在這些基礎(chǔ)上,可以定義每個環(huán)節(jié)的關(guān)鍵指標,形成指標體系。
4.杜邦分析進行業(yè)務(wù)目標拆解
對業(yè)務(wù)的核心目標做改進,可以對目標做杜邦分析進行拆解。如毛利,可以進行如上圖所示的公式化拆解。
毛利=銷售額*毛利率-營銷費用;
銷售額=訂單量*客單價
毛利率=單價/成本-1
訂單量=轉(zhuǎn)化率*訪次,或轉(zhuǎn)化率*uv
轉(zhuǎn)化率可以拆解成類目轉(zhuǎn)化率、搜索轉(zhuǎn)化率、促銷轉(zhuǎn)化率等。不同的轉(zhuǎn)化率決定了業(yè)務(wù)運營的不同方向。
整個指標體系可以匹配到實際的業(yè)務(wù)運營流程和操作上。對于 UV 或者是客單價這個維度,涉及一些用戶細分、運營的策略;對于單價和成本維度,對應(yīng)到成本控制上,在采購的環(huán)節(jié)應(yīng)該怎么去做。如果需要降營銷費用來提升毛利,就要從渠道及站內(nèi)資源位,以及優(yōu)惠券的使用,來進行優(yōu)化。
上面講了從業(yè)務(wù)目標,到各個環(huán)節(jié),再到指標,通過杜邦分析作牽引,建立分析體系的過程。
另一個經(jīng)常應(yīng)用杜邦分解的場景是用戶運營場景,如下圖所示。業(yè)務(wù)的最終目標是提升 GMV 成交金額。
成交金額=購買用戶數(shù)*ARPU 值
購買用戶數(shù)=商品詳情頁 UV * UV 轉(zhuǎn)化率
ARPU 值=用戶的購買頻次*客單價
購買頻次可以進一步分為用戶買過1次、2次的、3次及以上的??蛦蝺r可以分成連帶率和件單價。
購買用戶數(shù)可以分為老用戶、站內(nèi)新用戶和站外新用戶。
這構(gòu)成了用戶運營的黃金公式。運營的操作或聚焦在提升頻次上,或聚焦在提升購買用戶數(shù)上,或提升客單價上。
提升頻次,要分析購買1次的用戶有多少,比例是多少,如何轉(zhuǎn)化成2次。
提升用戶數(shù),要分析如何做拉新、復(fù)購;流量端如何進一步拆解,提升UV或轉(zhuǎn)化率。
通過對目標的層層拆解,可以將業(yè)務(wù)過程拆解成一些過程性目標,并指導(dǎo)具體的運營策略。
03
指標體系有效落地的關(guān)鍵保障
數(shù)據(jù)指標的定義標準和數(shù)據(jù)的開發(fā)標準為指標體系有效落地提供了保障。
1.指標定義標準
指標數(shù)據(jù)口徑不一致,是企業(yè)里做指標面臨的一大挑戰(zhàn)。
以有效金額為例,大家都覺得很清晰,指成交的錢數(shù),應(yīng)該沒什么歧義。但統(tǒng)計時,會面臨很多實際問題。如統(tǒng)計時點,如何區(qū)分訂單類型,如果有下單后取消的情況該如何處理,優(yōu)惠的情況如何處理,以及其它特定的業(yè)務(wù)場景是否需要剔除等等。
再比如,成交金額和有效金額,雖然都是金額類指標,應(yīng)用場景不同,含義也會不同,就需要定義清楚口徑。如果它們是同樣含義,就需要統(tǒng)一語言。保證不同指標名稱代表不同含義。
因此,針對指標應(yīng)用的場景,需要對它做細致梳理和標準化定義及管理。清晰地定義好口徑的基礎(chǔ)上,再去考慮它如何在有效落地。
京東在實踐過程中,總結(jié)了一套指標定義標準,以便更加清楚地定義指標的基本含義。
對于原子指標定義,由業(yè)務(wù)過程 What + 主體 Who + 度量 How much 三部分組成。
以出庫金額和出庫訂單數(shù)量為例,業(yè)務(wù)過程為出庫(fin_ob),主體為訂單(order),度量分別為金額(amt_sum)和去重數(shù)量(cnt),對應(yīng)的指標名就為 fin_ob_order_amt 和 fin_ob_order_cnt。
當我們要獲取指標的時候,定義就會復(fù)雜一些,圖中寫作“衍生指標獲取”可能讓大家有點歧義,跟“衍生指標”混淆,這里的含義,主要是細化了在指標消費場景下,需要進一步明確的標準化信息,就是還需要在【業(yè)務(wù)過程 What +主體 Who +度量 How much】外,增加了【數(shù)據(jù)范圍 Where】,以及【支持的維度組合 Dim】和【時間范圍 When】,即我們所說的 4W1H 加維度定義法。
以 3C 業(yè)務(wù)的出庫金額為例, 3C 就是數(shù)據(jù)范圍,Dim 可支持范圍包括省區(qū)、品類、品牌、SKU 等維度,以及時間范圍。
通過 4W1H 加維度的標準化定義,可以更加高效的定義數(shù)據(jù)計算邏輯,優(yōu)化數(shù)據(jù)模型匯總表的建設(shè),形成標準化的開發(fā)模式,從而有效地提升開發(fā)效率。
2. 指標開發(fā)標準
在指標口徑標準化定義和管理基礎(chǔ)上,我們也制定了指標開發(fā)標準,沉淀了數(shù)據(jù)規(guī)范管理體系,定義了業(yè)務(wù)域和主題域的定義和劃分方式,制定了派生詞、派生指標等原子級規(guī)范。
通過京東物流 Udata 自助式數(shù)據(jù)分析平臺,對于不會寫代碼的業(yè)務(wù)人員,可以通過低代碼實現(xiàn)指標的定義即開發(fā)、所見即所得,配置化地生成指標的口徑和邏輯。在此基礎(chǔ)上進行數(shù)據(jù)分析或 API 調(diào)用,保證指標口徑的統(tǒng)一和效率提升。
以上就是本次分享的內(nèi)容,謝謝大家。
分享嘉賓
INTRODUCTION
焦文健
京東
大數(shù)據(jù)產(chǎn)品總監(jiān)
京東物流數(shù)據(jù)產(chǎn)品總監(jiān),中國人民大學MBA,十年以上大數(shù)據(jù)從業(yè)經(jīng)驗,具有數(shù)據(jù)中臺化、數(shù)據(jù)業(yè)務(wù)化、數(shù)據(jù)智能化的落地實踐經(jīng)驗。
點個 在看 把好內(nèi)容分享給更多人
掃描二維碼推送至手機訪問。
版權(quán)聲明:本文由飛速云SEO網(wǎng)絡(luò)優(yōu)化推廣發(fā)布,如需轉(zhuǎn)載請注明出處。