導(dǎo)讀:本文將分享LTV 模型在用戶(hù)增長(zhǎng)上的應(yīng)用和搭建,主要介紹:
什么是 LTV?
LTV 可以解決什么問(wèn)題?
什么時(shí)候需要什么樣的 LTV 預(yù)估?
如何實(shí)現(xiàn)設(shè)備粒度的LTV 預(yù)估?
LTV 如何應(yīng)用?如何撬動(dòng)更大的價(jià)值?
01什么是LTV
在傳統(tǒng)的經(jīng)濟(jì)學(xué)、市場(chǎng)學(xué)當(dāng)中,LTV經(jīng)常會(huì)被應(yīng)用的場(chǎng)景是:在一個(gè)超市中去分析來(lái)這個(gè)超市的人的整體的LTV,即LTV=Average Value of Sale *Number of Transactions * Retention Time Period,然后再做一個(gè)宏觀(guān)的數(shù)據(jù)統(tǒng)計(jì)和預(yù)測(cè)。
在互聯(lián)網(wǎng)的應(yīng)用環(huán)境下,通常把LTV拆解為兩項(xiàng):一個(gè)是LT(Life Time),一個(gè)是 ARPU(Average Revenue Per User)。通常在用戶(hù)生命周期的概念規(guī)范下,LT(Life Time)代表用戶(hù)在生命周期內(nèi)的活躍天數(shù);ARPU(Average Revenue Per User)是指用戶(hù)每次活躍時(shí)產(chǎn)生的價(jià)值;即LTV=LT(Life Time)*ARPU(Average Revenue Per User)。
02
LTV可以解決什么問(wèn)題?
1. 用戶(hù)增長(zhǎng)中的生命周期
用戶(hù)增長(zhǎng)中的生命周期分為以下五個(gè)階段:
第一個(gè)階段是潛在用戶(hù)階段,即用戶(hù)還沒(méi)有成為你站內(nèi)的用戶(hù);第二個(gè)階段,用戶(hù)成為你的站內(nèi)用戶(hù),是一個(gè)新增用戶(hù);第三個(gè)階段新增用戶(hù)可能會(huì)活躍,就會(huì)成為一個(gè)活躍用戶(hù),一個(gè)活躍用戶(hù)有可能繼續(xù)活躍,也有可能流失:第四個(gè)階段,當(dāng)用戶(hù)流失掉的時(shí)候,就是一個(gè)已流失的用戶(hù);第五個(gè)階段,流失用戶(hù)形成一個(gè)用戶(hù)增長(zhǎng)池,可以再去拉回用戶(hù)來(lái)提升整體的DAU。
2. LTV應(yīng)用于增長(zhǎng)的生命周期管理
LTV 模型可應(yīng)用于增長(zhǎng)的生命周期管理的五個(gè)階段。
(1)對(duì)于潛在用戶(hù),可以通過(guò)一些站外的數(shù)據(jù)或者一些媒體側(cè)的增長(zhǎng)的數(shù)據(jù),去預(yù)估潛在的用戶(hù)或者潛在的設(shè)備的LTV價(jià)值的高低;此時(shí)使用的粒度比較粗,例如地域、男女等粗粒度的畫(huà)像特征。
(2)對(duì)于新增用戶(hù),可以去構(gòu)建其畫(huà)像特征和行為特征等,來(lái)預(yù)估用戶(hù)在本次生命周期內(nèi)的 LT 和ARUP。
(3)對(duì)于活躍用戶(hù),數(shù)據(jù)充足,體量大,可根據(jù)近 N 天的各種特征等去預(yù)測(cè)用戶(hù)在本次生命周期內(nèi)的LT和ARPU;活躍用戶(hù)的數(shù)據(jù)可以做到一個(gè)日粒度的更新,對(duì)應(yīng)的LTV價(jià)值預(yù)估可經(jīng)常刷新。
(4)當(dāng)活躍用戶(hù)流失之后,進(jìn)入到流失用戶(hù)池,需要預(yù)估用戶(hù)的潛在回流LTV價(jià)值,篩選出潛在回流LTV價(jià)值高的用戶(hù)。
(5)對(duì)于回流用戶(hù),其LTV價(jià)值的分析跟新增用戶(hù)比較類(lèi)似,即根據(jù)該用戶(hù)在本次回流的前 N 天的各種特征等去預(yù)測(cè)該用戶(hù)在本次生命周期的 LT 和ARPU。
3. 增長(zhǎng)策略在生命周期的應(yīng)用
LTV預(yù)測(cè)在增長(zhǎng)策略中如何應(yīng)用?還是從生命周期的五個(gè)階段依次拆解。
第一個(gè)階段是潛在用戶(hù)階段,如果知道潛在用戶(hù)的LTV價(jià)值,在買(mǎi)量時(shí),就可以進(jìn)行相應(yīng)的調(diào)價(jià):高價(jià)值的用戶(hù)出高價(jià),低價(jià)值用戶(hù)出低價(jià);從而可實(shí)現(xiàn)ROI優(yōu)化的目標(biāo)。
第二個(gè)階段是新增用戶(hù)階段,當(dāng)用戶(hù)來(lái)到站內(nèi)之后,可根據(jù)其前幾天的表現(xiàn)去調(diào)整其對(duì)應(yīng)的LTV價(jià)值預(yù)估,可以用于復(fù)盤(pán)該新增用戶(hù)的增長(zhǎng)策略做得好不好,也就是說(shuō)當(dāng)用戶(hù)來(lái)到站內(nèi)以后,經(jīng)過(guò)一些時(shí)間行為的積累,預(yù)估其在本次生命周期的LTV價(jià)值,去衡量這次買(mǎi)量的效果好不好。比如說(shuō)你花了5塊錢(qián)買(mǎi)了一個(gè)用戶(hù),通過(guò)該用戶(hù)前幾天的一些表現(xiàn),預(yù)估該用戶(hù)在本次生命周期能夠產(chǎn)生比如10塊錢(qián)的收益,那么這次買(mǎi)量就是成功的、劃算的。
第三個(gè)階段是活躍用戶(hù)階段,可以每天刷新活躍用戶(hù)在本次生命周期的LTV價(jià)值,但此時(shí)也需要去關(guān)注和衡量一個(gè)用戶(hù)的長(zhǎng)期價(jià)值。在用戶(hù)增長(zhǎng)策略和方法中,經(jīng)常會(huì)發(fā)push拉活。比如用戶(hù)因?yàn)榘l(fā)push來(lái)到站內(nèi),那短期內(nèi)對(duì)DAU有增長(zhǎng),但同時(shí)預(yù)估其長(zhǎng)期的價(jià)值,可以知道這一次的促活能帶來(lái)的長(zhǎng)期價(jià)值是什么;這就衍生了白盒化分析的一些應(yīng)用,后面會(huì)有涉及。
第四個(gè)階段是流失用戶(hù)階段,首先在用戶(hù)流失之前,如果一直刷新活躍用戶(hù)的LTV價(jià)值預(yù)測(cè),識(shí)別出LTV價(jià)值的下降趨勢(shì),可以進(jìn)行流失預(yù)警;對(duì)于已流失的用戶(hù),可以根據(jù)其潛在的LTV價(jià)值高低,然后拉回,和拉新的邏輯比較像,即在拉回策略上的一個(gè)優(yōu)化。
第五個(gè)階段是對(duì)于回流用戶(hù)的LTV預(yù)估,和新增用戶(hù)的LTV預(yù)估比較類(lèi)似,就是根據(jù)拉回用戶(hù)的前幾天的站內(nèi)表現(xiàn),去回顧看一下這一次把這個(gè)用戶(hù)買(mǎi)回來(lái),或者說(shuō)是用一些策略吸引回來(lái)的,效率如何。
03
什么時(shí)候需要什么樣的LTV預(yù)估
到底需不需要一個(gè)LTV預(yù)估?在什么場(chǎng)景下要怎么樣進(jìn)行LTV預(yù)估?如何決策,和公司的發(fā)展策略、業(yè)務(wù)具體的應(yīng)用場(chǎng)景都是息息相關(guān)的,有很強(qiáng)的邏輯性,我們從以下四個(gè)維度進(jìn)行分析。
第一個(gè)維度是顆粒度,即需要對(duì)哪個(gè)顆粒度進(jìn)行LTV價(jià)值預(yù)估。
顆粒度,首先包括大盤(pán),是今天活躍的所有設(shè)備,還是整體存量用戶(hù)庫(kù);然后包括某一個(gè)cohort,一個(gè)cohort是指特定編碼的用戶(hù)群或設(shè)備群,比如今天的新增設(shè)備可以是一個(gè)cohort,或者今天新增從某一個(gè)渠道買(mǎi)來(lái)的一批用戶(hù)也是一個(gè)cohort,可以對(duì)某一個(gè)cohort進(jìn)行LTV價(jià)值預(yù)估;最后包括設(shè)備/用戶(hù),是LTV價(jià)值預(yù)估的終極模態(tài)。如果能夠差異化地預(yù)估每一個(gè)設(shè)備的LTV,應(yīng)用場(chǎng)景就非常的廣泛,可以把LTV價(jià)值預(yù)估聚合到任何維度,但是如果顆粒度越細(xì)的話(huà),建模難度、誤差等就會(huì)越高;顆粒度太粗又無(wú)法滿(mǎn)足業(yè)務(wù)需求,因此一定要結(jié)合具體的業(yè)務(wù)應(yīng)用場(chǎng)景,去決定一個(gè)合適的顆粒度。
第二個(gè)維度是時(shí)效性,是指每一次做出預(yù)估的時(shí)候需要等待一個(gè)什么樣的周期才能預(yù)估出來(lái)本次生命周期的LTV,比如預(yù)估一年內(nèi)的LTV,等的時(shí)間越久,其實(shí)就越接近真實(shí)值,但要是等得太久的話(huà),那業(yè)務(wù)不如再等兩天看真實(shí)值就算了,所以這里存在取舍,對(duì)于時(shí)效性要求越快的話(huà),預(yù)估肯定是越不穩(wěn)以及越不準(zhǔn),但是越慢的的話(huà),業(yè)務(wù)又不能滿(mǎn)足需求;因此還是需要要結(jié)合業(yè)務(wù)的應(yīng)用場(chǎng)景去決定時(shí)效性。
第三個(gè)維度是準(zhǔn)確性。
為什么準(zhǔn)確性是一個(gè)決定維度?比如LTV預(yù)估一個(gè)全量的值,如果真實(shí)值是100,要估100才對(duì),估98、95都不對(duì),這樣的標(biāo)準(zhǔn)太嚴(yán)格,因此在準(zhǔn)確性上需要有一定的取舍。尤其是在做設(shè)備粒度的LTV預(yù)估時(shí),有一些模型的效果是序會(huì)更準(zhǔn),比如A、B兩個(gè)設(shè)備,預(yù)估出來(lái)A設(shè)備比B設(shè)備的價(jià)值要高,但具體的準(zhǔn)確數(shù)值,可能估得不一定準(zhǔn);有一些模型的估值更準(zhǔn),比如聚合在某一個(gè)cohort上,這個(gè)估值的min會(huì)比較小,但序就不太準(zhǔn)了。更深入來(lái)分析,則可能需要在一個(gè)數(shù)據(jù)分布和建模選擇上進(jìn)行取舍,當(dāng)然需要結(jié)合具體業(yè)務(wù)需求去分析,如果評(píng)估實(shí)驗(yàn)組和參照組的差值,那序準(zhǔn)更重要,可以獲取設(shè)備之間誰(shuí)大誰(shuí)小的關(guān)系;如果是渠道買(mǎi)量等,就需要獲取某cohort、應(yīng)用或者設(shè)備的LTV價(jià)值,比如花了5塊錢(qián)買(mǎi)量,最終是不是產(chǎn)生了10塊錢(qián)還是15塊錢(qián)收益,那需要預(yù)估的LTV價(jià)值準(zhǔn);要根據(jù)應(yīng)用場(chǎng)景的不同做一定的取舍。
最后一個(gè)維度是用戶(hù)生命周期定義。
在傳統(tǒng)的市場(chǎng)學(xué)中,用戶(hù)生命周期是指用戶(hù)的壽命周期,就是完完整整的生命周期,buy until you die。但是在我們的業(yè)務(wù)應(yīng)用場(chǎng)景中,用戶(hù)生命周期會(huì)定義一個(gè)數(shù)字,有可能是一個(gè)月、一年,也有可能十年;具體是多長(zhǎng)時(shí)間會(huì)通過(guò)以下幾個(gè)因素進(jìn)行分析決定。
(1)公司的發(fā)展階段
如果公司發(fā)展到了比較成熟且穩(wěn)定的階段,則要關(guān)注用戶(hù)的長(zhǎng)期價(jià)值;如果在飛快發(fā)展的階段,歷史值都不太具有參考性,建模的穩(wěn)定性以及對(duì)于未來(lái)的預(yù)估的能力也不足;因此要根據(jù)公司發(fā)展階段來(lái)決定生命周期的長(zhǎng)短。
(2)宏觀(guān)經(jīng)濟(jì)地域環(huán)境
當(dāng)去預(yù)估一個(gè)設(shè)備或者一個(gè)渠道的價(jià)值時(shí),如果看的比較長(zhǎng)久一些,要考慮設(shè)備多久換一次機(jī),和換機(jī)時(shí)間是否能夠匹配上,其實(shí)也是buy until you die的邏輯,這個(gè)時(shí)候捕捉的就是設(shè)備的生命長(zhǎng)度;具體需要看多長(zhǎng)時(shí)間的周期就要根據(jù)宏觀(guān)的經(jīng)濟(jì)環(huán)境去決策。
(3)歷史數(shù)據(jù)積累
和第一點(diǎn)類(lèi)似,不贅述。
(4)應(yīng)用場(chǎng)景
在某些應(yīng)用場(chǎng)景下是否需要和某些指標(biāo)對(duì)齊,那么也會(huì)影響用戶(hù)生命周期定義。
下面介紹幾個(gè)常規(guī)的LTV預(yù)估模型。
第一個(gè)模型是歷史值擬合。
針對(duì)某一個(gè)cohort或大盤(pán),根據(jù)整個(gè)cohort或大盤(pán)的真實(shí)留存數(shù)據(jù),去擬合一個(gè)曲線(xiàn)y=a*ln(x)+b,預(yù)估出a和b的值,從而可以預(yù)估后續(xù)日期的LTV價(jià)值。
該模型的好處是應(yīng)用比較簡(jiǎn)單,簡(jiǎn)單清晰。弊端是穩(wěn)定性差,比如有一些激勵(lì)政策或前七天有促活,擬合出來(lái)的曲線(xiàn)就會(huì)有偏差,不是一個(gè)符合真實(shí)情況的成立函數(shù);也有可能中間有一些活動(dòng)帶來(lái)的一些尖刺spike,就會(huì)直接帶偏未來(lái)的預(yù)測(cè),需要等的時(shí)間比較久,通常等30天、60天都有可能,預(yù)測(cè)才能真的穩(wěn)定下來(lái)。
第二個(gè)模型是Probabilistic Model。
該模型將LTV拆解為L(zhǎng)T和ARPU,當(dāng)去看某個(gè)cohort或者大盤(pán)時(shí),假設(shè)這些指標(biāo)都是某種分布,然后根據(jù)歷史數(shù)據(jù)預(yù)估該分布的參數(shù),從而來(lái)預(yù)估未來(lái)的LTV,通常用于看大盤(pán)比較多。
最后一個(gè)模型是通過(guò)DNN或Machine Learning建模去構(gòu)建特征,包括用戶(hù)近N天畫(huà)像特征、行為特征、消費(fèi)特征、生產(chǎn)特征等,所有和業(yè)務(wù)、產(chǎn)品相關(guān)的維度,對(duì)用戶(hù)本次生命周期的LT和ARPU分別進(jìn)行預(yù)估。
下面從常理上剖析一下該模型。通過(guò)此類(lèi)模型預(yù)估的LT和ARPU,實(shí)際上都面臨一個(gè)問(wèn)題:大部分的用戶(hù)可能活躍一天或者花 10 塊錢(qián)就走了,有一部分用戶(hù)就花特別多的錢(qián),但可能在尾部又出現(xiàn)一個(gè)spike,即20%的用戶(hù)貢獻(xiàn)80%的收入,這樣的分布建模的難度比較高,比如用平常的MAE當(dāng)loss的話(huà),就不太容易能夠把這些極端的情況都捕捉到,可能會(huì)受比較奇怪的分布的影響,沒(méi)有辦法學(xué)到稀疏的地方。Google預(yù)估LTV的一個(gè)方法是沒(méi)有拆LT和ARPU,采用zero inflated log normal 模型直接預(yù)估一個(gè)用戶(hù)的LTV,具體可參考這篇文章:《Wang, X., Liu, T., and Miao,J. (2019), A deep probabil- istic model for customer lifetime value prediction, Available from: https://arxiv.org/abs/1912.07753》快手電商與增長(zhǎng)模型團(tuán)隊(duì)也創(chuàng)立了獨(dú)特的產(chǎn)業(yè)級(jí)LTV建模方法,通過(guò)引入Order Dependency Monotonic Network (ODMN)來(lái)針對(duì)時(shí)間跨度與LTV的有序依賴(lài)性建模,大幅提升模型表現(xiàn),同時(shí)使用基于分治法思路的Multi Distribution Multi Experts (MDME) 模塊式學(xué)習(xí),解決了LTV數(shù)據(jù)分布稀疏對(duì)建模的困難。詳見(jiàn)
04
如何實(shí)現(xiàn)設(shè)備粒度的LTV預(yù)估
如何實(shí)現(xiàn)設(shè)備粒度的LTV預(yù)估,總結(jié)下來(lái)就是數(shù)據(jù)和模型這兩塊。
數(shù)據(jù)基建是一個(gè)金字塔型階梯式的數(shù)據(jù)積累。
最底層是DAU的特征積累,即對(duì)DAU各種特征做數(shù)倉(cāng)建設(shè),對(duì)LTV的用途做模塊化管理,比如把生產(chǎn)側(cè)的某種指標(biāo)聚到一塊,實(shí)時(shí)地更新特征庫(kù)。
第二層是對(duì)不同cohort的模型圈選人群,其中cohort是指人群等,比如需要做設(shè)備粒度的LTV預(yù)估時(shí),預(yù)估模型需要圈選人群,該人群可能是MAU、DAU等,根據(jù)圈選出來(lái)的人群決定畫(huà)像和時(shí)效性。
第三層是聚集所有的特征,去得到訓(xùn)練/預(yù)測(cè)集等,就決定了特征的復(fù)雜性、模型的復(fù)雜性、訓(xùn)練更新頻率等。
第四層是線(xiàn)上的多維實(shí)時(shí)數(shù)據(jù)源,偏維度項(xiàng)、偏實(shí)時(shí)的數(shù)據(jù),即在模型預(yù)測(cè)或訓(xùn)練時(shí)才加進(jìn)來(lái)的一些比較簡(jiǎn)單的數(shù)據(jù)。最頂層最終預(yù)測(cè)輸出,預(yù)估的LTV價(jià)值。
模型基建分為三塊。
第一塊是只用一個(gè)模型框架承接整個(gè)探測(cè)數(shù)據(jù)、特征處理、訓(xùn)練、預(yù)測(cè),結(jié)果評(píng)估等完整流程,即該模型框架需要可以支持完整流程,并且有很強(qiáng)的拓展性,有一定的復(fù)用性。
第二塊是內(nèi)部有工具去部署任務(wù)、管理機(jī)器資源等,無(wú)論是用airflow,還是內(nèi)部自研的工具。
最后一塊是日常監(jiān)控,包括預(yù)測(cè)異常監(jiān)控、模型準(zhǔn)確率監(jiān)控、特征變化監(jiān)控,比如監(jiān)控是否準(zhǔn)時(shí)產(chǎn)出、特征變化等,監(jiān)控特征是不是從某個(gè)時(shí)候開(kāi)始偏移了,整個(gè)分布都變了,則對(duì)應(yīng)模型不再適用,因此都要從各個(gè)維度,比如預(yù)測(cè)的結(jié)果、模型的準(zhǔn)確性,還有特征等都要做監(jiān)控。
05
LTV如何應(yīng)用?如何撬動(dòng)更大的價(jià)值?
最后介紹一下LTV如何應(yīng)用以及如何撬動(dòng)更大的價(jià)值。前面講過(guò)的白盒化和此相關(guān),通過(guò)模型可以榨取出白盒化的一些產(chǎn)品洞見(jiàn)。
對(duì)新增用戶(hù)進(jìn)行建模時(shí),可以做畫(huà)像切片,篩選出高價(jià)值的用戶(hù),然后針對(duì)性地做一些買(mǎi)量策略;也可以預(yù)測(cè)時(shí)序上的變化,預(yù)估真實(shí)的LTV是怎么樣變化的,也可以預(yù)測(cè)具體的特征是怎么樣的變化及其正、負(fù)相關(guān)性等,因此可以對(duì)整體的產(chǎn)品策略有一定的指導(dǎo)。
對(duì)活躍用戶(hù)進(jìn)行建模時(shí),可以評(píng)估日常促活的一些策略的長(zhǎng)期價(jià)值,也可以分析該模型重要的特征,從而做一些產(chǎn)品策略的指導(dǎo)。如果知道決定活躍用戶(hù)預(yù)測(cè)重要的特征有哪些,可以對(duì)產(chǎn)品整體有宏觀(guān)的理解,并且從這些特征出發(fā),可以做更多的事情。比如相關(guān)特征涉及兩個(gè)產(chǎn)品線(xiàn)的一些重要指標(biāo),這兩個(gè)產(chǎn)品相互沖突和競(jìng)爭(zhēng),此消彼長(zhǎng),就可以知道哪個(gè)指標(biāo)對(duì)用戶(hù)的長(zhǎng)期價(jià)值更重要,也可以知道該如何看待兩個(gè)產(chǎn)品的重要指標(biāo),以及如何衡量其重要性。
還可以通過(guò)分析LTV預(yù)測(cè)的變化,得到生命周期變化的預(yù)警。比如長(zhǎng)期觀(guān)測(cè)一個(gè)用戶(hù)的LTV 預(yù)估的變化,可以找出LTV漲跌趨勢(shì),無(wú)論是漲還是跌,都可以映射到高活躍、中活躍和低活躍中,就可以獲得活躍用戶(hù)活躍度扭轉(zhuǎn)的預(yù)警。
對(duì)回流用戶(hù)進(jìn)行建模時(shí),和新增用戶(hù)類(lèi)似,對(duì)于回流的用戶(hù)可以做策略?xún)?yōu)化。比如通過(guò)做用戶(hù)畫(huà)像切片,可以知道已流失的用戶(hù)或拉回的用戶(hù)中哪些用戶(hù)的價(jià)值更高,然后針對(duì)性地優(yōu)化拉回策略。
今天的分享就到這里,謝謝大家。
來(lái)源:井冬萍 DataFunSummit
以上是關(guān)于用戶(hù)增長(zhǎng)師的相關(guān)信息,以供大家查看了解。想要了解更多用戶(hù)增長(zhǎng)師信息,第一時(shí)間了解用戶(hù)增長(zhǎng)師相關(guān)資訊,敬請(qǐng)關(guān)注唯學(xué)網(wǎng)用戶(hù)增長(zhǎng)師欄目,如有任何疑問(wèn)也可在線(xiàn)留言,小編會(huì)為您在第一時(shí)間解答!