從0開始做互聯(lián)網(wǎng)推薦-以58轉(zhuǎn)轉(zhuǎn)為例

2018-09-06 17:55 更新
從0開始做互聯(lián)網(wǎng)推薦【產(chǎn)品+算法+實(shí)現(xiàn)】

一、58轉(zhuǎn)轉(zhuǎn)簡介

58旗下真實(shí)個(gè)人閑置物品交易平臺


二、從0開始設(shè)計(jì)推薦產(chǎn)品框架

(1)首頁推薦:提取用戶畫像,根據(jù)線下提取出的用戶年齡、性別、品類偏好等在首頁綜合推薦寶貝

(2)寶貝詳情頁推薦買了還買,看了還看類的關(guān)聯(lián)寶貝推薦

(3)附近推薦:和首頁推薦的差異在于,提高了地理位置的權(quán)重,地理位置不僅要包含當(dāng)前地理位置,還需要包含常見活躍區(qū)域,例如家里、公司等

(4)搜索推薦:除了關(guān)鍵詞全匹配,要考慮同義詞、近義詞、易錯(cuò)詞、拼音等推薦,產(chǎn)品層面,提示“你是不是想找xxoo寶貝”

(5)召回推薦:在用戶退出系統(tǒng)后,通過RFM模型做優(yōu)惠券推送或者消息推送做客戶挽留與召回


TIPS:什么是RFM模型?

RFM模型:根據(jù)用戶最近一次購買時(shí)間Recency,最近一段時(shí)間的購買頻度Frequency,最近一段時(shí)間的購買金額Monetary,加權(quán)得到的一個(gè)代表用戶成交意愿的一個(gè)分值。


三、從0開始進(jìn)行推薦策略實(shí)現(xiàn)

【用戶畫像】

根據(jù)用戶填寫的資料、用戶歷史行為(購買、收藏、喜歡、分享、評論、瀏覽等行為)、微信背后的用戶畫像,得到用戶的特性畫像:

年齡段 -> 推薦母嬰、3C用品?

性別 -> 推薦母嬰、美容保健用品?

手機(jī)型號 -> 推薦手機(jī)

活躍時(shí)間 -> 在這個(gè)時(shí)間段推送消息

品類偏好 -> 相關(guān)品類推薦

地域 -> 附近推薦


【如何構(gòu)建畫像】

(1)讀取用戶安裝的應(yīng)用程序列表構(gòu)建畫像

裝有滴滴用戶端 -> 沒有車

裝有滴滴司機(jī)端 -> 有車

裝有CSDN -> 男性

裝有美柚、美顏APP -> 女性


(2)用戶行為日志

啟動日志 -> 獲取活躍時(shí)段

經(jīng)緯度 -> 獲取活躍地域

購買、收藏、喜歡、分享、評論、瀏覽-> 獲取品類偏好

第三方數(shù)據(jù) -> 完善用戶畫像


【寶貝畫像】

58轉(zhuǎn)轉(zhuǎn)的寶貝都是非結(jié)構(gòu)化的數(shù)據(jù),比較難做統(tǒng)一的寶貝畫像,只能細(xì)分品類的做寶貝畫像,例如手機(jī)畫像等。


【如何構(gòu)建寶貝畫像】

對于58轉(zhuǎn)轉(zhuǎn)來說,要做寶貝畫像必須細(xì)分類別,可以分詞詞頻統(tǒng)計(jì)配合人工review的方式畫像,以鞋為例,畫像可能為

單鞋

純牛皮

尺碼

適合春秋穿

女鞋

價(jià)格及變動

包郵


【標(biāo)簽化與個(gè)性化推薦

畫像完成之后,如何對用戶進(jìn)行寶貝推薦呢?

(1)給用戶和寶貝畫像完畢之后,要將每一個(gè)用戶和每一個(gè)寶貝打上標(biāo)簽TAG

(2)統(tǒng)計(jì)用戶uid所有購買、收藏、喜歡、分享、評論、瀏覽的所有寶貝ID集合set<bb-id>

(3)統(tǒng)計(jì)這些寶貝ID所有對應(yīng)的TAG,使用加權(quán)打分的方式,可以根據(jù)頻次統(tǒng)計(jì)出對各TAG的喜好程度

(4)對于所有寶貝,根據(jù)uid對各TAG的喜好程度,使用加權(quán)打分的方式,可以統(tǒng)計(jì)出對各寶貝的喜好程度

(5)排除已經(jīng)購買、收藏、喜歡、分享、評論、瀏覽過的寶貝,其他寶貝按照打分高低推薦即可

(6)搜索推薦需要加上“搜索條件”,附件推薦需要加強(qiáng)“附近權(quán)重”

需要注意的是,個(gè)性化推薦的準(zhǔn)確性,一定程度上依賴于歷史行為數(shù)據(jù)的收集,對于新用戶,在缺乏歷史行為積累時(shí),可以推薦“熱度最高”的寶貝,未來再根據(jù)其歷史行為,不斷增強(qiáng)推薦的準(zhǔn)確率。


分類預(yù)測推薦

一個(gè)用戶對一個(gè)寶貝是否進(jìn)行購買,可以抽象成一個(gè)0和1的分類問題,也可以抽象成一個(gè)購買概率的數(shù)學(xué)問題,可以構(gòu)造分類模型來計(jì)算用戶對每個(gè)寶貝的購買概率,將概率最高的作為推薦的寶貝。

為了實(shí)現(xiàn)分類預(yù)測推薦,需要:

(1)準(zhǔn)備訓(xùn)練數(shù)據(jù)集,包含用戶、寶貝、用戶是否購買了寶貝等歷史數(shù)據(jù),需要注意的是,數(shù)據(jù)集應(yīng)當(dāng)覆蓋盡可能多的用戶(要包含所有TAG)和寶貝(要包含所有分類及TAG)

(2)構(gòu)造訓(xùn)練分類模型

(3)根據(jù)模型訓(xùn)練的結(jié)果,計(jì)算每一個(gè)用戶對每一個(gè)寶貝某買的概率

(4)按照概率排序,對寶貝進(jìn)行推薦


協(xié)同過濾推薦

協(xié)同過濾,用過的人都知道,不一定效果最好,但幾乎適用于所有的業(yè)務(wù)場景:當(dāng)向用戶A做協(xié)同過濾推薦時(shí),可以先找到和他興趣相似的用戶群體G,然后把G喜歡的、并且A沒有點(diǎn)擊過的寶貝推薦給A,這就是基于用戶的協(xié)同過濾。

為了實(shí)現(xiàn)系統(tǒng)過濾推薦,需要:

(1)準(zhǔn)備訓(xùn)練數(shù)據(jù)集,根據(jù)每個(gè)用戶對每個(gè)寶貝的喜好,構(gòu)建喜好矩陣(這是一個(gè)非常稀疏的矩陣),根據(jù)用戶對寶貝購買、收藏、喜歡、分享、評論、瀏覽的行為量化這個(gè)喜好

(2)構(gòu)造系統(tǒng)過濾訓(xùn)練模型

(3)針對每一個(gè)用戶,根據(jù)模型給出其喜好寶貝列表

在做協(xié)調(diào)過濾推薦時(shí)需要注意,較新的寶貝,由于大部分人都沒有相關(guān)喜好數(shù)據(jù),所以使用協(xié)同過濾推薦時(shí),新寶貝比較難被推薦上去,這是協(xié)同過濾的缺點(diǎn),需要綜合其他推薦策略來解決。


好了,暫時(shí)先到這里,希望對58轉(zhuǎn)轉(zhuǎn),以及其他剛開始做推薦的互聯(lián)網(wǎng)產(chǎn)品有幫助。

注:本文是58到家推薦負(fù)責(zé)人@王洪權(quán) 在和58轉(zhuǎn)轉(zhuǎn)做技術(shù)交流時(shí),@58沈劍 做的紀(jì)要。


以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號