關聯規則資料推薦是否可以用PageRank類似的思路來計算推薦可信度?

時間 2021-06-02 04:31:43

1樓:郭寬

首先回答題目中的那個假設

原文:「比如A、B、C是三本書,同時選擇A和B的有100人,同時選擇A和C的只有50個人,那麼,你如果這樣計算關聯度,顯然是A和B關聯度高;但是我給你額外的資料,B這本書非常熱門,一共有10萬人選擇,C這本書有點冷門,只有500人選擇,現在你再看,還認為A和B的關聯度比A和C高麼?」。

是的,我依然認為A和B的關聯度比A和C高,這沒什麼問題,既然買了A的人,有100人買了B,而只有50人買了C,那就直接說明了買了A的人更容易去買B,而不是C,這跟B本身熱不熱銷沒什麼關係。

而至於後面那個假設:

某個文藝青年同時選擇了2本書,另乙個採購員同時選擇了200本書,那麼前面兩本書之間的關聯度,和後面的200本書之間的關聯度,一樣麼?這就屬於雜訊資料了,需要我們盡可能的取出這種非普通使用者的影響,如果不能取出也能一定程度上反應真實銷售的需求。

這裡要明確一下關聯規則挖掘和推薦系統的關係,關聯規則挖掘主要是使用歷史資料對兩個項集的關係進行挖掘,比如買了A的使用者大多數都繼續買了B,那麼我們就可以判定A - > B 這種規則,但這個規則並不一定要直接應用於推薦。

推薦系統是一本綜合的技術,他可以結合協同過濾、關聯規則等一系列方式進行推薦,是需要廣泛調整引數的,目的是更多的產生效益,即如果B非常熱銷,更容易帶來價值,即便它跟A沒有什麼關聯,也是可能被推薦的。

關於你的問題:

1、關聯規則挖掘中,只跟前者即A的交易數有關,跟後者B或C自身的交易數沒有關係,所以計算的時候不應該出現B或C單獨的引數,你人為的把他們引進去了,誤解了關聯規則的本意。

2、他的反問我認為是沒有道理可言的,是把推薦置信度和關聯規則置信度的混淆。

往年的複習資料還可以用嗎?

qiuqiu 可以是可以,但要會選,有些老資料有一些不同的解題技巧,但也應該有新的複習資料,因為每年的知識和題型會有一點改變,所以,最好新舊結合 啦啦啦啦 瀉藥,首先真題是可以用的,對於提綱變化不大的科目來說參考書和筆記是可以用來參考的,但是要注意知識點更新,政治這類的資料就不要留了,每年變化都很大...

是否可以用離心力代替重力?

高原獵鷹 用離心力可以有限地代替重力,但是在活動中可能會產生運動方向不同而產生重力也不同的現象,甚至重新失重,這種現象是無論多大的直徑都無法避免的。 英年早肥 可以。高票回答說的很清楚了,例子也不錯,存在的問題也說的很好,最大的問題恐怕是距離圓心不同距離時模擬的重力大小不一。星際穿越裡就是這辦法。為...

如何保養木質器具?是否可以用凡士林?

黃先鴻 要想知道怎麼保養木器,就得從木器損壞的原因開始了解。一 為什麼會開裂?木器開裂的原因是由於表面水分蒸發,而芯部水分仍在。這種裡外的濕度差異造成了木材乾縮形變數的不一致導致開裂。木材的最容易蒸發水汽的是端麵 橫截面 這乙個面是管孔截口聚集處,所以我們所能見到的木頭開裂絕大多數是由端麵開始往裡裂...