hash tree 在apriori 演算法中是如何進行支援度計數的?

時間 2021-05-12 00:38:46

1樓:穆皚青

這本書看到這裡也非常困擾然後來網上搜尋,得到這個帖子。

所以是先有了這15個3-項集,然後根據規則分到了對應的位置,具體的規則就是上面鏈結裡提到的mod3還有乙個根下面超過3要繼續分

所以我還是不明白這15項是哪兒來的,尤其譬如123根本沒有包括在裡面

2樓:stone jack

HASH演算法的目的是計算出各個候選項集的支援度。

分2個步驟。

第一步,建立HASH樹。將所有需要計算支援度的項集,也就是書中的15

個「候選3項集」建三叉樹。第一層,首項1、3或5的居左,2、5或8居中,3、6或9居右;如果有層的葉子節點超過3個,就開始第二層,繼續往下分。書中這個建hash樹的過程一筆帶過。

這過程,這篇博文Apriori中的hash tree 講得很清楚。

第二步,對於每個事務,來走一遍Hash樹,書中舉了這個事務,就和查爾斯周說的相似,但不是簡單的列舉,而是跟著樹走。

這裡要結合211頁那張圖6-9來看,事務跟著樹的枝分解:

首先分解成1+[2356],2+[356],3+[56]。1+[2356]沿著三叉樹的左子樹再分解成,12+[356]、13+[56]和15+

[6],再以12+[356]為例,因為第二項是2,所以它再沿著中子樹走,其中125(第三項是5)最後沿著中間走到125/458這個葉子。恰好,葉子中有125這個項集,那麼這個125這個候選項集的支援度就加1。

當然,效果上和查爾斯周,說的一樣。

3樓:查爾斯周

剛剛也看到了這裡,不知道我這樣子理解對不對。

首先,對候選3-項集中的每乙個3-項集,依次對其每乙個項用h(p)=p mod 3來確定雜湊樹中每一層的分支方向。比如,頻繁項集,先用1 mod 3=1,所以它在第一層被劃分到左子樹,然後用2 mod 3=2,所以它在第二層被劃分到中子樹,最後用4 mod 3=1,所以它最後被劃分到第三層的左子樹節點。

然後,對於每乙個事務t,先列舉其所有的3-項集。然後對每乙個3-項集按上面劃分候選項集的方法把它劃分到雜湊樹的某乙個結點中。比如事務t=有乙個3-項集就會被劃分到雜湊樹和結點中。

最後,就是比較雜湊樹結點中的3-項集與每乙個事務t中的3-項集,如果有相同的就增加該3-項集的支援度計算。

在master by coursework在讀期間可以轉成research麼?

不行,以下為咱問自己導師同樣問題的回信QAQ 原來打算讀research的,連教授都談好了,但因為課題選了很久簽證快過期了還沒定,所以在拿到coursework的offer就直接交了,以為反正可以轉結果。 master by coursework轉research一般沒有這麼一說,master by...

在人類能在宇宙在自由航線的時代,怎麼在宇宙中辨別方向?

李虹 還是經緯度體系。目前地球上有兩種經緯度體系 赤經赤緯,以赤道為參照,地球表面可以定位 黃經黃緯,以地球軌道為參照,太陽系旅行可以定位。那麼宇宙漫遊就可以銀經銀緯定位,同時選擇河外星系作為定位依據,比如說,仙女座大星雲方向。 入夢離陽 地球不能當成參照物,太陽能不能?太陽不能當成參照物,太陽系能...

在 PC Mac Android Phone iPhone 和 iPad 上,閱讀 PDF 的最好應用分別是什麼?

IOS推薦 Documents by Readdle 可簡單做批註,而且可以連線Dropbox Skydrive 同步,注意是 同步 作了批註實時上傳非常方便,PC端或MAC端用網盤同步就行了 睿子 看需求吧,其實基本閱讀功能的話大多數閱讀器都差不多,下面幾個是個人認為功能全,方便標註 筆記和與其他...