目前流行的關聯規則演算法有哪些?

時間 2021-07-07 05:59:05

1樓:拓端資料科技

R語言關聯規則模型(Apriori演算法)挖掘雜貨店的交易資料與互動視覺化

資料分析的第一件事是了解目標資料結構和內容。出於學習的目的,我認為使用乙個簡單的資料集更好。一旦我們知道了這個模型,就可以很容易地把它應用於更複雜的資料集。

在這裡,我們使用雜貨店的交易資料。首先,我們建立乙個資料框並將其轉換為交易型別。

n=500 # 交易數量

trans <- data.frame() # 收集資料的資料框架

建立資料並將其收集到交易資料框中。

for(i in 1:n)

","", rhs)

我們為我們的rhs_item建立規則

按 "置信度 "排序並檢查規則

sort(rules_2, "confidence")

最後,我們從規則集_2中繪製出前5條規則。

> plot(rules_2[1:5])

繪製全部規則

繪製出前5條規則

precision = 3

igraphLayout = layout_nicely

list(nodes = nodes, edges = edges, nodesToDataframe = nodesToDataframe,

edgesToDataframe = edgesToDataframe,

x$legend <- legend

htmlwidgets::createWidget( x, width = width,

height = height)

繪製全部規則

1.採用spss-modeler的web複雜網路對所有腧穴進行分析

2.用R語言和python進行社交網路中的社群檢測

3.R語言文字挖掘NASA資料網路分析,tf-idf和主題建模

4.在R語言中使用航空公司複雜網路對疫情進行建模

5.python隸屬關係圖模型基於模型的網路中密集重疊社群檢測

6.使用Python和SAS Viya分析社交網路

7.關聯網路分析:已遷離北京外來人口的資料畫像

8.情感語義網路:遊記資料感知旅遊目的地形象

9.用關聯規則資料探勘探索藥物配伍中的規律

2樓:

FP-growth演算法是當前挖掘頻繁項集演算法中速度最快,應用最廣,並且不需要候選項集的一種頻繁項集挖掘演算法,但是FP-growth也存在著演算法結構複雜和空間利用率低等缺點。Relim演算法是在FP-growth演算法的基礎上提出的一種新的不需要候選項集的頻繁項集挖掘演算法。它具有演算法結構簡單,空間利用率高,易於實現等顯著優點。

主要思想

Relim演算法的主要思想和FP-growth相似,也是基於遞迴搜尋(Recursive Exploration),但是和FP-growth不同的是:Relim演算法在執行時不必建立頻繁模式樹,而是通過建立乙個事務鍊錶組(transaction lists)來找出所有頻繁項集。

我之前也試過用Relim來完成台北市交通事故頻繁項集的挖掘,感興趣可以試一下wenhengqiu/FrequentPattents_CarAccident_Python

泰國目前最火的本地流行樂隊是哪些?

potato cocktail big ass getsunova tilly birds three man down silly fools season five big ass bedroom audio 25 hours bodyslam slot machine room39 moder...

有哪些優秀的演算法題?

青橙 經典的 Top K 問題 什麼是 Top K 問題?簡單來說就是在一堆資料裡面找到前 K 大 當然也可以是前 K 小 的數。這個問題也是十分經典的演算法問題,不論是面試中還是實際開發中,都非常典型。而這個問題其實也有很多種做法,你真的都懂了麼?1.使用快速排序,這種在資料量比較小的時候可以,但...

圓的識別演算法有哪些?

圓的識別在影象處理裡面屬於比較基礎的問題,有很多的演算法都可以用來進行圓的識別,其中比較常用的主要有 Circular Hough Transform CHT CHT屬於圓的檢測裡面最基本一類演算法,已經存在了好幾十年了,它基於的理論就是任何乙個圓都必須滿足 x a 2 y b 2 r 2這個基本公...