資料探勘演算法可以分為幾類?

時間 2021-05-06 21:18:21

1樓:可愛的資料控

個人學習理解,認為總體分為兩大類有監督、無監督(具體分類下滑見最後的腦圖

在開始講演算法分類之前,我覺得有必要先定義一下資料探勘在整乙個資料體系內的角色

首先,我理解的資料探勘是對既定的「淨資料」進行加工利用的過程,我們可以把它看作是烹飪加工的過程。

資料探勘有一定規則和相應模型的,這一點我們也可以通過乙個模擬進行理解。

清洗後的高質量資料就像是「淨菜」,而資料探勘模型就像是各種「菜系」,我們知道,就算「淨菜」材料一致,但菜系(資料探勘模型)不同,最終得到的成品也是截然不同的!

下面是資料探勘中較為常見的幾個「菜系」(模型),下面我們配合模型對應的使用場景逐一闡述

總的來說,資料探勘模型可以通過「監督模式」進行大致分類,分類為監督模型、非監督模型:

監督模型:簡單的說,就是讓機器學會舉一反三,它好比學生在學習時已知題目和答案,去學習分析如何解題一樣,下次遇到一樣的或者類似的題目就會做了;監督模型內的資料分為訓練集和測試集,常見模型有決策樹、LOGISTIC線性回歸等。

非監督模型:簡單的說,就是略去了監督模型中」舉一反三「的過程,輸入的僅僅是一堆資料,沒有標籤,也沒有訓練集和驗證集之分,讓演算法根據資料本身的特徵去學習,常見模型一般有clustering。

以上~應該能夠解決大多數演算法分類的問題!

去哪找資料?怎麼挖掘?

2樓:Patrick Leung

先佔,若有必要繼續補充。

主要分為:

挖掘頻繁模式、關鍵和相關性

分類聚類分析

離群點檢測

資料探勘和機器學習稍有差別,但相差不大。傳統資料探勘類似黑盒操作,挖掘出來的資訊和規則不一定可解釋。機器學習注重了學習結果的可解釋性,強調了學習過程。目前基本已統一。

3樓:

從問題的屬性來劃分:分類、聚類、回歸

從資料集劃分:監督、半監督、無監督

PS:求大神詳細講解下「監督學習」和「半監督學習」的區別~

生活中的朋友可以分為幾類?

冬天裡 朋友分類的依據是你和對方性格的匹配程度,僅此而已,不要新增其他的東西。不論什麼型別的朋友,只要當他是朋友,都要尊重和友愛,其中某些朋友由於性格更相吸,你會更加關心他,也會在他面前把心門敞開,對別人可能只是開啟一扇窗。所以我會把朋友分為三類 心理距離有近到遠的 再親密的朋友也要互相保有自己的空...

有哪些好的大資料探勘演算法?

梁勇 必讀經典 1.Programming Collective Intelligence 作者 Toby Segaran 出版社 O Reilly Media,Inc.評語 近年出的入門好書,培養興趣是最重要的一環.2.Machine Learning 作者 Tom M.Mitchell出版社 M...

心臟外科手術可以分為哪幾類?

開心老王 常見的四類 A.冠心病 主要是冠狀動脈旁路移植術 俗稱搭橋,CABG 簡單來說就是冠心病堵了的那段不用了,架個血管橋過去。血管橋可以用動脈 胸廓內動脈 或者靜脈 大隱靜脈 手術精細度相當高 冠脈就那麼點大 手術如果成功患者基本術後只好不差,不涉及心臟內部結構 B.瓣膜病 處理心臟四個瓣膜 ...