資料探勘與機器學習是什麼關係？

1樓：郭斯特

機器學習通過演算法讓計算機通過以往的經驗來改善其效能。

資料探勘從資料中發現模式並加以利用。

所謂「以往的經驗」，當然也是以資料的形式存在的。要想改善效能，當然也要先發現模式才行。兩個領域高度相關。

區別嘛，資料探勘更重視實際應用，採用系統化的方法來綜合使用各種機器學習演算法（拿來就用，不管理論），期望對各種不同型別的資料達到最佳的挖掘效果，對理論（數學）層面不太關注，對計算機系統，資料庫，大資料等技術層面關注度高。機器學習則更強調理論和對個別學習演算法的研究，不太關注技術層面，對理論（數學）要求很高，尤其是概率論，微積分，線性代數和最優化。最前沿的機器學習研究則是把各種數學子領域拿來試試看能不能起到良好的學習效果，比如流型等。

總體來收，資料探勘基本屬於應用層面，對於工業界想做產品的人來說更重要。機器學習基本屬於理論層面，屬於理科學霸和博士們玩的玩意。

2樓：愷玹羅曼史

首先搞懂什麼是資料探勘和機器學習

資料探勘是從海量資料中，有選擇性的處理，利用包括但不限於機器學習中常用的方法，來找到一種可以更好地解決實際問題的模式。

資料探勘的過程中資料選擇和處理如同怎樣更好的運用它們一樣重要。

機器學習是利用數理統計，概率論等多個學科的知識來研究出解決某種問題的方法或機制，為這些方法在實際中應用提供理論證明，同時研究如何進一步優化這些方法和開發出新的方法。

這些方法大多借鑑了人類的大腦結構和思維習慣，常見的有SVM，神經網路，貝葉斯分類以及決策樹等。

機器學習和資料探勘的區別及聯絡

區別：

機器學習注重相關機器學習演算法的理論研究和演算法提公升（理論和學術）。

資料探勘注重運用演算法或者其他某種模式解決實際問題（實踐和運用）。

聯絡：機器學習為資料探勘提供解決實際問題的方法，資料探勘中演算法的成功應用，說明了機器學習對演算法的研究具有實際運用價值。

3樓：桂能

資料探勘大部分都是實際問題，你有很多手段去解，不一定要機器學習，早期很多資料探勘是基於heuristic的，很多時候一些簡單的統計就可以。

機器學習的問題通常比較well defined，大部分都在搞有監督的學習，但是資料探勘那個角度看過去，實際的問題更偏好無監督或者半監督，因為annotate這個事情太費勁了，能不能從資料本身出發減少annotate的工作量。

4樓：

其實是最早，人工智慧技術被認為是忽悠的時候。科學家為了拿經費，把AI的各個小領域單獨成立學科。比如資料探勘，機器學習，NLP，CV等等，然後以這些名義去申請經費。

神奇的是這些當時的子領域後來都紛紛茁壯成長為參天大樹。

資料探勘有四大演算法（關係模式，分類，聚類，回歸）。機器學習有十大主流演算法。恰好除了關係模式以外資料探勘的剩下三大演算法都是ML十大演算法之一。

5樓：

機器學習是人工智慧的核心，資料探勘僅僅是其應用的一類。上面那張圖是我在ETHINK平台看到的介紹，有人工智慧資料探勘和商務智慧型

6樓：濕人彭

演算法是機器學習和資料探勘的工作內容中重疊的部分。

如果說演算法是刀，那麼機器學習就是刀匠，資料探勘就是刀法大師。

乙個追求刀的吹毛斷發，所以搞機器學習的人會乙個個演算法不斷重寫，優化。

乙個尋找武術真諦，所以做資料探勘的人有時候會用N個演算法嘗試解決同乙個問題，然後找到最適合的解。

7樓：

我的看法，求拍。

資料探勘可以挖掘未知資訊，可以挖掘已知資訊。

未知的資訊為你不知道的關係啊，規則等

已知的資訊是由於資訊太龐大，如何篩選我們需要的資訊是一種需求，而我們需要的資訊用一種什麼規則來表示呢？則需要機器學習來獲得標準，即符合這一標準的為需求資訊，不滿足這一標準的為無用資訊。

8樓：Sam Wang

目前所說的機器學習一般指統計學習方法，更有甚者稱為貝葉斯統計學習；而資料探勘則更偏向電腦科學中演算法，更偏向應用，例如資料庫等，這些都是機器學習不考慮的

資料探勘與機器學習是什麼關係？

資料分析資料探勘與機器學習之間有什麼聯絡？

深度學習與機器學習的關係是什麼？

做機器學習或者資料探勘中，資料往往會有很多雜訊，一般消除雜訊的方法有哪些呢？

其他用戶還看了：

資料探勘與機器學習是什麼關係？

資料分析 資料探勘與機器學習之間有什麼聯絡？

深度學習與機器學習的關係是什麼？

做機器學習或者資料探勘中，資料往往會有很多雜訊，一般消除雜訊的方法有哪些呢？

其他用戶還看了：

資料分析資料探勘與機器學習之間有什麼聯絡？