1樓:郭斯特
機器學習通過演算法讓計算機通過以往的經驗來改善其效能。
資料探勘從資料中發現模式並加以利用。
所謂「以往的經驗」,當然也是以資料的形式存在的。要想改善效能,當然也要先發現模式才行。兩個領域高度相關。
區別嘛,資料探勘更重視實際應用,採用系統化的方法來綜合使用各種機器學習演算法(拿來就用,不管理論),期望對各種不同型別的資料達到最佳的挖掘效果,對理論(數學)層面不太關注,對計算機系統,資料庫,大資料等技術層面關注度高。機器學習則更強調理論和對個別學習演算法的研究,不太關注技術層面,對理論(數學)要求很高,尤其是概率論,微積分,線性代數和最優化。最前沿的機器學習研究則是把各種數學子領域拿來試試看能不能起到良好的學習效果,比如流型等。
總體來收,資料探勘基本屬於應用層面,對於工業界想做產品的人來說更重要。機器學習基本屬於理論層面,屬於理科學霸和博士們玩的玩意。
2樓:愷玹羅曼史
首先搞懂什麼是資料探勘和機器學習
資料探勘是從海量資料中,有選擇性的處理,利用包括但不限於機器學習中常用的方法,來找到一種可以更好地解決實際問題的模式。
資料探勘的過程中資料選擇和處理如同怎樣更好的運用它們一樣重要。
機器學習是利用數理統計,概率論等多個學科的知識來研究出解決某種問題的方法或機制,為這些方法在實際中應用提供理論證明,同時研究如何進一步優化這些方法和開發出新的方法。
這些方法大多借鑑了人類的大腦結構和思維習慣,常見的有SVM,神經網路,貝葉斯分類以及決策樹等。
機器學習和資料探勘的區別及聯絡
區別:
機器學習注重相關機器學習演算法的理論研究和演算法提公升(理論和學術)。
資料探勘注重運用演算法或者其他某種模式解決實際問題(實踐和運用)。
聯絡:機器學習為資料探勘提供解決實際問題的方法,資料探勘中演算法的成功應用,說明了機器學習對演算法的研究具有實際運用價值。
3樓:桂能
資料探勘大部分都是實際問題,你有很多手段去解,不一定要機器學習,早期很多資料探勘是基於heuristic的,很多時候一些簡單的統計就可以。
機器學習的問題通常比較well defined,大部分都在搞有監督的學習,但是資料探勘那個角度看過去,實際的問題更偏好無監督或者半監督,因為annotate這個事情太費勁了,能不能從資料本身出發減少annotate的工作量。
4樓:
其實是最早,人工智慧技術被認為是忽悠的時候。科學家為了拿經費,把AI的各個小領域單獨成立學科。比如資料探勘,機器學習,NLP,CV等等,然後以這些名義去申請經費。
神奇的是這些當時的子領域後來都紛紛茁壯成長為參天大樹。
資料探勘有四大演算法(關係模式,分類,聚類,回歸)。機器學習有十大主流演算法。恰好除了關係模式以外資料探勘的剩下三大演算法都是ML十大演算法之一。
5樓:
機器學習是人工智慧的核心,資料探勘僅僅是其應用的一類。上面那張圖是我在ETHINK平台看到的介紹,有人工智慧資料探勘和商務智慧型
6樓:濕人彭
演算法是機器學習和資料探勘的工作內容中重疊的部分。
如果說演算法是刀,那麼機器學習就是刀匠,資料探勘就是刀法大師。
乙個追求刀的吹毛斷發,所以搞機器學習的人會乙個個演算法不斷重寫,優化。
乙個尋找武術真諦,所以做資料探勘的人有時候會用N個演算法嘗試解決同乙個問題,然後找到最適合的解。
7樓:
我的看法,求拍。
資料探勘可以挖掘未知資訊,可以挖掘已知資訊。
未知的資訊為你不知道的關係啊,規則等
已知的資訊是由於資訊太龐大,如何篩選我們需要的資訊是一種需求,而我們需要的資訊用一種什麼規則來表示呢?則需要機器學習來獲得標準,即符合這一標準的為需求資訊,不滿足這一標準的為無用資訊。
8樓:Sam Wang
目前所說的機器學習一般指統計學習方法,更有甚者稱為貝葉斯統計學習;而資料探勘則更偏向電腦科學中演算法,更偏向應用,例如資料庫等,這些都是機器學習不考慮的
資料分析 資料探勘與機器學習之間有什麼聯絡?
天堂之拳 看林軒田的機器學習基石。沒記錯的話第一周課就有講。資料分析,資料探勘,機器學習在研究上有一部分是重疊的,但側重點不同。舉乙個例子,資料探勘裡面,流資料是乙個很大的關注點,但在機器學習裡面研究的就相對較少。同理,資料探勘對統計學習理論也沒有機器學習關注的多。你再看資料探勘的教材,一般都有一章...
深度學習與機器學習的關係是什麼?
瘋貓子 沒有一種技術的發展是孤立的。開局一張圖 深度學習是機器學習的乙個重要分支,深度學習和機器學習的關係屬於繼承和發展的關係,其實不單單是這一分支如此,幾乎所有的演算法分支都是早期技術的重組 繼承 發展而來。如上圖所示,我大致把這些技術的繼承發展關係用導圖的方式進行展示,圖中沒有標註顏色的都是發展...
做機器學習或者資料探勘中,資料往往會有很多雜訊,一般消除雜訊的方法有哪些呢?
星辰大海 資料中含有雜訊的時候,機器學習演算法的效果通常會下降。那怎麼辦呢?現在有專門針對含雜訊振動資料的演算法 深度殘差收縮網路。其中,軟閾值化是深度殘差收縮網路能夠處理含雜訊資料的關鍵。不僅如此,閾值也不需要人工來設定,是用乙個專門的子網路自行設定的。 Sam Wang 目前機器學習主要是統計學...