機器學習 優化理論 統計分析 資料探勘 神經網路 人工智慧 模式識別之間的關係是什麼?

時間 2021-05-06 19:57:17

1樓:騫騫狗

一文告訴你:統計學、資料探勘與機器學習的區別 - 騫騫狗的文章 - 知乎 https://

zhuanlan /p/61824761

感覺寫的很好,從根本上區分了統計學、資料探勘與機器學習的區別,適合對資料處理這門學問一點不了解的人看。相信你會有所收穫

2樓:Mellisacat

只有統計是理論科學(science),其他都屬於 engineering (工程學). 統計是science about probabilities. 只要是可以把具體問題總結成乙個關於 probability的數學命題,嚴格的說,理論上都是屬於統計學的範疇。

比如優化,無非是定義目標函式,定義loss, 定義 contraints, 然後求在此基礎上 maximize utility, minimize loss 並且不trigger constraints 的乙個數學命題的應用。機器學習也是統計理論的乙個延展。所謂 training and prediction, 都是選擇最大可能,衡量 disc measure, 以及進行其他優化。

骨子裡還是概率。理論最大的優點是知其一而知所有。最大的缺點則是推進過程緩慢, low hanging fruits 被18,19世紀的老爺子們摘掉後,要有什麼大突破,真的是很難很難。

所以在解決實際問題的時候,在缺乏理論基礎的時候,就有了unsupervised learning,和其他所謂的numerical methods ,都是基於概率理論的一些技巧。Deep learning 接觸不深,但總感覺經驗主義深重,以至於這麼熱的話題,學術界少有開課。

個人見解,統計出身,不喜勿噴。

3樓:

What is the difference between data mining, statistics, machine learning and AI?

4樓:霍華德

在台灣大學的機器學習基石裡,林老師講過這個問題:

機器學習:用資料計算假設g,用於逼近目標f。

統計:使用資料對未知過程做出推測。

人工智慧:計算出一些具有智慧型行為的東西。

如果我們目標f是實現某種具有智慧型行為的東西,那麼機器學習是實現人工智慧的一種途徑。

資料探勘:使用大量資料,發現資料裡有趣的資訊。

如果有趣的資訊等於用假設逼近目標,那麼機器學習就是資料探勘。

如果有趣的資訊和用假設逼近目標有關,那麼資料探勘可以幫助機器學習。

傳統的資料探勘同樣還專注於大資料的高效計算。

但在實際情況中,資料探勘和機器學習,很難區分。

5樓:張小磊

以機器學習為中心點來回答這個問題。

機器學習是人工智慧的乙個分支;

神經網路是機器學習演算法的乙個分支;

統計分析是機器學習的乙個基礎;

機器學習與資料探勘、模式識別分模擬較模糊,三者偶有交叉。

6樓:嘉慧Lincoln

統計學最古老,底子最厚。

人工智慧略早於機器學習。

資料探勘出現最晚。

統計學、機器學習和人工智慧三者相互依賴,資料探勘是三者的應用。

7樓:Wheel

用錘子打個不嚴謹的比方:

資料探勘的內容就是,怎麼用已經生產出來的錘子,去釘釘子。(用各種各樣的演算法,去從資料中發現知識);

機器學習的內容就是,什麼樣的錘子可以釘什麼樣的釘子,怎樣讓錘子用起來更順手。(研究演算法,提高效率);

統計學習的內容就是,按什麼樣的標準造出來的錘子更好用,怎樣把錘子造得更符合標準。(發展模型,跟機器學習有很大重疊);

模式識別和機器學習差不多,一枚硬幣的兩個面。

8樓:

我把我部落格(從機器學習談起)裡面的一段文字複製過來:

其實,機器學習跟模式識別,統計學習,資料探勘,計算機視覺,語音識別,自然語言處理等領域有著很深的聯絡。

從範圍上來說,機器學習跟模式識別,統計學習,資料探勘是類似的,同時,機器學習與其他領域的處理技術的結合,形成了計算機視覺、語音識別、自然語言處理等交叉學科。因此,一般說資料探勘時,可以等同於說機器學習。同時,我們平常所說的機器學習應用,應該是通用的,不僅僅侷限在結構化資料,還有影象,音訊等應用。

在這節對機器學習這些相關領域的介紹有助於我們理清機器學習的應用場景與研究範圍,更好的理解後面的演算法與應用層次。

下圖是機器學習所牽扯的一些相關範圍的學科與研究領域。

圖機器學習與相關學科

神經網路是機器學習中的乙個演算法,跟SVM(支援向量機)齊名,同時也是深度學習的基礎。深度學習實際上就是多隱層的深度神經網路。

9樓:林達

相互之間關聯在一起,有些應用領域所代表的含義是一樣的,這裡我想引用台大機器學習課程中老師所講的這些概念相互之間的區別,具體如下:

ML與DM之間的關係

機器學習是從假設空間H中尋找假設函式g近似目標函式f.

資料探勘是從大量的資料中尋找資料相互之間的特性ML與AI之間的關係

人工智慧是一種應用領域,機器學習是實現人工智慧的一種手段,但是不限於此。

ML與統計之間的關係

統計的方法可以用來機器學習,比如:聚類、貝葉斯等等,當然機器學習還有很多其他的方法,如神經網路(更小範圍)、SVM

模式識別也是乙個應用領域

10樓:

自己的觀點,不一定對。機器學習和統計分析的哲學不一樣,比如前者用最大似然估計,後者會說它不是無偏的,但人家說自己是結構風險最小化壓根沒跟你扯統計量。神經網路是機器學習的一種建模方法,是機器學習裡的小哲學,不扯多了。

模式識別與資料探勘用機器學習的模型解決,當然也用統計分析的模型,當然這些詞的區分現在都不大了。人工智慧還可以基於解空間的搜尋來做,機器學習可以作為它的一部分(那只要是能代替人工解決問題的統計方法也可以作為人工智慧的一部分?)。

11樓:媯晁

我覺得模式識別和機器學習這兩個是這樣的關係,模式識別更偏向於應用,比如是針對具體的人臉、文字、語音或者其他問題進行針對性的研究,而機器學習更偏重的是方法,不是針對某個具體問題而是對於整個流程或者流程中的某一部分做通用的演算法研究。

12樓:張昊

機器學習、統計分析、資料探勘、神經網路、人工智慧、模式識別,很難說誰包含於誰,只能分開說每乙個概念的意義,誰服務於誰。

資料探勘是一種概念,從資料中挖掘到有意義的資訊。

很多人認為資料探勘是新學科,是基於大資料,其實不然,如果給你乙個資料說李嘉誠有100多億美元,再給你乙個資料是全國平均人均可支配收入水平是13279元人民幣,你能挖掘出乙個資訊叫,李嘉誠很有錢,這也是資料探勘。只不過很小白而已。

模式識別是目的,識別出一種模式,比如兩個眼睛乙個鼻子的是人臉的模式。如果不通過電腦,手工的通過計算來識別模式,也屬於模式識別

機器學習是一種方法,通常用來進行模式識別,用機器去學習不直觀的資料得到模式,這其中會需要用到各種各樣的知識,比如統計分析的知識。

人工智慧,這個概念就大了,這個概念是想要人工製造出和人類一樣的智慧型,所以很多人就想出了機械人這麼乙個科幻產物,有人類的智慧型,並且依託於機器的強大運算能力。事實上,人工智慧也不一定要和電腦掛鉤的,只不過現在只有電腦有這麼強大的計算能力,如果有一天生物科技能夠突破,說不定也能實現。(純屬YY)

神經網路,這是學習演算法中的乙個很火的模型,它號稱結合了多學科,模擬了人的神經過程,是很好的一種學習方法,可以說這個是基於統計學範疇的。

有什麼疑問再問我~

Python多元統計分析的求資源 網上的資料分析資源大多都是騙人的。

Cooper 最近發現一本好書 Python資料分析基礎第二版 阮敬 這裡面就是講的統計,挺全的 我是做統計的,想用Python進行統計分析。描述性分析 差異性分析 T檢驗 方差分析之類 回歸 主成分 因子分析。我查詢了很多python庫,其中相關的是scipy和statsmodels這兩個,但是這...

ArcGIS地統計分析中克里金插值是哪種克里金插值法?

Esri北京研發中心 ArcGIS有兩種克里金方法 普通克里金法和泛克里金法。普通克里金法模型具有五種可用的半變異函式。泛克里金法模型具有兩種可用的半變異函式。每個半變異函式都具有若干可設定的可選引數。普通克里金法模型半變異函式 Spherical 球面半變異函式模型。這是預設設定。Circular...

最近剛學多元統計分析,但是有點一頭霧水 多元統計分析應用到哪?什麼問題最適合使用多元統計分析?

多元統計分析一般是在學完數理統計學後學習.多元統計分析就是從一維到多維的乙個過程.在這之前的前置課程 數理統計學,一般是講估計和檢驗,但你應該注意到這些知識一般都是以一元的情況進行的.然而,現實世界變數更多時候是以多維的形式出現,因此多元統計分析便有其應用的價值了.多元統計分析會推廣一維數理統計的一...