機器學習應該準備哪些數學預備知識?

時間 2021-05-05 13:11:59

1樓:曾經的假設

線性代數不夠,要學矩陣論;

微積分不夠,要學數學分析;

其實真要急著應用,可能只需要看矩陣求導這一部分。

另一門最最重要的課是概率統計,或者概率論。

PRML對於概率、變分等數學基礎會提到,但基本不夠,有需要另行自學。

我只是大學生,請當作我寫給自己看的。。

2樓:雷明

主要用到了下面的知識:

微積分,包括一元微積分和多元微積分(這裡的不少內容除非是學過《學習分析》的學生,否則都是沒有接觸過的)

線性代數與矩陣論(矩陣論主要是矩陣相關的數值計算,矩陣分解)概率論最優化方法

資訊理論隨機過程

圖論這裡的很多知識是大部分理工科本科生不曾學過的我寫的《機器學習的數學》(人民郵電出版社,2021.01)有系統的講解。這是目前為止對機器學習的數學非常精準、清晰的講述

3樓:

線性代數基礎

概率論基礎

數值計算基礎

就差不多了,下面的這個網頁寫的很不錯

4樓:小心假設

Linear Algebra and Optimization for Machine Learning

Linear Algebra and Optimization for Machine Learning - A Textbook | Charu Aggarwal | Springer

5樓:

可以關注MIT 18.065 Matrix Methods in Data Analysis, Signal Processing, and Machine Learning

基本是對機器學習數學的乙個梳理,Gilbert Strang上課傳送門:https://

6樓:iznauy

微積分線性代數

矩陣論概率論與數理統計

凸優化上面是最基礎的內容,在機器學習中用的非常廣泛,需要深入學習。

此外,周志華老師那天上課時候說,其他方面的數學知識越多越好,廣度 >> 深度。

7樓:ICOZ

凡是給你推薦幾本書的基本都是害你的。還都是國際經典教材,隨便一本都夠你學幾年了。

這個領域壓根就不是這樣學的。先快速入門,接著就能做東西。想搞research就找某一方向深入研究然後慢慢充實自己的數學知識,按需學習。

不想做research的話就更不用了。捫心自問,deeplearning各種花哨的模型有幾個是真的需要很多數學知識才能看懂的。

也不知很多答案是故意害人還是本身就不懂。

8樓:IseesI

說一下我自己淺顯的見解吧,主要涉及三個方向:

1. 概率論,尤其貝葉斯

2. 線性代數

3. 優化演算法,如凸優化

雖然我也沒系統學過

9樓:

線性代數矩陣乘法熟了然後矩陣的gradient和hessian數理統計就普通大學對的概率論和數理統計足以補一下Hidden Markov

沒必要像一些回答說的把什麼convex optimization也看了

什麼實分析什麼泛函

邊學邊看就得了

uiuc ml給的prerequisite裡只要求資料結構線代和概率論

機器學習一大部分都在算概率和保證convex。。。講真像數學差不多了

10樓:造數科技

造數-新一代智慧型雲爬蟲

機器學習當然少不了各種優化演算法啦!下面介紹其中乙個典型的一階演算法:

自我介紹:

梯度下降法通常也稱為最速下降法,常用於機器學習和人工智慧當中用來遞迴性地逼近最小偏差模型。梯度下降法以負梯度方向為搜尋方向,沿梯度下降的方向求解極小值,越接近目標值,步長越小,前進越慢。

迭代公式:

其中 為步長。

先問是不是,再問為什麼:

:為什麼用梯度下降法能收斂到極值?

:學渣請看這裡:

:學霸請看這裡:

梯度下降法在機器學習中的應用:機器學習的三個步驟:

假設我們現在已經有了幾組已經完成訓練的函式,現在我們嘗試利用梯度下降法完成步驟3,在幾組函式中挑選出最好的乙個。在這我們利用損失函式(Loss Function)衡量每組引數的好壞,簡單起見,我們先考慮僅有乙個引數的情況:

我們考慮損失函式 只與引數 有關,選取合適的學習速率 ,以及初始點 ,通過上面的分析我們可以發現 的下乙個迭代值在其右側,接下來重複上述步驟,直至找到乙個區域性極小值。這樣我們就得到了最優的引數 使得總偏差量最小。

舉個栗子

利用梯度下降法尋找小火龍顏值最低點:

顏值函式:

選取初始值,等級 時。選取步長 。利用公式:

可以得到:

, 同理:

, , ...

可以看到只迭代了4次就十分逼近正解啦

( ̄▽ ̄")

11樓:mileistone

1、線性代數和矩陣理論,具體到機器學習裡面就是線性變換,svd之類,pca和lda都會用到;

2、高等數學,具體到機器學習就是求導,鏈式法則,積分思想等等;

3、優化理論,有兩本書不錯《Convex Optimization》和《Numerical Optimization》,具體到機器學習就是給定目標函式,求解引數的過程,什麼拉格朗日乘數法,對偶問題,kkt條件,梯度下降法,牛頓法,擬牛頓法等等。

4、概率與統計,機器學習的模型多與概率,統計有一些關係,比如概率圖模型。

這是最基礎的,其他要用到的數學知識,碰到了再去學。

12樓:熊本一身白

簡單說是按需學習,如果連sklearn包裡中最常見的模型調參都不會,然後去啃各種複雜的公式,然後感覺太難了,不學了。

你說只是為了訂個釘子卻抱著一本教你如何製造錘子的書,是不是有點兒大材小用了。

當然,如果要高階或者做data engineering的工作,數學和統計就特別重要了。

13樓:Xiecheng

簡單答一下。

想要入坑機器學習/深度學習,需要的數學知識可以參考各個大學本科數學/統計的教學大綱。

按順序來基本上是:

高等代數

數學分析

概率論回歸分析

多元統計分析

學習高代數分對理解各種演算法是很有必要的。概率論回歸多元偏統計分析那一塊,可以培養些統計的思維。

非科班的來說可以我建議至少高代和概率論是需要精讀的,其他幾門課可以泛讀或者跟著網上課程過一遍。

有一本書可以推薦給大家,The Elements of Statistical Learning。網上有作者們放出的免費電子版,前段時間定期都會有更新。

14樓:無所不能的小裁縫

機器學習理論統計學、概率學電腦科學以及演算法的交叉領域,是通過從資料中的迭代學習去發現能夠被用來構建智慧型應用的隱藏知識。儘管機器學習和深度學習有著無限可能,然而為了更好地掌握演算法的內部工作機理和得到較好的結果,對大多數這些技術有乙個透徹的數學理解是必要的。

機器學習中的數學是重要的,有很多原因,下面強調其中的一些:

1. 選擇正確的演算法,包括考慮到精度、訓練時間、模型複雜度、引數的數量和特徵數量。

2. 選擇引數的設定和驗證策略。

3. 通過理解偏差和方差之間的 tradeoff 來識別欠擬合與過擬合。

4. 估計正確的置信區間和不確定度。

需要重視的數學內容:

1. 線性代數:

在機器學習領域,線性代數無處不在。主成分分析(PCA)、奇異值分解(SVD)、矩陣的特徵分解、LU 分解、QR 分解、對稱矩陣、正交化和正交歸一化、矩陣運算、投影、特徵值和特徵向量、向量空間和範數(Norms),這些都是理解機器學習中所使用的優化方法所需要的。

2. 概率論和統計學:

機器學習和統計學並不是迥然不同的領域。事實上,最近就有人將機器學習定義為「在機器上做統計」。機器學習需要的一些概率和統計理論分別是:

組合、概率規則和公理、貝葉斯定理、隨機變數、方差和期望、條件和聯合分布、標準分布(伯努利、二項式、多項式、均勻和高斯)、時刻生成函式(Moment Generating Functions)、最大似然估計(MLE)、先驗和後驗、最大後驗估計(MAP)和抽樣方法。

3. 多元微積分:一些必要的主題包括微分和積分、偏微分、向量值函式、方向梯度、海森、雅可比、拉普拉斯、拉格朗日分布。

4. 演算法和複雜優化:這對理解我們的機器學習演算法的計算效率和可擴充套件性以及利用我們的資料集中稀疏性很重要。

需要的知識有資料結構(二叉樹、雜湊、堆、棧等)、動態規劃、隨機和子線性演算法、圖論、梯度/隨機下降和原始對偶方法。

5. 其他:這包括以上四個主要領域沒有涵蓋的數學主題。它們是實數和複數分析(集合和序列、拓撲學、度量空間、單值連續函式、極限)、資訊理論(熵和資訊增益)、函式空間和流形學習。

一些機器學習的痴迷者是數學新手,看了這些後可能會比較失望。對於初學者而言,其實你並不需要很多的數學知識就能夠開始機器學習的研究。你可以在掌握更多的技術和演算法的過程中學習數學。

15樓:doddle

著重看反向傳播演算法中使用的鏈式法則,另外對矩陣乘法規則好好摸索吃透基本上就差不多了,至於什麼貝葉斯,奇異值分解什麼的可以慢慢來

16樓:

我姑且理解題中的機器學習是指統計機器學習。

首先你要了解函式,函式的奇偶性,收斂性。乙個不收斂的模型是無法做優化的。

其次你還要了解極限,數列,微積分。

然後是向量,矩陣,矩陣的內積,範數,秩,矩陣的求導和運算,矩陣的正定性。

概率統計上你要了解條件概率,先驗概率,後驗概率(貝葉斯),期望,方差,二項分布,泊松分布。

基本上都是高中到大學的基礎。有了這些基礎你去看數學分析和優化的書基本上沒什麼難度。

17樓:wellhor

一些評價函式是用概率統計的思想給出的,因此概率統計是必須的。

一些資料計算(特別是影象)是矩陣運算,因此線性代數或者高等代數或者矩陣理論要學乙個,線代最簡單,其實大致也夠用了。

要計算極值,基本上採用梯度下降的方法,因此多元函式求導要掌握,這部分在高數中。

機器視覺需要學習哪些數學知識?

機器視覺MV和計算機視覺CV是有區別的,機器視覺面向工業應用獲得影象中目標的幾何資訊 尺寸 面積 有無 位姿等 機器視覺的工程應用並不需要太多數學知識。而計算機視覺需要通過模式識別和概率統計等基礎。機器視覺中,僅僅是影象的儲存與矩陣相似而已。由於他的主要目標是獲得幾何資訊,更多的是畫素數的加減乘,以...

有哪些些數學理論很強的機器學習資料?

Dixit 給你推薦一本張賢達的 矩陣分析與應用 看過的人都說好https zhuanlan p 94805436 塵迪 非常推薦 PRML Pattern Recognition and Machine Learning 中文版名為 模式識別與機器學習 我讀過的若干機器學習書籍中,數學理論非常深的...

機器學習中用到哪些矩陣知識,如果要補這些知識,求推薦合適的書籍資料?

如果就是做應用系統,大概一般的線性代數書就夠了,比如 Horn的矩陣分析,如果要往深入走一走,可能就要用到點矩陣流形和李群的東西了,因為這個網路優化實際上是在流形上完成的,需要從這個角度去理解和分析。 1.Artin的algebra 2.lax的線性代數 3.hoffman的線性代數 4.Golub...