邏輯斯蒂回歸能否解決非線性分類問題？

1樓：

說句題外的，很多資料沒有我們想象的那麼複雜

比如手寫數字識別。我以前一直覺得這種問題要解決應該至少會用人工特徵提取(做做sift啥的)或者神經網路或者kernel machines或者最近鄰這些表達能力比較強的方法。後來發現用邏輯斯蒂回歸直接硬搞也能把錯誤率控制到7.

5%左右

在mnist資料集上。輸入就是784個畫素點灰度值。然後線性的方法分對了92%。想想感覺挺有意思的。

2樓：王贇 Maigo

可以，只要使用kernel trick。

不過，通常使用的kernel都是隱式的，也就是找不到顯式地把資料從低維對映到高維的函式，而只能計算高維空間中資料點的內積。在這種情況下，logistic regression模型就不能再表示成的形式（primal form），而只能表示成的形式（dual form）。忽略那個的話，primal form的模型的引數只有，只需要乙個資料點那麼多的儲存量；而dual form的模型不僅要儲存各個，還要儲存訓練資料本身，這個儲存量就大了。

SVM也是具有上面兩種形式的。不過，與logistic regression相比，它的dual form是稀疏的——只有支援向量的才非零，才需要儲存相應的。所以，在非線性可分的情況下，SVM用得更多。

3樓：

自己組合特徵唄，廣義線性模型是說不會自動去組合特徵，模型是死的，人是活的啊，你自己根據業務特點，處理一下唄，完全無腦化了還要你幹啥啊……

4樓：

當然可以，可以使用kernel進行變數轉換，然後再去擬合lr

但是和svm是不一樣的，svm使用kernel不容易過擬合，而lr更容易過擬合。因為在lr裡面vc dimension是隨變數數線性增長的，而在svm中vc dimension隨變數數對數級增長

5樓：楊超

只用原始特徵不能

對特徵做非線性變換比如kernel 當然可以但那就不是lr了或者乙個神經網路最後一層看成是lr 前面看成是提特徵

lr的應用場景主要是特徵很多的情況下比如特徵是上億維的一些場景

邏輯斯蒂回歸能否解決非線性分類問題？

如何優化邏輯回歸 logistic regression ？

Bigbang2023年能否全員回歸，能否重造巔峰？

斯卡蒂和銀灰都是物攻面板怪。為什麼斯卡蒂天天被乳而銀灰依然被稱為幻神

其他用戶還看了：