KNN演算法中的K用什麼方法確定?

時間 2021-05-05 15:20:54

1樓:凱家的梧桐

K值選取過小,容易使得模型變複雜,從而過擬合;

K值選取過大,使得分類結果收到較遠點的影響,從而會讓分類誤差增大;

綜上所述,K值不宜過大也不宜過小,選取最優的K值可以通過K折交叉驗證等方法實現,設定分類準確率的閾值,達到閾值的K值往往分類效果還不錯。

2樓:牛博

k本身沒有特定的取值,但K值對結果影響大(試想一下K=1和K=N的極端情況),但一般情況下,K的取值不宜過大,使用交叉驗證確定,可以選取不同K值下的結構風險做比對,最後挑選最接近期望風險的K值即可。

3樓:nash zhou

除了上述方法外,李巨集毅老師的課程裡還提到了可以使用層次聚類HAC方法,另外以前還了解過乙個Canopy演算法,通過設定距離來確定類別數,這兩個都可以試試。

4樓:Sigma

一般取的K能使誤差收斂即可。至於收斂的具體含義,可以自己根據需要定義。比如loss function小於某乙個值即終止,或是第n次和第n+1次的loss不再有顯著區別的時候終止等。

5樓:Zmax

吳恩達的機器學習課程中,有乙個方法。就是嘗試不同的k直,然後把誤差對應k值的圖畫出來。一般k值越大,平均誤差約小。如果圖有明顯的拐點,那麼這個點對應的k就是乙個比較合適的k值。

具體可以參考吳恩達的課程。

實現《演算法導論》中的習題,用什麼語言比較好

姚鋼強 首先明確的是如果你還不熟悉任何一門程式語言,看這本書適不適合你的。因為演算法在沒有程式設計能力的前提下就是廢物。所以用你熟悉的語言去寫這些演算法,目的是學習演算法,而不是糾結於語言。 孫立 我當年是用Turbo Pascal練的,我覺得即使今天應該也還是乙個不錯的選擇。依我看用資料結構比較簡...

現代工程中測距離是用什麼方法?

V.BOK 也就用過全站儀,在鋼結構工程中測測水平啊,垂直啊距離啊什麼的,全站儀功能很多,用上的卻很少,軟體因為公司沒買所以也沒用 吐槽下,真黑啊,機器30萬,用他們的軟體每年還另收10萬,這是聽說的,這是僅次於萊卡精度為05的日貨 得出資料後基本考高中幾何和初中代數算結果,點多時候也用CAD。在剛...

大一計科生,可以用哪些方法提高自己的演算法水平?

日系少女豆瓣醬 現在大一下,老師在講資料結構,有時會涉及演算法。我覺得有些演算法很難懂,但是懂了之後就會覺得很有趣,感覺計算機思維真的有改變我對世界多思考方式啊。題主才剛剛大一下就對於演算法如此感興趣,真的是非常適合電腦科學與技術這個專業了,畢竟興趣才是最好的老師,有了興趣作為驅動力,不僅在學習的過...