做機器學習或者資料探勘中,資料往往會有很多雜訊,一般消除雜訊的方法有哪些呢?

時間 2021-06-07 18:29:27

1樓:星辰大海

資料中含有雜訊的時候,機器學習演算法的效果通常會下降。那怎麼辦呢?

現在有專門針對含雜訊振動資料的演算法:深度殘差收縮網路。

其中,軟閾值化是深度殘差收縮網路能夠處理含雜訊資料的關鍵。不僅如此,閾值也不需要人工來設定,是用乙個專門的子網路自行設定的。

2樓:Sam Wang

目前機器學習主要是統計學習模型,資料量大,regression時受雜訊的影響就小,因為雜訊資料相對少而已。

但是多大對資料算是「足夠大」呢?

資料分析 資料探勘與機器學習之間有什麼聯絡?

天堂之拳 看林軒田的機器學習基石。沒記錯的話第一周課就有講。資料分析,資料探勘,機器學習在研究上有一部分是重疊的,但側重點不同。舉乙個例子,資料探勘裡面,流資料是乙個很大的關注點,但在機器學習裡面研究的就相對較少。同理,資料探勘對統計學習理論也沒有機器學習關注的多。你再看資料探勘的教材,一般都有一章...

資料探勘與機器學習是什麼關係?

郭斯特 機器學習通過演算法讓計算機通過以往的經驗來改善其效能。資料探勘從資料中發現模式並加以利用。所謂 以往的經驗 當然也是以資料的形式存在的。要想改善效能,當然也要先發現模式才行。兩個領域高度相關。區別嘛,資料探勘更重視實際應用,採用系統化的方法來綜合使用各種機器學習演算法 拿來就用,不管理論 期...

有哪些好用的機器學習和資料探勘工具?

BattlesNeo 免費的免費的 Rapid Miner IBM SPSS Modeler Oracle Data Mining Teradata Framed Data Kaggle Weka Rattle KNIME Python 謝冬梅 Daily Life imblearn,albumen...