資料探勘中,如何降維

時間 2021-06-05 18:18:14

1樓:唐申庚

我對資料探勘了解的也不多,單就對機器學習方面的認識來說,資料探勘任務中的降維主要針對的是降低特徵維度,而非降低樣本數量,不然就沒有意義了。為了降維,一般有兩種顯而易見的做法,一是特徵選擇,二是特徵嵌入。

相對來說,特徵選擇在資料探勘任務中使用更加簡單普遍一些,相當於是一種下取樣。特徵選擇其實就是在所有特徵資料中選擇出乙個或多個特徵子集,這些特徵應該是盡可能的有效服務於分類或者聚類等任務。特徵選擇一方面可以降低緯度,減小計算量;另一方面還可以篩選出有效特徵,避免大量冗餘資訊帶來的負面影響。

特徵嵌入是將資料轉換為固定大小的特徵表示,以便於處理和計算。特徵嵌入時,可以將高維資料對映到低維空間,在降低維度的同時,可以盡可能的多保留原有資訊,這一點與簡單粗暴的特徵選擇來說,可以說人性化的多;當然顯而易見地,這個過程也位元也選擇複雜一些。

2樓:悟冥

blog.csdn.net/abcjennifer/article/details/8002329機器學習之特徵工程-降維

各類降維方法總結

3樓:Jimmy

資料降維、特徵降維

資料不需要大,足夠就好了

特徵不需要多,好用就好了

訓練模型時,本人一般先用較大的資料量訓練乙個baseline模型通過觀察學習曲線可以得到模型大概需要多少資料至於特徵,特徵選擇了解一下

資料探勘模型優化中,Precision,Recall,F值這三個指標應該優先優化哪個?

霸天虎 和場景無關,意味從本質來分析。P和R都很高,是非常正常的,因為這與資料分布有關。此時,F值接近 1 1 a平方 2,不是越大越好。 如果 class balanced 的話,可以選擇優化F值 如果 class imbalance,看 positive 的資料量,如果資料量大的考慮用 prec...

資料分析如何轉資料探勘?

位元組Funk飛 資料分析如何轉資料探勘?雖然這二者都是直接根據接觸的職業,但是對於資料的處理和跟資料的關係還是有著很大的去唄的,資料分析師針對已有的資料進行不同的模型構建然後分析,將有價值的東西提取出來,但是資料探勘呢,只是單純的資料探勘,是一種資料收集和提取的過程 我之前也是資料分析,感覺沒什麼...

如何系統地學習資料探勘?

冰糖葫蘆 找Stanford cmu cornell upenn uiuc gatech等等這些有煙火氣的世界頂尖高校的Data science的培養計畫和課程說明,綜合一下你的想法,學就行了。可以去上學,也可以coursera 有TA 可以YouTube ocw上學等等。皇天不負有心人。 jona...