Spectral Clustering Kernel PCA等對新樣本如何進行顯式的變換?

時間 2021-06-06 18:13:52

1樓:Xenophon Tony

問題核心,如何得到新資料點的projection函式,我們稱它為 。

Spectral Clustering中Gram matrix特徵值分解得到的eigenvector,隨著資料量增多,可以converge到Kernel(linear operator)的eigenfunction,這個eigenfunction,是我們需要重點估計的,這裡稱為。

我們知道用Mercer theorem Kernel 可以表示為

也就是每個特徵值 對應的eigenfunction(特徵函式)啦。

訓練資料都是從 中取樣得到的,

這裡面 其實就是訓練資料Gram matrix特徵分解後的第k個eigenvector的第i個值。

得到了eigenfunction ,那麼接下來就是把它和前面我們提到的 對應起聯絡,不難得到(好吧其實沒那麼trivial,但略了)

這個時候新特徵 ,就可以拿去和之前spectral clustering中k-means得到的centroids進行比較以assign cluster咯。

其他如Kernel PCA,LLE同理。

Reference:

Spectral Clustering and Kernel PCA are Learning Eigenfunctions

Model3 降價到 24 9 萬對蔚來小鵬等新勢力有多大衝擊?隨著國產替代的提高,還剩多大降價空間?

楊若智 一句話結論 二十萬出頭買車,妹子喜歡比亞迪還是特斯拉?妹子連豐田 本田都看不上,會喜歡比亞迪漢唐和蔚來?你會買嗎?中國車企明明應該先做本田豐田大眾,總覺得自己他麼能賣寶馬的錢。35萬買蔚來,是腦子被汽車之家和蔚來銷售偷了。特斯拉做了這麼多年,是在控制成本,精細化生產的路上走。蔚來弄那麼多豪華...

如何看待體育總局暫停山地越野 戈壁穿越等新興高危體育賽事活動?

中國商報 不久前,2021黃河石林百公里越野賽 以逝去21個生命的慘痛代價收場。事故發生後,已有多項戶外運動賽事宣布延期或取消。越野賽作為具有挑戰性的運動賽事,也是各類事故隱患和安全風險交織疊加 易發多發的環節。悲劇的發生也在提醒著我們,應當反思中國越野跑賽事在組織中存在的一系列問題 對參賽者的資格...

如何評價2023年1月新番《五等分的新娘 第二季》?

吉時行楽 剛看完 五等分 第一二季。抱著一種複雜的心情來寫一下自己想說的話。首先我覺得這部番很好!好就好在他很現實。雖然最後不知道到底是誰和風太郎結婚了,但他還是告訴了你,最終風君選擇了五個人其中乙個。讓各位一二三四五股都漲了漲。但最後兩集的姐妹戰爭看得我乙個鋼鐵直男心塞。看到四葉說 我乙個人知道就...