如何評價Hinton組的新工作SimCLR

1樓：kkkk

我自己復現的simclrv1，batchsize開到4096(上了apex fp16)的情況下100和200個epoch結果都比原文高1200個epoch結果還比mocov2好那麼一丟丟（67.8）.....

2樓：

Dear Hinton:

I reached sota in this self-supervised learning task, please allow me to cooperate with you to further enhance this result.

Sincerely, Ting

3樓：肖春陽

說個題外話。感覺文章投到了icml。

不管文章好壞，我覺得大佬們這樣做真的不太厚道，審稿現在還沒結束。放出來帶一波流量無非就是給審稿人壓力讓他收你的文章。

4樓：akkaze-鄭安坤

感覺利用dataaug生成不同view的方法然後在latent space裡相互吸引和遠離確實是乙個好點子，很像triplet，用影象對比來做自監督，思想也早已有之，只不過中繼監督用到了特徵圖上，而這又和蒸餾很像。

換乙個思路，加正則化，在保持有效寬度和深度的同時減少有效參數量會不會也是乙個好的方法。這讓我想起來tridentnet，以及流形上的卷積網路（試圖建模卷積網路的各種不變性），發現cnn在影象上的內在不變性也許也是個好方向，能讓cnn收斂的更好更快。

我做過類似的工作，稀疏化乙個cnn的kernel，完成後把這些稀疏化的mask記錄下來。然後重新訓練，但是mask依然存在，收斂速度能提公升不少（這意味著保留深度寬度，但是有效引數更少的網路收斂更快）。我相信發現內在對稱性的工作一定更有意義。

但確實不是一件好做的工作。

5樓：王越

調實驗不work的間隙來簡單回答一波。科研意義不大，實際(工程)意義非常大。

過去一年來，相繼有cpc, cmc, moco出來，想要解決的共同乙個問題就是，如何提高softmax中negatives的數量。其中cpc用了patch based方法，cmc用了乙個memory buffer，moco用了momentum update去keep乙個negative sample queue。這篇文章告訴大家，只要機子夠多，batch size夠大，每個batch中除了positive以外的都當negatives就已經足夠了。

基本就是暴力出奇蹟的典範，不看作者列表以為是quoc le做的 (手動狗頭)

如何評價Hinton組的新工作SimCLR

如何看待華晨宇新工作室成立以來的表現？

如何快速適應新工作，消除自身自卑感，找到自身價值？

如何評價櫻花漢化組？

其他用戶還看了：