學習中的interleaving和deliberate special practice是否矛盾?

時間 2021-05-12 16:00:08

1樓:薩蘭格爾

以下僅為個人感受。這兩種學習策略的目的都是在相同時間內學習更多的東西。假設有乙個知識的學習難度由兩個維度定義,學習所需的專注程度(取值為0%~100%)和所需的時間。

一定程度上,提高專注度會減少學習所需的時間,但這是有限度的。有些學習對於專注度更敏感,提高專注度能大大減少所用時間,有些則對於時間更敏感,無論多麼專注地學習,總要達到一定的時間才有效果。並且每個人對不同學習任務能夠專注的持續時間也是不同的。

例如學習開車,我大概最多能專注乙個小時,如果突擊地一天學8小時,我大概會崩潰的。這樣的學習就適合與別的任務穿插進行。還有例如讀一些有關軟體工程實踐的資料,需要的專注度比較低,我可以同時閱讀多種相關實踐,這樣的閱讀也有助於模擬,對比學習。

有些學習較為複雜,需要持續專注投入達到一定的閾值才能掌握。對於我來說,學習乙個新的演算法就是這樣的任務,我需要非常專注的學習幾個小時才能有基本的理解,然後還要持續幾天的練習才能真正掌握。

當然對於某些更加困難的學習任務,儘管專注,也需要很長時間才能學會,那麼這時就需要兩種策略都用,專注直到達到瓶頸,暫時放下,換另乙個學習任務,這樣交替進行。這時session時間會設定的較長,區域性來看是專注學習,長期來看是交替學習。

英語學習中語法的糾結?

唔,那你試著分析一下你這問題描述的語法結構?是不是感覺毫無意義?嘛,本來就是沒什麼意義的東西 這個純粹是你自己的糾結,只能你本人看開了 此間的少年 從最簡單的開始 主謂賓,主係表,英語的句子都是從這兩個簡單句演變而來,所謂句子成分也就是,差不多相當於人穿的外衣,首飾,出門在外,肯定要打扮一番,往上面...

強化學習中的reward function為什麼要取期望?

首先明確三個不同的概念 reward,return 和 value。Reward的定義為 每個狀態下執行action後立即 從系統以外的環境 獲得的評價性響應,必須直接對應RL學習的最終目標。Return的定義為 累積的未來reward。式中含有衰減係數 Value的定義為 從狀態 開始,一直遵循p...

深度學習中 number of training epochs 中的 epoch到底指什麼?

小島上的黑桃六 1 epoch batch size step sample size 1 batch size samplesize batch num 1次 epoch 計算 1次Loss 為後續迭代進行引數修正 1次 step 更新一次 params 對應計算 optimize functio...