構造特徵時,構造與目標變數相關的聯合特徵是否有意義?

時間 2021-06-05 03:07:50

1樓:ADAM

有意義;這就是target encoding,資料探勘競賽中常用。至於能否學到,個人感覺,在樹模型中,對於低基數特徵(小於等於3),模型自身就能學到這個關係,不需要target encoding;對於高基數特徵,可以去嘗試target encoding;

此外,用訓練集得到目標標籤這句話是不嚴謹的。對於訓練集樣本而言,要保證每一條資料的自身標籤不參與這條資料的target encoding編碼。一般五折交叉驗證模型,會用另外四折去encoding 剩下一折防止洩漏。

2樓:零天

有意義。

這不就是推薦演算法中的ctr嗎。

提前知道某個分組的先驗概率,是非常有意義的。

其實這種思想在生活中很常見啊。

不同年齡性別的人得某種疾病的概率大不相同,醫生對於某種症狀的懷疑就大不一樣。

最簡單的例子,對於育齡女性不明原因腹痛很多醫生都要先查懷孕。

3樓:zpeng

題目沒讀懂。

性別比例?你輸入的是每乙個患者吧,直接輸入分類特徵就好了,最多用啞變數解決,不需要算比例,如果你都算好比例直接fisher檢驗說性別與得病的顯著性差異就好了。

是否學會是兩種,一種是因果效應,一種是表現效應。類似夏天溺水人多,吃冰欺凌人多,但溺水和冰淇淋兩者之間沒有因果關係,但你構建模型是會權重加大的。所以多匯入特徵還是有效果的。

差動電容感測器的構造與普通電容器的構造有何區別 它有哪些優點

Steven Yang 電容式電感器的電容量 與真空介電常數 極板間介質的相對介電常數 極板有效面積 以及極板間的距離 有關,即 極板間介質的相對介電常數 極板有效面積 以及極板間的距離 三個引數中任意乙個發生變化時,會引起電容量的變化,可以通過測量電路轉化為電量輸出獲得變化情況。因此電容式感測器可...

C 的建構函式與析構函式?

關於C 的問題,你的心中要有兩個概念,乙個是記憶體的分配,二是記憶體的初始化。C 的建構函式有兩個作用 第一,你必須要有乙個建構函式,compiler才會去給你分配記憶體。第二,分配了記憶體之後,再用建構函式去初始化記憶體。函式體為空,因為類中的每乙個成員都有預設建構函式和析構函式 否則是無法編譯的...

這些t與r的構造是怎麼想出來的?

首先講結論 我們要創造 和 的距離,所以有了 我們只需要在這個距離裡面找出乙個有理數就解決問題了,這個有理數需要比 大一點,這個一點就是 為了讓 我們構造出了 的形狀 其實我們知道這個sup是 那麼乙個有理數 不會成為這個sup的根本理由就是,這個有理數和 有距離。我們要表達的就是這個距離,而這個距...