機器學習,假如我有m組樣本,每組樣本有n個特徵,模型訓練的時候,應該輸入 m,n ,還是 n,m

時間 2022-01-23 08:33:05

1樓:三三玉

用scikitlearn的話,(m,n)

2樓:Berkeley

一般來說都是[m,n],行表示樣本數,列表示特徵,同樣的在NLP中,[batch_size,seq_length,hidden_size],都是類似的。

3樓:徐愛格

輸入(m,n),第乙個維度是樣本個數,第二個維度是特徵數。

4樓:Stark

具體要看模型接受什麼格式的輸入、、

5樓:小智智要變強哦

一般情況下n*m的矩陣,n都是sample,m是特徵,這是因為一般來說n>m,這種矩陣方便分解

6樓:三弦

一般而言大部分輸入的特徵矩陣都是行是樣本數量,列是特徵的維度(數量),也是(m,n)居多。

7樓:gebeile

應該是m行,n列!因為你後期的處理都是通過列操作比如無量綱化的歸一化和標準化處理,目的是想通過特徵學習達到一種目的,即使輸入n行m列,最後輸入模型時也要轉化為m行n列!

8樓:江南周公子

這個你看下所用庫的文件,就明白了。為了消除量綱,是對特徵列進行處理。

9樓:

這取決於你使用什麼工具,具體什麼格式,你讀一下文件吧。

這兩種情況我都碰到過,第一種比較常見。

10樓:ahak

一般的機器學習或者深度學習框架,行是樣本數,列是特徵。特徵變換,包括但不限於標準化,其他例如獨熱編碼,是對列進行操作。

11樓:小籠包

有些教程講詞向量時會用(n, m)的矩陣,可能因為句子是橫著長的? 實際使用還是都用(m, n)吧。

假如我有一千塊錢,該如何理財?

真可愛呀 1000塊太少了,理不出來什麼財的 就算收益10 一年也就100塊。但是收益10 的產品,門檻不會只有一千塊這麼低如果有的話,那必定是風險極大的,損失全部本金的可能也許比10 還要高 所以,給個很靠譜的建議 把這1000塊拿去批發點水果,拿到小區門口賣 風險是會損失全部本金,但是好歹還有水...

未來藝術表演者有可能被機器取代嗎(假如機器的技藝細節處理得和表演者一樣好)?

Phil 看具體演出形式和對品質的要求。比如說一些演出只是起到背景烘托作用,或者需要能精緻復刻,確保每次演出都能一模一樣的,像一些商業發布會上的演出,或者是廣告宣傳的演出,我覺得是可能被人工智慧取代的。但是一些強調現場體驗,甚至是沒有明確流程規定,帶有一定隨意和互動反應要求的演出,在我了解到的程度來...

如果HR問你,假如我沒有錄取你,那你接下來有什麼打算?

冬瓜大寶貝 HR問出這樣的問題,我認為可能是對於候選人的總體綜合評分較好,但在崗位匹配上有比較大的硬傷 也可能是看下候選人的靈活反應度或者適應韌性如何 最糟糕的情況就是為未來不錄取候選人鋪墊。從我個人經驗角度看,這個問題是不該問的。這會引起候選人的心理波動,可能會導致不必要的局面。也許暴露潛在問題是...