如何定義 相似度 ?

時間 2021-05-31 23:22:03

1樓:wai

我想到一種相對簡單易理解的辦法,就是假定部分的相似度大致反映整體相似度。具體來說,先測量樣本人群每個人鼻尖相對面部的高度,然後計算標準差;測量樣本貓群每只貓的鼻尖相對面部的高度,同樣計算標準差。

因為人和貓塊頭不一樣,為了消除這一影響,可以把各自的標準差除以各自的體積(為了方便,可以用體重代替),最後比較所得數值大小。數值大的相似度低,數值小的相似度高。

雖然這其中也有問題,比如鼻尖相對面部的高度如何嚴格定義。

其實「鼻尖相對面部的高度」也可以用其它幾何屬性替代,比如鼻子的寬度,鼻小柱跟人中的夾角,鼻樑相對面部的夾角,鼻尖的夾角等等。貼著臉部,分別沿左右鼻翼下沿和鼻尖下沿作切線,取兩切線夾角。

既可以測量外表面尺寸,也可以測量內部骨骼尺寸。

甚至也可以用身高,體重等其它容易得到的幾何或非幾何屬性。

樣本人群每個個體的年齡應相同或相近。樣本貓群也一樣。

2樓:宇佐見蓮子

前兩位給了很多距離。還有一些工業上常用的簡單模式識別方法區分人臉,比如主成分分析,卷積神經網路,流形方法等等。

另外根據以前的一些對動物臉識別的樣例,你的假設有可能是錯誤的。另外據我所知,人對人臉的識別能力是後天訓練的結果,有一些臉盲症就是大腦的某個部位欠發達導致的。

3樓:R3pl4c3r

不請自來

還有一種就是張量夾角,舉個文章對比的例子,先拆詞,每個詞做乙個對映,對映到張量的乙個座標,兩篇文章處理完成後就用高中數學求向量夾角的方法求到夾角余弦值,這個可以看成相似度。

如果說是你給的案例,可以做乙個深度學習程式,提取出貓的臉,或者身體,這個看你,然後對每個畫素做處理,變成復合向量座標,然後求夾角。

4樓:Yuhang Liu

數學上有很多測量幾何體之間形狀差異的函式,比如可以考慮(固定體積或者直徑下的)Gromov-Hausdorff距離。。

Gromov-Hausdorff convergence但是這個距離無法刻畫「極小的鋸齒」,想要更精細一點可以考慮 距離。此外之前聽報告還提到過intrinsic flat distance之類的東西,Christina Sormani

在做這個

sites.google.com/site/intrinsicflatconvergence/你去問做度量幾何,幾何分析,以及一些做PDE或者調和分析的人,他們中有些人天天和這些距離打交道。

另外,我個人覺得不同品種的貓形態差異比人大。。

如何提公升文字相似度匹配?

NLP問題的模型對語料的依賴非常大,通用的語料訓練出來的模型一般也就當個引數的初始化,需要結合自己領域的語料去做fine tune.既然要做文字相似,就要有標註的資料,包括相似語料的樣本,和不相似的語料樣本,然後可以通過triplet loss 的方式去進行fine tune.Google 公開的B...

旋度 怎麼定義?

好雨知時節 按我理解 首先,環量是個標量,向量對向量做點乘積分。而旋度是個向量,是向量對向量做叉乘積分。其次,環量有乙個範圍概念,沿閉合曲線做積分得到乙個標量。環量依賴於曲面的選取喲 而旋度有乙個極限概念,這個閉合曲線面積縮小至零的時候,得到乙個環量面密度 很好理解,就是環量除於面積嘛 所以也是標量...

已知相似度矩陣,如何用k means演算法進行聚類?

蔣蔣 可以使用譜聚類,譜聚類演算法的框架下後續任務需要用常規聚類演算法如Kmeans完成,具體可參見譜聚類 spectral clustering 原理總結 Alphacat 除了基於相似性的聚類方法如譜聚類以外,如果非要用kmeans也是可以的,需要kernel trick變換一下。具體可以參考 ...