用redis或者mysql計算相似度的問題？

1樓：

剛試了試SQL好像可以。Redis是Key-Value型資料庫，我不知道能不能做這種事情。

首先要把商品和商品的Tag存到乙個表裡，每個商品的每個Tag都存作乙個記錄。假如你有三個商品，商品編號分別為1，2，3，商品1有6個Tag，分別為20，22，24，26，28，30，商品2有3個Tag，分別為28，30，32，商品3有2個Tag，分別為30，40，那麼你存這些資訊的表就應該是下面這樣：

Table 1

ID ItemID Tag

1 1 20

2 1 22

3 1 24

4 1 26

5 1 28

6 1 30

7 2 28

8 2 30

9 2 32

10 3 30

11 3 40

接下來可以通過self join和count解決你的問題，假如說你希望檢視所有商品和1商品的相似度，你可以先把和商品1有同樣Tag的商品和它們相同的所有Tag查詢出來，再做乙個計數，最後排序。

SQL語句是這樣：

SELECTt1.

ItemID

,Count(t1

.Tag)AS

Similarity

FROM

Table1

ASt1

,Table1

ASt2

WHEREt1.

Tag=t2.

TagANDt2.

ItemID=1

GROUP

BYt1

.ItemID

ORDER

BYCount(t1

.Tag

)DESC

;結果如下：

ItemID Similarity

1 62 2

3 1如果要和其他商品比較就修改AND那行的資料即可。

2樓：Xi Yang

瀉藥。redis是啥我根本不知道，MYSQL也僅限於了解select什麼的基本操作。

不過這個問題和一些生物資訊問題其實很像，你可以參考一下：把儲存的商品預計算乙個無根樹。

首先利用那些tag定義商品的兩兩距離。

然後就可以建樹了，比如用粗鄙的Neighbor joining演算法，或者更粗鄙的UPGMA演算法。

然後在尋找相似商品的時候，就光按照這個預計算的樹來找；或者先沿著這個樹進行粗鄙的找，然後再用別的代價更高的方法進行精確的找。

用redis或者mysql計算相似度的問題？

redis是否可以代替mysql進行資料儲存？

讓redis充當mysql快取的時候如何快取mysql的資料關係？

請教redis如何做到和mysql資料庫的同步呢？

其他用戶還看了：