hbase中用rowkey進行檢索時可以用佔位符麼，如果不能用為什麼不設計？

1樓：爸爸的大肚皮

1. row id 可以指定start, end的範圍達到某種匹配的效果。如果要LIKE之類的操作怎麼辦？答案是你自己解決。

2. 為什麼不做成SQL一樣功能強大？即便是SQL進行模糊匹配時，全表掃瞄也是無法絕對避免的，一旦全表掃瞄，效能下降是必然，不然，也不用SQL優化了，而SQL優化是有侷限的，最後你會發現，你需要的是重新設計整個系統。

hbase是為大資料而生，這決定了在hbase上進行全表掃瞄是不可行的，因此rowid作為全域性索引才能滿足大資料查詢的效能要求，不僅如此，列族，稀疏表空值不佔位等等都提高了hbase的讀效能。

3. hbase的表在設計時需要你重新審視你的資料。hbase是反規範化的，也就是存在資料冗餘，資料冗餘會增加資料量，但是通過冗餘的設計，盡可能為各種查詢設計合理的rowid，反而可以加快大資料的讀取速度。

如果設計者覺得某種查詢是必須的，就應該為這種查詢設計合理的rowid。以下資料以LIKE操作為例，如果關心的是起始位置兩位的字元為AB的資料（欄位中每一位均為A~Z,沒有數字），SQL使用AB%，而hbase的rowid中可以包含欄位前兩位的值，這樣通過指定範圍0001#AB就可以快速定位資料，絕不要做全表掃瞄再來判斷的傻事。

0001#AB#00001#ABCEEE

0001#AB#00002#ABCBBB

如果rowid設計成以下的樣子

0001#ABCBBB#00002

0001#ABCEEE#00001

那麼指定範圍0001#ABAAAA~0001#ABZZZZ，通過範圍來定位資料也可以，範圍越小，查詢越快。

由於資料量巨大，分布式系統的查詢目前還沒有SQL如此靈活，儘管通過各個子生態的努力，盡可能貼近SQL語法，但也是要付出計算量增大的代價的。設計rowid滿足業務需求不是一件容易的事情，但確是最高效的。最簡單的，也最可靠。

hbase中用rowkey進行檢索時可以用佔位符麼，如果不能用為什麼不設計？

HBase讀效能怎麼樣？

HBase是否適合做資料探勘？

Redis 加 HBase 的組合靠譜嗎？

其他用戶還看了：