如何測試工作站來確定限制CFD計算速度的短板？

1樓：李龍翔

各位大佬不必硬答。。。像CFD這種模板計算程式，90%都是記憶體頻寬瓶頸。

問題中標明是工作站，那麼可以認為只考慮單節點伺服器，不存在節點間通訊過程。對於單節點，一般只有三個地方存在瓶頸：CPU、記憶體頻寬、IO頻寬。

對於CFD模擬，IO過程可以根據使用情況進行調節，並且除非進行IO測試，其他測試一般也不包括IO過程，所以一般也不會成為主要瓶頸。

那麼剩下只有兩個方面，CPU和記憶體頻寬。CPU指的是資料處理速度，對於CFD來說就是浮點計算速度，而記憶體頻寬代表了資料讀寫速度，也就是資料傳入CPU速度的快慢。對於CPU和記憶體通道瓶頸判斷，Williams Samuel等[1]提出了乙個非常簡單的模型roofline。

roofline縱軸單位為浮點計算強度，橫軸單位為Flop/Byte，稱為算術強度（Arithmetic intensity, AI），代表每byte資料支援的浮點計算。不同演算法對應的AI代表不同，AI越大代表演算法需要資料流量越小，而需要浮點計算越大。對於CFD來說，因為常用稀疏矩陣計算，因此AI比較低，一般為0.

1左右。對於乙個節點來說，由於CPU最大頻率有限，存在高上限，在roofline中為一條與x軸平行的橫線。當AI特別小時，此時記憶體頻寬成為瓶頸，因此最大浮點計算速度此時呈一條斜率固定的斜線。

綜合下來，單個節點的roofline影象如下：

Roofline

上面這個roofline實際是和平台相關的，記錄了當前平台硬體裝置下乙個典型特徵。那麼如何判斷執行程式時主要效能瓶頸？這裡推薦Intel的工具Advisor。

advisor可以對程式內每個函式資料讀取量（Byte）和浮點計算次數（Flop）進行分析，然後將其繪製在roofline影象上。假如大部分函式位於斜線上，那麼明顯就是記憶體頻寬瓶頸，而位於頂部橫線上才是CPU浮點計算瓶頸。

Intel advisor Roofline分析結果

關於advisor使用這裡就不贅述了，網上已經有很多資料，以上。

2樓：汪洋

CFD計算中，大部分軟體都優化了矩陣的儲存。一般用稀疏矩陣儲存。記憶體用量不大，可以理解為你的網格量不是特別大。主要效能瓶頸是CPU的計算效能導致的。

第二個問題也是我們常見的並行性加速比問題。就是無論你怎麼增加核心，並行效率並沒有顯著提公升。因為問題不是特別大，如果你核心增加上去了，每個核心之間的通訊開銷導致了你通過增加核心數來提公升效能的願望破滅。

第三個問題其實沒啥太多測試的必要。跑一些經典的測試算例就可以了。

如何測試工作站來確定限制CFD計算速度的短板？

如何看待錘子科技的TNT工作站？

如何評價錘子電腦堅果TNT工作站（Smartisan TNT Station）？

工作站電腦玩遊戲效能如何？

其他用戶還看了：

如何測試工作站來確定限制CFD計算速度的短板？

如何看待錘子科技的TNT工作站？

如何評價錘子電腦 堅果TNT工作站（Smartisan TNT Station）？

工作站電腦玩遊戲效能如何？

其他用戶還看了：

如何評價錘子電腦堅果TNT工作站（Smartisan TNT Station）？