為何AMD Matisse CPU 記憶體寫入效能有差異?

時間 2021-05-11 21:13:44

1樓:李走

簡單來說,Zen 2一代由於chiplet設計,需要在CPU基板上佈線IFOP(礙於成本等其他原因沒有上矽互聯層,interposer)負責ccd和iod之間互聯,為了降低佈線難度(看看ZEN 2基板的厚度就跟明顯了),把原先256bit* FCLK全雙工的IF閹割成了256bit*FCLK讀 128bit*FCLK寫,單個CCD核心讀取 copy時頻寬仍能達到記憶體理論頻寬,寫入就只剩一半。雙CCD的話兩個CCD都能有128bit*FCLK寫入,合起來就是256bit*FCLK寫入。但是單個CCD核心心寫入實際還是半速的。

ZEN 2 CPU Matisse的基板複雜佈線

通過IFOP(IF on Package, AMD內部也稱為GMI)記憶體訪問,以Eypc為例

Matisse cIOD,CCD IFOP PHY就是負責和CCD互聯的部分

Matisse CCD,正中間部分就是CCD上的IFOP連線

從實際體驗來說影響挺小的,畢竟實際上還是讀多寫少,Zen 2一代單CCX 16M大快取也能較好起到緩衝作用。另外CCX之間一致性也是需要跨DIE走IF的(CCD0->IOD->CCD1,CCD之間沒有直接連線),這方面可能有一定影響,但從實測結果來說,即使有也被zen 2一代IF本身的眾多提公升而掩蓋了,ZEN 2一代互聯延遲相比ZEN下降很多。

上面的說法其實還是挺粗糙的,因為CCD和IOD之間互聯其實是序列化(SerDes)的(並行線密度高,要求長度相同,需要上interposer),所以我全都是用bit*clk這種形式表示頻寬而沒用單純的位寬。具體內容可以參照後藤的這篇文章(谷歌翻譯):

需要注意文章裡面這張圖是錯的:

7nm Ryzen TR Eypc 單CCD寫入都是半速的,但是這篇文章對AMD IF互聯講解還是比較透徹的,對IF,GMI等術語作了比較好的解釋。

也可以看看AMD ISSCC2020的展示,

這裡面說了一些設計的具體內容,稍微摘錄了一下:

Interposer做不大,不好放64核(沒錢)的我,只好用SerDes了

這張圖是比較有意思的,AMD給出了IFOP的頻率和條數,其中RX明顯比TX多,但沒有到2:1的比例,假設採用8/10糾錯 FCLK=1467MHz,RX總理論頻寬在39B * FCLK,TX總頻寬是31B * FCLK,都比記憶體實際讀寫 32B * FCLK, 16B * FCLK大了不少,具體原因未知,可能為一致性需求保留了不少頻寬,還望高人解答。

記憶體超到3600MHz的時候就是18GT的單端序列訊號(沒做差分),簡直是序列板上高頻的奇蹟,在往上超訊號完整性就很難撐住了, ZEN 2 CPU記憶體超頻的上限3800MHz基本就由這個限制住

2樓:

據說和chiplet的設計有關,amd用的是最低成本的mcm需要靠下面pcb佈線

pcb佈線補不下,於是乎就把影響較小的寫入的鏈路砍半具體不太清除,可以查下hotchip amd的拓撲結構的講解

為何念經

念記憶 記住 深切注意 警惕 惦記 讀 研習 極短的時間 想法 反反覆覆述說著。記住。論語 公冶長 伯夷 叔齊,不念舊惡,怨是用希。念attention,remember,note,keep in memory,satindriya,Recollection,attention,to read,to...

法國為何廢除君主而英國為何保留君主?

zoey 根本上來說國情不同。具體受多重因素影響。英國有歷史上限制王權的傳統,率先開始工業革命,資本主義發展比較充分。而法國國內政權不穩,政權多次更迭,主要國內資本主義發展不充分,資產階級力量較為弱小。最終投票僅以一票勝過君主派確立了共和制。 我是這樣理解的 革命之前,英國的君主已經和革命者妥協過了...

為何說李香君為何不該遇上候方域?

青木春望 林黛玉不該遇上賈寶玉,不然也不必還一生淚水 杜麗娘不該夢見柳夢梅,不然何至青年早夭?崔鶯鶯不該遇見張生,不然從命嫁人也得一生富貴免遭薄倖別離之苦 李師師不該遇見帝王才子,不然何至靖康國破風塵飄零 楊玉環不該嫁給李隆基,如何四紀為天子,不及盧家有莫愁 卓文君不該遇上司馬相如,她拋了一切當壚賣...