如何評價AMD的hUMA?

時間 2021-06-02 13:52:38

1樓:王輝

1. 之前的CPU和GPU位址空間不統一,CPU使用記憶體,GPU使用視訊記憶體。當需要在GPU上執行乙個Kernel的時候,是需要程式設計師顯式的呼叫API將資料從記憶體拷貝到視訊記憶體(如cudaMemcpy(host_data,device_data));當GPU完成運算時,也需要程式設計師將資料從視訊記憶體拷貝回記憶體(如cudaMemcpy(device_data,host_data))。

大量資料的拷貝需要花費較多時間,尤其是在之前的GPU一般是連線在PCIe匯流排上的情況下。

2. 記憶體和視訊記憶體採用統一位址空間,和@泰羅Taro說的一樣,目的是讓CPU和GPU能看到一片共同的位址空間。不再需要程式設計師顯式的將資料從記憶體拷貝到視訊記憶體,可以直接通過相同的位址訪問到。

至於會不會提高效能,還是取決於記憶體和視訊記憶體的設計。比如Nvidia的CUDA6也採用了CPU-GPU統一定址,但是由於Nvidia的GPU還是通過PCIe匯流排和CPU通訊,通過訪問相同的位址雖然可以訪問的CPU的資料,但是依然無法避免需要將資料從記憶體拷貝到視訊記憶體,所以效能也不可能大幅提高。再比如AMD的APU,將CPU和GPU整合到同乙個晶元上,共享同乙個DRAM(視訊記憶體即記憶體),就不存在從記憶體拷貝到視訊記憶體的問題,可以節約之前通過PCIe拷貝資料的時間,提高一點效能。

至於說讓二者之間的容量不再固定受限,主要是之前的視訊記憶體做在GPU內部,大小沒法和CPU的記憶體相比,統一定址之後就沒這個問題了。

3. 要實現統一位址空間不難,如Nvidia的CUDA6就採用軟體技術實現了物理分離的記憶體和視訊記憶體之間的位址統一;AMD的APU則通過將CPU和GPU整合到乙個晶元上共享DRAM實現。雖然位址空間是統一的,但是由於現代CPU和GPU都採用了多級Cache,如何保證CPU和GPU的Cache之間的一致性,才是這項技術的難點。

4. 維持CPU和GPU之前Cache的一致性難點在於GPU通常執行大量的執行緒,這些執行緒產生大量的訪存請求,對GPU Cache造成非常大的壓力(實驗觀察到在乙個cycle內能達到幾百個請求)。由於GPU運算一般都是Streaming型別的居多,資料區域性性不好,即便是L2 Cache命中率也不高。

因此L2 Cache Miss都要訪問目錄(Directory)來詢問這個資料是不是已經存在於CPU的cache裡面,這樣就對維持CPU-GPU之間Cache一致性的目錄結構(Directory)造成了非常大的壓力。要追蹤這些請求,需要在Directory內部的MSHR中儲存這些位址,直到相應的資料從CPU Cache或DRAM中返回。因而對Directory裡面的MSHR壓力非常大。

5. 目前如何維持CPU和GPU之間的Cache一致性還是乙個開放式的問題,學術界也研究比較多(個人最近的研究方向。。。)目前為止僅在去年的MICRO上有一篇文章提出了一種純硬體解決方案,有興趣的同學可以去讀讀。

6.如果想深入了解AMD的hUMA,可參考AnandTech Portal。

2樓:

1.統一定址並不能避免CPU—GPU之間的資料傳遞,並且沒有哪種技術旨在抹除CPU—GPU之間的資料傳遞,以抹除這一點為目的的技術可能永遠也不會出現,因為這與cache的設計原則違背。無論統一定址如何發展,CPU—GPU之間的資料傳遞都不會消失。

2.統一定址的作用是讓CPU和GPU看到一片共同的連續的位址空間,好處是方便程式設計,程式設計師們不用介入繁瑣的CPU-GPU記憶體管理,至於效能優勢,這一點並不會帶來直接的效能優勢。效能優勢是間接的,CPU和GPU能夠更好地協作。

3. HSA是很久以前就開始醞釀的概念,出現並不晚,我覺得它就是在應該出現的時候出現了。再早五到十年出現的話,GPU上的通用計算程式設計模型還沒有發展成熟,HSA這個概念的接受程度就不會有今天這樣高。

4. 技術難點跟工藝沒什麼關係,主要的挑戰仍然是停留在結構層上,比如統一定址但是物理儲存分離之後帶來的coherence問題,前陣子在某個會議上聽AMD lab的人作了報告,老實說,首先我不太喜歡當時提出的那套解決方案,比較笨拙,其次提方案的人說AMD的工程部門告訴他們統一定址之後MSHR壓力會比較大,我也沒想明白為什麼MSHR壓力會比較大。。。

對於如何評價AMD 5900HX

地主仔 5900hx一直很謎。我總共接觸過4顆5900hx,同樣的散熱磨具,其中兩顆輕鬆上100w,溫度90度左右,全核4.3G r20跑分5500 另外兩顆60 70W溫度就破百了,自然就降了頻。開始以為是散熱器沒安裝好,矽脂沒塗好,反覆了幾次以後效果依舊,無奈放棄,這CPU真是奇怪。 熱銷數碼資...

如何評價 AMD 最新的顯示卡 560xt?

不急的話等618 如果560XT在800以下,可以考慮 如果大品牌如華碩 藍寶石588 2048在1100以下,可以考慮還有個1650如果下個月出場,在618定價在1100以下,看測評,和588 2048差別不大,優先考慮 袁七 比1050Ti良心多了,但和自家好580 2048比沒什麼優勢有同門相...

如何評價AMD發布的Ryzen效能戰勝i7 6900K,三大幻覺之一的 AMD翻身 成真?

跑分請用 PC Mark 跑,這是相對接近實際使用體驗的乙個評分,跑圓周率有意思麼.已經和i7 6900K 7899 差不多了.AMD Ryzen 7 1800X CPU Review 我估計還是有很多使用者會買的,喜歡高大上的還是去買Intel好了. Green傘 就是翻身了啊,1700已經能和7...