新一代RTX 3080發布,如何評價?

時間 2021-05-30 20:49:15

1樓:划水的月半

各位大佬說了很多,我補充個3080讀取硬碟的新技術,這個讓我印象非常深,叫RTX IO。

我們指導呼叫地圖、建模、資料資源一直是顯示卡的主要工作之一,在PCIe 4.0產品放出之前,工程師們已經意識到SSD的讀取速度還可以更快。早在2023年,AMD在SIGGRAPH大會上首次展出了Radeon Pro Solid State顯示卡,如命名含義那般,這是乙個可以接駁SSD,直讀SSD內容的顯示卡。

這塊顯示卡厲害的地方在於,它無需經過CPU,通過GPU就能實現類似呼叫視訊記憶體資源的動作,雖然SSD的讀取速度趕不上當時顯示卡的GDDR5視訊記憶體,但比起向CPU提出讀取硬碟申請,在呼叫硬碟資源快得多。

在傳統的流程中,GPU如果想呼叫SSD內容,一般需要經過CPU排程到記憶體或者指定的儲存空間,如果使用了壓縮格式,還需要CPU做一次解壓縮處理,再經由CPU排程給視訊記憶體,再由GPU執行渲染、計算等工作,解壓處理之後也意味著資料需要占用更多的主記憶體和PCIe匯流排頻寬,資料傳輸的瓶頸就這麼產生了。

特別是到了PCIe 4.0時代,一款讀取速度能夠高達7000MB/s的PCIe 4.0 SSD如果要完成資料實時解壓,需要24個CPU計算資源,即使是目前消費級頂配的酷睿i9-10900,邏輯核心數量也只有20個。

隨著NVIDIA GeForce RTX 3000系列推出,名為RTX IO的讀寫技術浮出水面。你可以理解成這是前面所提到的AMD Radeon Pro Solid State顯示卡高階版本。新版的安培Ampere GPU可以直接透過PCIe匯流排讀取SSD上的壓縮資料,無需CPU解壓,GPU自己就能完成讀取、解壓的工作。

這很大程度得益於NVMe協議以及SSD的流行,這個並行化的非同步IO操作能夠具備很高的響應速度,並且GPU解壓、傳輸一氣呵成,即降低了CPU佔用率,有提公升了讀取效能。

簡單的來說,就是GPU繞過了CPU,自己完成了從硬碟呼叫資源的操作。

在NVIDIA的演示中,壓縮資料搭配GPU解壓,完成時間只花費了1.61秒,而未壓縮資料搭配機械盤,則需要62.76秒才能完成,即使是24個CPU協同工作解壓資料,也仍然需要5.

02秒。RTX IO的優勢高下立判。

更重要的是,這並非NVIDIA的一家獨創,整套RTX IO技術其實是基於微軟微軟DirectStorage API基礎上增加了更多壓縮演算法技術擴充套件而來。

有沒有覺得很熟悉?是的,即將發布的Xbox Series X主機和索尼PlayStation 5主機,都使用了類似的技術,雙方在遊戲展示的時候也重點演示了新技術能夠讓主機擁有很好的讀取速度,遊戲人物能夠瞬間在兩個完全不同風格的地圖場景中極速切換,這是非常讓人激動的。

很快,微軟DirectStorage API會在明年正式推出,RTX IO也會與Windows 10公升級同步推廣,無論是PCIe 4.0還是PCIe 3.0都能直接獲得這項新功能,意味著我們無需更換新的電腦零件,只需要準備一塊RTX 3000系列的顯示卡。

可以預見的是,未來SSD的讀取效能,愈發變得更為重要。

2樓:何文禮zk

老黃確認五月發布了,坐等年末買移動端3070了,希望十一月能等來3070maxq,本來都準備買2070maxq的電腦了,現在這個訊息出來我必等等

3樓:Arbiter

我有乙個清奇的想法,上一代架構叫圖靈,上上代架構叫帕斯卡,如果按數學家/物理學家交替命名的話,3080的架構叫安培,還是挺可信的。

我瞎扯的,大家不要信。

4樓:菜球

不大現實兄弟

3080有20G視訊記憶體?那3080ti不上個32G說不過去吧?

現在問題來了,遊戲卡有足夠的視訊記憶體的情況下,還有多少人會去花五六倍的錢買專業卡呢?至少在深度學習這個應用場景下,專業卡的銷量會大大萎縮吧?一向刀法精湛的老黃會犯這種錯誤嗎?

躺著就能賺的錢,他不香嗎?

5樓:獨行追夢

爆料基本沒錯時間還很難說視訊記憶體最難說不確定是否加倍。

目前就乙個計算卡核心GA100已經可以確定規格了 TSMC 7FF+ 820mm 550億電晶體滿規格為8192sp 6×1024bit 48GB HBM2e Boost 2.3G FP64算力18T FP32算力36T

實際馬上發布的那張Tesla A100 會怎麼切還真說不准。。。目前看較大機率切1塊HBM 10SM的樣子也就是7552sp 40GB 這個規格砍到35T FP32 17.5T FP64來保證良率

6樓:聖.馬特萊布斯基

不可信。老黃從gtx680時代,家用旗艦的規格就是跟著農企來的了。出這種規模翻倍的東西,只有可能是對面搞出來的大新聞,把2080ti按在地上摩擦,但是目前沒這方面的訊息。

7樓:沈健

20系列才出來幾天?韭菜這茬還沒長好,遊戲肥宅的手也還沒長出來。

要割還得再等等吧,總得給韭菜吊著一口氣啊。

我主機更新的計畫還沒到時間,蘇媽老黃你們等等我啊!

8樓:

說AMD沒有2080級別的顯示卡的,看了最近xbox series x的新聞了嗎?12T算力,rdna2架構按照5700xt,9.75T的比例計算也有2080s級別的效能,還不算rdna2的可能的優化。

9樓:「已登出」

個人感覺不太可能,畢竟蘇媽連能幹過2080的卡都沒有。看紅廠和藍廠的CPU就知道,八代的大管牙膏就是因為amd太yes了不得不擠,然而顯示卡方面紅廠還沒有yes到讓綠廠繼續10系的吊錘式發展。

綜上,不太可信

10樓:MebiuW

我是覺得比較真的,至少大致規格上,多個入魔都這樣了。

Nvidia的下一代安培Ampere是真的核彈,7nm直接懟上826mm2,最顯著的改進是Tensor/SM翻倍,826這個GA100 一般人就別想了。

至於面向消費級的3080Ti(GA103)和3080(GA104) ,SM反而倒退了[doge][doge] 不知道是單位SM效能翻倍還是準備草高頻。

根據AMD的資料,7nm在同面積成本下基本就是14/16nm這個節點的兩倍,保持相同的面積就意味著兩倍的成本,外加兩倍多點的效能。可能相對來說,靠低規格,吃7nm頻率功耗福利,大幅提公升頻率是在消費級上比較好的方案。 蘋果三星高通 AMD都是不約而同的縮,幅度大小而已

11樓:一葉知秋

如果訊息是真的,從規格上看,提公升並不大,cuda數還不如2080ti,僅僅是視訊記憶體翻倍而已,由於7nm工藝一定會提公升頻率,估計效能小勝2080ti。相比2080提公升大概30%到40%左右,中規中矩的提公升而已

蘋果2023年發布的新一代iPad Pro真的超過世面上92 的可攜式PC的效能嗎?

幻光 如果各位是 iPad 老使用者,並且很仔細地觀察過鋁合金背面下部雷射鐫刻的小字的話,就不會產生這個疑問了。那裡清楚地寫著 可攜式電腦 qoop 應該指得是搭在低壓u重量控制在1.5kg甚至1.2kg以下級別得產品,這個領域9成有些誇張了,但6成到8成還是有得,畢竟這個領域應用範圍窄,mac o...

如何評價蘋果 2012 年發布的第一代 iPad mini?

cloudchily 蘋果也不是第一次走這種多規格的路線了,ipod到ipod mini到ipod nano ipod shuffle,其實這就是在乙個成熟的產品體系的乙個正常的細化過程,ipad剛出的時候人們對平板還沒什麼概念,但現在這個新概念已經深入人心成為大家都明白的裝置,因此需要讓它出現在更...

如何評價NASA發布的新一代登月太空衣?

Saturn V 在實用性和美觀上NASA果斷選擇了前者。這個太空衣和之前所有NASA太空衣的最大區別在於採用了完整外掛程式式太空衣,及和過去那種由多個部分拼接組成,在加壓室內拼接組裝後出艙的不同,新式太空衣是全程掛在外面的,出入口在後背。背後那個巨大的方形裝置便是為了對接上密封艙口。此種設計的優勢...