AI 晶元和傳統晶元有何區別？

1樓：

要是記得不錯的話，在乙份招股書裡學過，試著回憶下，傳統晶元包括CPU、GPU、FPGA等，設計之初不是為了應對人工智慧領域，不過目前在作業系統支援下，支援的應用和程式數量最多範圍最廣，也可以簡單滿足一部分人工智慧需求，但在晶元架構和能效效能等方面不如人工智慧處理器晶元。而人工智慧晶元又細分為通用型和專用型，主攻通用型智慧型晶元的企業目前已知是寒武紀，由於需要軟硬體協同，相對的技術門檻較高；通用型AI晶元主要處理視覺、語音、自然語言、傳統機器學習、搜尋推薦等:)是不是有點繞，學藝不精勉強回答一波。

以後再來補充。哦對，專用型智慧型晶元是針對特定的單獨的人工智慧應用專門設計的一類晶元。

2樓：一枚工程師

我就AI目前晶元大致的分類來講：從應用場景來講，主要有兩個方向，乙個是在資料中心部署的雲端，乙個是在消費者終端部署的終端。從功能來講，它主要做兩個事情，一是Training（訓練），二是Inference（推理），這些是僅個人意見，希望可以幫助到你。

3樓：Bright

AI晶元可大致分為用於資料訓練的專用晶元，用於推斷（inference）的專用晶元以及兩者的結合體。我們實驗室目前正在做針對於inference process 的影象處理晶元。傳統的晶元大多基於匯流排結構，但由於卷積神經網路中大量卷積操作的存在，傳統匯流排架構在功耗及處理速度上明顯無法勝任計算需求。

因此現在"片上網路（Network on Chip, NOC）"成為了研究熱點。NoC是一種非馮諾依曼的晶元架構，由"資料流（dataflow）"驅動工作。在卷積處理方面，片上網路架構比傳統架構在功耗和處理速度方面有著巨大優勢。

4樓：tripleC

門外漢湊熱鬧說兩句。

任何的工程，包括晶元，其實都是一種trade off，也就是權衡。在有限的材料效能和技術下，工程師希望把主要效能分配在常用的功能上，再把剩下的一些效能分配在不常用的功能上。

換句話說，任何的軟體和硬體設計都是面向特定場景的，在這個場景中某些需求是高頻的，某些需求是低頻的。包括通用也是一種場景，通用意味著所有的需求都相對平均。

當前我們發現，AI計算越來越成為當前晶元計算中的主要場景之一，因此面對AI計算的晶元自然就應運而生，這就是AI晶元。這也是當前摩爾定律逐漸失效的背景下，繼續提公升晶元效能的乙個重要方向。

5樓：xiaderen

我個人理解，就有些類似把演算法固化成電路，就像FFT演算法的硬體實現一樣，把演算法實現在硬體層直接實現，運算速度和能耗要比用cpu通過編碼然後編譯這種形式要好很多，至於MATLAB和Python這種解釋性實現的，就更比不過直接專門的硬體實現了。這是實現演算法的抄近路。去除底層編譯等過程，直接實現，是對演算法實現複雜度降低的有效途徑。

6樓：delight

就打個不是很恰當的比方，

前者像是1000個小學生做四則運算，

後者像幾個大學生做高數。

根據應用場景不同，

各有各的優勢。

不過，AI晶元相對門檻比通用晶元門檻低。

7樓：

我發現了乙個很好的AI晶元科普內容，值得推薦一看http://

8樓：痞子

首先他能夠更好的去處理跟多的東西，並且A1的反應速度也是傳統晶元所趕不上的，傳統晶元它與A1的最大區別就在於反應速度和自身的儲存

9樓：撲通工程師

ai晶元專注於可計算大量並行乘法，比其他處理器更專注於ai的實現。

ai是純靠資料喂出來的，處理的越快程式研發起來就越快。

10樓：

區別是在傳統晶元soc上多了乙個模組，多了專門用於處理人工智慧應用中的大量計算任務的模組。AI晶元（AI加速器或計算卡）主要分為 GPU、FPGA 、ASIC。

11樓：DoubleBiao

It can be Turing incomplete, which means it needs another controller such as Arm.

12樓：齊格飛

cpu是老教授 gpu是小學生 ai晶元就像特長生，有體育特長生，有藝術特長生，比如有個任務是給算數題配上插畫，很明顯老教授和小學生都幹不好。

13樓：萌萌的C4醬

CPU：幾個老教授，什麼都能做，什麼做的都很好。但是就因為人少，問題一多做的就很慢。

GPU：幾千個小學生，只會算加減乘除開方，雖然單拿出來是弱智，但是架不住人多，做平行計算的時候優勢巨大。

AI晶元：乙個經過訓練只會做ML的團隊，在AI方面經驗豐富操作熟練，其他的可以看作啥都不會。

14樓：不會Vue的尤小

專門挖礦的晶元和一般GPU有什麼區別？

GPU TPU 有什麼區別？無非就是更有針對性，更專注於神經網路那種特殊計算模式所設計的特殊晶元，從而達到更高效的計算。

就類似於GPGPU也能做CPU的事情但是效率太低…CPU也可以硬剛圖形計算但是遠不如GPU來的快…就是這個道理。

15樓：吼啦迷迭吼啦喲

@汪鵬最高贊回答說起Ai晶元居然提起了CPU。。。CPU根本不適合做Ai，不要拿CPU舉例謝謝，這就好比你拿喜羊羊舉例說動畫片都是小孩子看的一樣，太以偏概全了。

首先現在絕大部分商用的AI加入晶元都是GPU或者DSP代償的哪有沒有NPU無法商用一說。要真沒法商用那英偉達和高通就沒能處理Ai的晶元了。此外845就沒獨立Ai利用DSP和GPU等部件協同的，效能沒多大差距，能耗比970好多了，甚至835的功耗也比970好很多(雖然Ai上有一些差距)。

此外你這全程對比的是CPU，可能你比較熟悉CPU吧，但還請不要拿CPU去對比誤導大家，形成乙個NPU做神經演算法就是快的影響，CPU是序列，而GPU是並行，你做1*10^(八個大學教授跟某高中40個人比做一套四則運算試卷的速度？)。

CPU根本不適合做Ai學習，即使是沒有獨立NPU的也不會用CPU學習，Ai用CPU慢是常識(你有見過用CPU去跟GPU比浮點的？)，所以也不會有人用CPU，桌面和企業現在除了Google的TPU外普遍使用的是英偉達的GPU，至於手機還有乙個跟NPU極為相似的DSP可以配合GPU，這塊在現在還是探索期時，效能沒有甚麼差距的情況下，非獨立NPU反而更加靈活便於調整於修正。

最後Ai晶元的定位很廣泛，並沒有說一定是TPU和NPU才是Ai晶元，英偉達的Volta GPU也是，高通的NPE平台也是。他們的差距只是是否適合進行深度學習而已，甚至目前業界都不像GPU和CPU一樣有乙個明確的定義，拿DSP充當NPU的不是少數。

16樓：NaibaoOfficial

先佔乙個坑。晚上補乙個稍微生動點的例子。（已補）

簡單的解釋如下：

根據不同的需求有不同的晶元：

比如，用在電飯鍋，冰箱之類的家用電器裡。功能不複雜，需要的暫存器沒那麼多，要省電。顯然不用塞乙個8400U進去。

比如圖形運算，為什麼要做GPU？CPU不行麼？也行啊。

但是GPU只需處理圖形運算。功能相比CPU更單一，那用GPU就可以把邏輯電路重新設計，解碼器用的邏輯電路數可以更小，那多出來的空間，可以使勁堆ALU（算術運算單元），加上專門針對圖形運算設計的電路。效能相比CPU就更好了。

舉乙個簡單的例子：

參考一款遊戲《MHRD》，實現乙個僅考慮邏輯關係，不考慮時序問題的最簡單的CPU。

大概的原理圖長這樣：

設計的邏輯器件草圖

寫到遊戲裡面，一種簡單的硬體描述語言，如下：

「MHRD描述語言」

這個CPU由解碼器，兩個暫存器，乙個計數器，乙個算術運算單元，還有一些簡單的邏輯器件。雖然麻雀比較小，但五臟也算比較全了。

按照遊戲的設定，最初玩家只有乙個與非門，然後通過與非門實現非門，與門或門等等。最後到CPU。所以這個CPU的設計好壞，就可以用與非門的數量來衡量，與非門數量越大，則說明設計的越繁瑣，如果考慮時延的話，效能肯定就越差。

遊戲中，最終的CPU是否合格，是要通過測試的。就是會給定輸入，判斷結果正確不正確，如下圖。

測試結果圖

那麼問題就出現了，輸入的組合有很多個，有2×2^16×2^16個，這個檢測只取了其中10個，也就是說，只要滿足這10個測試，也會被判定為合格，其餘的對不對，這個檢測不管。

除了設計上述的全功能CPU，還可以僅從這10個測試的輸入輸出考慮，專門為這個測試，設計一種邏輯電路。很幸運，這個遊戲排行榜的第一名就是這樣做的。

排行榜第一名用了20個與非門就通過了測試，而我用了3916個。即世界第一的運算效率是我設計的200倍。

不知道這個例子形象不形象0.0

分割場景切換到AI，CPU也可以進行AI運算，但AI運算只是其中的一小部分，就和遊戲中給的測試一樣，AI運算就好比是遊戲中的十個輸入輸出。如果針對AI，單獨設計，就可以實現效率的暴增。

這也就是我們需要設計AI晶元的原因。

17樓：Edison Chen

AI 演算法一般對精度要求不高，例如 Google TPU、NVIDIA 的 Volta 都提供了 8 位計算精度用作 AI 加速，精度越低，能跑出來的吞吐率就越高。

其餘部分其實和 GPGPU 非常相似，都是講究大吞吐，具備高速的區域性共享快取。

18樓：Jacky

AI晶元本質上講是針對某一類應用做的ASIc/SoC晶元，從工藝的角度講，和傳統晶元沒有任何區別。只是由於對計算能力要求較高，需要高整合度和高效能，因此在系統的架構設計需要特別的考量，也需要用非常先進節點的工藝。

19樓：vigna1983

AI晶元所謂的加了人工智慧，了解不多，主要加了什麼神經網路系統，應用是具有自主學習能力。其它所謂的智慧型，人臉識別，指紋識別，智慧型語音等等。真正目前晶元所謂的AI是神級網路系統，像人臉，指紋，語音只是留了介面，當然也可以包進去。

目前國內晶元設計和國外差距不大，真正差距大的是wafer製造，封裝，製造裝置，以及原材料，工藝的處理。這一塊落後5年吧。這一塊是需要很長時間耕耘，短期類一定是虧損。

有錢的企業都投房地產去了。

AI 晶元和傳統晶元有何區別？

邏輯晶元工藝和儲存晶元工藝有啥不同？

iPhone 5s 的 M7 晶元有何用處有何特點？

AI 和 PS 有哪些區別？

其他用戶還看了：