Page 21 - 企業轉型腳步不停歇2022年數位優先世界成形
P. 21

 INDUSTRY TRENDS
 19
 所有項目的AI訓練性能基準測試跑分結果,時間越短表現越好。這裡的跑分結果比較了配備不同數量加速器的系統,其中Google TPU v4的跑分結果來自於前 一回合MLPref的測試。 (來源:Nvidia)
以Nvidia的A100作為基準之性能正規化(normalized)至每個加速器晶片的結果;數字越高表現越好。其中Google TPU v4的跑分結果也是來自前一回合的
(來源:Nvidia)
續地啟動整個核心序列的CUDA 繪圖技術減少CPU的瓶頸,因此 整個訓練演進都直接在GPU上執 行。CUDA串流透過導入一個微調 過的運算與通訊的重疊,來改善其 平行性。
 MLPref測試。
能上,Nvidia則宣稱它勝過了 Graphcore和Habana Labs 的加速器;不過仍落後Google TPU v4在前一回合性能測試中 的ResNet-50訓練模型跑分。而 Nvidia強調,自2020年7月(A100
問世時)以來,其MLPref訓練跑分 的表現穩定進步,以Nvidia A100 為基礎的系統性能表現整體快了 五倍,在晶片層級則快了兩倍。
其性能的提升得益於軟體 上的變化,包括透過同步而非連
2022年1月 | www.eettaiwan.com
























































































   19   20   21   22   23