Page 24 - 5G SA開台多重無線技術測試再添挑戰
P. 24

 22
分工作,那麼已經超出這張圖的天際了。類似tensor core和XMX引擎的存在,本質上都是當代處理器朝著 DSA方向邁進的佐證。
以上是從渲染管線和階段的角度談XeSS所處的 位置,接下來就涉及到XeSS究竟怎麼工作的問題了。 本質上將低解析度的畫面升格為高解析度的演算法, 都是做一系列算術題,只不過不同技術所做的算術題 不一樣,效果和複雜度也存在差異:不管是如何更好 地抗鋸齒,還是把一個畫素神奇地切成幾個。
 而另一方面,將TAA這個步驟換成超解析度(如 XeSS),前後工作內容不變。那麼每一影格所需的時 間就能縮短到如下圖的程度——因為Render渲染階 段就不需要做4K解析度的工作,所以處理時間顯著 變短;XeSS相較傳統的TAA所需的時間當然會更久一 些——XeSS就是把1,080p解析度的畫面再upscale 為4K解析度。
而AI的本質是透過訓練,建構出一個適用性很高 的模型或網路。這個神經網路會從外界獲取資料,然 後生成輸出。對於AI超解析度而言,從外界輸入的就 是低解析度的影格,經過網路以後,生成高解析度的 影格——這個輸出的高解析度影格起初應該是很不 理想的。所以還要將其與原先就準備好、用做參考的 超採樣、高解析度影像進行對比。
用AI來做超解析度
  值得一提的是,XeSS階段的工作專案中多出了 紫色的部分。這部分就可簡單看作是AI單元或對應指 令的工作過程,所以這是個基於AI的超解析度技術。
透過這種循環往復的對比和訓練,就能不斷修 正輸出的影格、修正權重參數,使網路模型達到理想 的效果。這個過程一般會在雲端進行,因為需要大 量算力。最終得到滿意的模型,這個網路就可以拿來 用了——也就是在遊戲過程中,將低解析度的影格輸 入給該網路,就能獲得相對準確的高解析度影格,幾 近達到原生高解析度渲染的效果,使用該網路的過程 就叫AI推理(inference)。
對於Nvidia GPU而言,這部分工作交由Tensor core完成,聯發科則部分交給APU,Intel將自家GPU 內部的AI單元稱作XMX (Xe Matrix Extensions)。對 於Intel這一代用作繪圖運算的GPU而言,每個Xe核 心都會配16個XMX矩陣引擎,結構上也就是脈動陣 列(systolic array),用於AI工作的加速。
Tom Peterson特別談到,這裡的紫色部分雖然 看起來不多,但實際上因為XMX指令在矩陣引擎中達 成了16倍的性能提升,所以如果要是按照比例畫這部
日常所說狹義的AI大致上也就是這麼回事。從 更往下的層面來說,這類繁重的運算任務通常意味
www.eettaiwan.com | 2022年10月 
INDUSTRY TRENDS






















































































   22   23   24   25   26