Page 25 - 5G SA開台多重無線技術測試再添挑戰
P. 25
INDUSTRY TRENDS
著海量的乘加運算,下圖是在進行AI推理操作時,一 般MAC乘法累加運算的過程,先對兩個寄存器中的 Int8資料進行乘法運算,然後將結果與其他寄存器 中的結果進行累加,大量此類運算在此過程中進行。
Nvidia DLSS 2.0。
Intel XeSS。
發現,Nvidia也是這麼做的。motion vector也是相 當重要,與此同時再加入已經生成的歷史影格資訊。 Tom Peterson在解釋中還特別談到了,會對 camera進行抖動(camera可以理解為觀察遊戲畫 面的視角),以生成更多樣本、更多資料。然後將這些 連續影格再餵給XeSS,最終生成超解析度以後的高 解析度畫面。下面的這個gif動態圖,相對抽象地解
對於這類運算來說,專用的AI單元顯然有著高得 多的效率。比如對於XMX矩陣引擎而言,就能大規模 地平行做此類乘加運算,比進行一次次乘加、寫出結 果,速度也就快得多了,所以Intel說XMX對此達成的 吞吐提升最高有16倍。
23
在遊戲中真正實施這套方案的流程實際上還 會更複雜——而且未來可能還有進一步進化的餘 地。Nvidia DLSS發佈至今已經更新了很多版本,在 Nvidia DLSS 1.0剛發佈之際,遊戲玩家的回饋並不 好。在遊戲過程中,因為DLSS的接入,不少動態畫面 會出現偽像。
釋了這一過程。
於是DLSS 2.0對實施方案進行最佳化。DLSS 2.0 的工作流程,XeSS實則與此還頗為相似。對於XeSS 這道工序而言,首先輸入的是低解析度影格,以及動 作向量(motion vectors)——對比一下DLSS 2.0會
2022年10月 | www.eettaiwan.com