Page 44 - 助力製造業無痛轉型 智慧工廠教戰守則揭密
P. 44
40
有時候也各不相同。一些想要模 擬生物學,一些專注於能源效率, 另外一些希望模擬類人智慧,還有 一些則只想為日常機器學習的難 題找到實用的解決方案。
功耗。然而,情況往往並非如此。 每秒浮點運算次數(FLOPS) 能讓事情變得容易,但目前還沒 有其他等效方法。工程師們嘗試使 用乘積累加運算(MAC),但MAC更 適於深度學習,並不能反映神經
和知識與評估成人所需的完全不 同,」他繼續說,「孩童與不成熟 的技術一樣,其成長與進步並非憑 直覺能觀察到,有時甚至還出現倒 退(例如掉乳牙或進入青春期)。」
那麼,對使用不同介面、編 碼、技術和方法的神經型態系統, 開發人員要如何進行基準測試並 且要花多長時間呢?基準測試過 去幾年已逐漸成為神經型態工程 的熱門話題。實際上,2016年就已 經開始比較不同應用中的系統,或 者執行不同的演算法、網路或演算 法/網路集。僅今年就發表了三項 有關這一主題的研究,筆者將在 以後的文章中討論這些研究,本 文的重點是理解為什麼基準測試 仍是一個難題。
型態工程的複雜性。 突觸操作也不適用,因為完
與量子運算相比,神經型態 工程處於更先進的階段,一些 神經型態系統已經投入實際應 用,儘管大部分規模還是較小。 但Blume-Kohout的觀點對處 於「青少年時期」的技術也是有 效的,就像在學校,過度考試會 讓孩子擅長考試卻不擅長獨立學 習,在形成階段使用錯誤的基準 會使神經型態工程朝著錯誤的方 向發展。
細節決定成敗
為了更好地理解,來看看神 經型態之外的其他技術。桑迪亞 國家實驗室(Sandia National Laboratories)技術人員的主要 成員Robin Blume-Kohout對量 子電腦的基準測試很感興趣。在 一次名為「Not All Benchmarks Are Created Equal」的演講 中,Blume-Kohout表示,對於任 何處於早期開發階段的技術,依 賴其基準都是有難度的。
在1980年代電腦產業迅 速發展之初,阿貢國家實驗室 (Argonne National Laboratory) 資深科學家Jack Dongarra曾努 力尋找評估電腦的最佳方法,他也 補充:「電腦的價值取決於其如何 使用,而電腦的使用又因應用、工 作負載和時間而異。」
來執行一項學習或辨識任務, 然後比較其在不同實驗系統上的 表現。首先,必須選擇一項能夠 在所有系統中執行的任務,儘管 這些系統在設計之初可能並沒有 考慮到這一點。此外,必須考慮 整個過程(從載入任務、執行任務 到產生輸出),以及每個步驟是否 都得到了最佳化。
他在2018年的一份技術報告 中強調了這一論點,「當今最先進 的量子處理器如同處於嬰兒階段。 用於成人的測試指標和基準(例如 智商或SAT分數)顯然不適用於嬰 兒;嬰兒的任務只有一個,就是 成長。」
Dongarra還斷言:「對一個 場合有效的評估可能對另一個場 合無效,而現在有效的評估可能在 很短時間之後就不再有用。」於是 就有了這樣的警告:「儘管基準在 性能評估中是必不可少的,但簡 單地應用它們可能會產生誤導性 結果。事實上,不當的基準測試可 能比根本沒有基準測試更糟糕,」 他總結。
如果沒有最佳化(這是新技術 的常見問題),則必須將測量指標 進行細分,使之僅用於有關的系 統,而非用於整個基礎設施(支援 這些系統所需)。
硬體也可以用這樣一種方式 來建構,使其能產生適當的資料 用於分析,包括不同階段的性能或
「監控嬰兒成長需要的技能
www.eettaiwan.com | 2021年12月
成任務的方式太多,可以使用的學 習規則太多,編碼方式太多,突觸 和神經元功能也太多。
即使這些都不是問題,大家 都知道,要使系統軟體運作,必 須對編譯器進行量身打造,無一 例外。否則,即使是最好的系統 也會表現不佳。
在更早的一篇論文 中,Blume-Kohout首先對不良 基準測試的危險性提出了警告。
不良基準的危害
OPINION