影像辨識王者,NVIDIA 的AI + GPU 落地應用 共創未來AI新時代

奕瑞科技創辦人暨執行長張義淵獲邀參與NVIDIA的線上影音論壇【影像辨識王者,NVIDIA 的AI + GPU 落地應用】,分享企業在導入AI時會有的狀況與考量,他從以往與客戶合作過的經驗中表示,在一開始導入AI影像辨識時,企業投資的資源及成本會是一個很大的考量,尤其是在做資料蒐集,訓練的過程也是關鍵成本之一。

因此NVIDIA為AI開發人員開創一個新的平台-NVIDIA Metropolis Platform,提供開發者簡單、快速的方法開發AI的解決方案。無須研究每個演算法背後的原理或者研究framework背後的程式碼,這樣的平台減輕了工程師很多研究上的負擔,節省了很多的人力成本。

NVIDIA架構師Eason提到,AI在製造業上有與其他領域不同地方,其一是獨特性,其二是稀缺性。獨特性是指每家公司的產品、廠房、生產線都是獨一無二的,必須花人力去蒐集自己跟自己產品有關的數據庫,才能開始做標註,因此無法在開源中下載訓練模型。

稀缺性則是異常狀況的樣本,例如瑕疵檢測或者預防、維護等等,都是偵測產品或產線在什麼時候會有異常狀況,然而異常是少數情況,但是正樣本與負樣本都是必須蒐集的資料,正樣本是正常時候預期的樣本,負樣本是當他發生異常情況的樣本,同時也是非常稀缺的資源。

而因應負樣本較難蒐集,NVIDIA的Metropolis Platform即有針對少量樣本的數據庫訓練模型的技術,這對於專案所需樣本數不足的AI導入企業來說是一大有利的功能。

張義淵指出,使用者在導入AI辨識時,時常會有關於正確率的討論,究竟辨識時是否會出現不需判斷的情況,而後出現警報,或因為時常誤判而將本應發揮的功能給關閉。許多企業主有AI是否能夠代替掉人力或團隊的位置的想法,張執行長希望給予使用者一個概念:「其實AI不是在這個階段做一個替換的事情,他比較屬於一個結束的角色,然後也是提供一個監督的角色。」

他曾經從一份論文中看到關於人眼辨識度的討論,說明人眼的辨識率正確度大概是96%,但是人並不會一直保持很穩定的狀況,若今天的狀況良好,那麼辨識正確率可達到96%,反之狀況不好,辨識的表現就會下降。因此,AI辨識的準確率跟表現的穩定性都會是比人更好,甚至會越來越好。「可是因為站在一個機器學習的一個角度來看,要將AI的辨識率拉到一個更好的表現,常常需要更多的硬體資源的投入,因此使用者會開始去思考,購買這麼貴這麼大的一個平台,去達到這樣效果,我的投資報酬率是不是值得?」他點出許多企業的共同疑問。

NVIDIA架構師Eason提出,現在很多的演算法在研究報告上的準確率水準表現雖然很不錯,但有些企業主發現,運用在實際場域上的準確率卻並不如預期,進而懷疑是否為AI工程師技術尚不到位。Eason表示:「其實不一定,一些研究報告指出,這些模型是非常有力準確率也蠻高的,但是這種模型是不是可以直接用在我們實際場域上面,還要再看它另外一個因素,就是模型的運算速度,因為許多非常準確的模型,背後其實有複雜的模型架構,它會需要強大的運算能力來去支援,因此就要考慮硬體成本。」即便模型足夠精確,若機器的效能跟不上,或是僅能處理少數的攝影機,那對於企業主來說即是不符合成本。

當應用上面有不錯的準確率和運行速度時,工程師就會找許多不同的演算法嘗試,看看哪個演算法可以真正在產線上面有良好的準確率跟不錯的運行速度,以及不同研究單位提出這些演算法到底哪個適合?而這就是NVIDIA Metropolis Platform所提供統一的架構,讓開發者可以統一使用,去開發測試這些不同機構提出最新的演算法功能,進而找到兼顧準確率以及運算速度的甜蜜點。