347期
2023 年 12 月 27 日
  北美智權官網 智權報文章分類/搜尋   歷期智權報   訂閱北美智權報  
 
各家業者磨刀霍霍向AI PC,但ARM架構已經先走一步
林宗輝╱北美智權報 編輯部

在經歷了一年多的銷售低潮之後,PC市場雖然有止跌回升的跡象,但仍稍顯溫吞,且ARM架構PC不斷攻城掠地,英特爾、AMD等既有PC處理器霸主的市場地位遭受威脅,因此也開始尋找在現有PC上增加更多應用價值的附加功能。

隨著AIGC(人工智慧生成)成為主流應用之一,如何加速這些功能在本地端的實現,就成為軟體與半導體產業很大的挑戰,英特爾搶先推出AI PC概念方案,正式把AI掛在PC上,AMD似乎晚了一步。但不論如何,以現有AI生態的競賽來看,ARM架構恐怕已經領先X86不只一個車頭了。

在這個AI電腦時代的濫觴中,專家們預測,AI將成為PC市場的重要驅動力。英特爾最新基於Meteor Lake架構的Core Ultra晶片,作為該公司的首款內建神經處理器的消費端PC處理器,預示著這一時代不只到來,更將迅速滲透市場,改變使用者習慣。

根據英特爾的說法,具備AI功能的新晶片的特點在於能夠在筆記型電腦上運行像ChatGPT這樣的技術,而不需要依賴雲數據中心提供計算能力。這意味著即使在沒有網際網路連接的情況下,AI電腦也能夠執行高級的語言模型和對話式AI。這種自主運算能力的提升,為AI電腦在個人使用和專業領域的應用帶來了巨大的潛力。

以過去的英特爾產品作為比較基準的話,目前的英特爾在AI應用性能方面的確有相當大的進展,然而回過頭去看這幾年的整體處理器技術發展,英特爾到2023年底才推出具備AI功能的處理器,反而是動作比較慢的了。許多其他科技公司也在積極開發AI專用硬體和軟體,這將進一步推動整個行業的發展,比如說蘋果,他們透過新的硬體以及軟體框架,使他們的PC產品在AIGC應用執行效率可以和高階獨立顯示卡同等的水準,且甚至可以執行更大的本地模型。

而隨著更多的AI專用硬體和軟體解決方案的問世,我們將看到AI電腦在更廣泛的領域中被應用,從而帶來更多的創新和變革。

晚到好過不到,X86的AI路

近日,英特爾在新一代的處理器平台上揭示了未來AI PC的樣貌,不論在應用方面,甚至在晶片製造端也展示了英特爾前所未有的創新。隨著新一代Core Ultra處理器的引入,英特爾寄厚望於該平台上,不論是AI應用,或者是未來在晶片製造能力的改善,都代表著該公司40年來最大的客戶端架構轉變,Core Ultra也是首次應用基於Foveros封裝技術的客戶端瓦片式設計。這種新的晶片設計利用了3D高性能混合架構,並且是首款在新的Intel 4製程節點上製造的客戶端處理器。

一張含有 文字, 螢幕擷取畫面, 字型, 電子藍 的圖片  自動產生的描述
圖片來源:英特爾

代號Meteor Lake 的Core Ultra處理器,藉由採用英特爾的3D性能混合架構和英特爾4製程製程,提供了性能和功率效率之間的平衡,並強化AI應用執行的能力。英特爾在新聞發表會上亦強調,新一代的H系列和U系列處理器將改變人們使用個人電腦的方式,特別是在AI加速方面。​

英特爾Core Ultra特別強調了其內置的神經處理單元(NPU),這種架構過去常見於手機晶片上,這也是X86架構首次引進該技術,透過內建的NPU,這使得處理器在AI加速方面的能效比上一代提高了2.5倍。英特爾Core Ultra還支持OpenVINO™工具包,這些工具包通過最小的代碼更改和自動設備檢測增強了AI性能,將工作負載路由到正確的計算引擎,並通過ONNX和ONNX Runtime實現更快的推理,從而簡化了工作流程。

不過相較起性能,英特爾的新處理器更重視的是能效表現以及應用的相容性,從實際測試結果來看,英特爾的AI執行速度可能還不如新一代的ARM架構處理器,但相較起性能,英特爾似乎更重視應用相容性。而這也是為什麼英特爾執行長基辛格近日不斷攻擊NVIDIA的原因,基辛格認為,英特爾推動的應用生態相容計畫將有機會推翻以往由NVIDIA的CUDA獨霸的AI運算生態。

如果單看X86市場,英特爾已經在AI議題上搶了一波鋒頭,畢竟AIGC到AI PC,如果能擺脫雲端的限制,達到隨處可用的境地,不僅效率更快,許多資安要求高的工作應用也就不用因為害怕資訊洩漏而故意忽視AIGC功能的存在,從而幫助工作效率的提升。因此,PC業者見到英特爾的新架構,無不蜂擁支持,畢竟不論是消費端或者是企業端,PC市場已經冷太久了,需要更多題材來炒熱。也因此,我們認為英特爾目前的重點還是瞄準商用市場生態經營,消費端AI可能暫時還無法期待有太大的性能革新。

那麼英特爾的最大對手AMD呢?根據業界訊息,他們也會如同英特爾般加入NPU功能,強化其AI應用執行能力,然而不可忽視的是,AMD在GPU的技術方面僅次於NVIDIA,且推動了使用者基礎僅次於CUDA的AI開放社群標準,英特爾目前在AI PC上暫時領先了AMD,但後續的生態經營才是真正的挑戰。

先走一步的ARM架構

X86這頭AI PC概念炒的火熱,但實際上AI功能在ARM架構已經是司空見慣,幾乎每一顆ARM處理器都有NPU技術的存在,雖然AIGC概念在2023年才開始興起,但作為先行者的ARM架構,似乎也有不錯的潛力。

兩大手機處理器公司,聯發科和高通都先後推出可以進行AIGC的手機處理器,可以在手機上執行超過百億參數規模的AI模型,這個參數大小的模型即便是放在PC上也是相當龐大,需要具備大容量的GPU才能有比較好的執行效率。

一張含有 文字, 電子產品, 螢幕擷取畫面, 電子裝置 的圖片  自動產生的描述
圖片來源:聯發科

聯發科的方案是天璣架構,其最新的天璣9300手機晶片,使用了「全大核」設計策略,以達到更高的遊戲、視訊捕捉和設備上的生成AI處理性能。該晶片采用台積電的4奈米製程技術,包含四個Cortex-X4核心和四個Cortex-A720核心。特別值得注意的是,Dimensity 天璣9300包含了一個AI處理器核心——APU790,這個核心能夠提高生成式AI的性能和能效,並支持大型語言模型,具有可擴展性高達330億參數。此外,天璣9300還具有改進的CPU核心和提高的效率表現。

雖然聯發科在Windows on Arm的腳步並不明確,未來可能會透過與NVIDIA合作前進AI PC,而不是自己玩,但我們認為在手機市場已經逐漸走向飽和,且聯發科的客戶主要還是集中在中國企業上,不論就地緣政治風險,或者是市場潛力而言,都已經可以看到極限,往AI PC前進不僅可以增加新市場空間,也能分散風險。

高通除了在手機晶片上有和聯發科類似的發展脈絡,其整合NPU、GPU與DSP的AI運算能力,也幫助手機應用很早就走入AI時代。但與聯發科不同的是,高通已經打造出一顆真正的PC處理器,並將以之挑戰主流PC處理器。

一張含有 文字, 螢幕擷取畫面, 品牌, 網路廣告 的圖片  自動產生的描述
圖片來源:高通

高通推出了面向微軟Windows筆記型電腦的新晶片,這一晶片被命名為Snapdragon Elite X。這款晶片專為處理人工智慧(AI)任務而優化,包括電子郵件摘要、文本生成和圖像創建等任務。Snapdragon Elite X晶片被設計為集成到高通的智能手機晶片中,Google和Meta計劃利用這些功能。此外,據稱Snapdragon Elite X在特定任務上的性能超過了蘋果的M3與M2 Max晶片,同時在能源效率方面也優於蘋果和英特爾的PC晶片。這款晶片的最大特點是其能夠處理具有130億參數的人工智慧模型,這在生成文本或圖像等AIGC任務中尤為重要。

但嚴格來說,聯發科和高通都還沒有針對主流PC的AI晶片產品,因此,我們把眼光看往另一個,也是目前市面上最強大的AI PC架構,也就是蘋果的M3系列晶片。

蘋果在其M系列處理器中引入了多項AI處理功能,這些功能主要集中在提高AI計算速度、增強神經網路引擎的能力,以及優化圖形處理等方面。

M3系列處理器采用了3奈米製程技術,這不僅增加了性能和效率,還使這些處理器能夠更有效地運行AI和機器學習模型。M3系列的神經網路引擎比M1系列快60%,這使得AI和機器學習工作流程得到了更快的處理速度​。另外在GPU方面,M3系列具有最新一代的GPU架構,這不僅提高了整體的圖形性能,還引入了如動態緩存、硬體加速光線追蹤和網格陰影等創新功能。這些新特性增強了著色能力,使得圖形更加細緻和逼真。M3系列的GPU渲染速度比M1系列快達2.5倍​。不僅在遊戲或者是專業繪圖性能方面更出色,也能有效幫助AI應用的執行加速。

但除了硬體以外,蘋果最重要的一項工作是推出了名為MLX的新開源AI框架,這代表蘋果在AI領域的一大進步。MLX專為在蘋果的M系列處理器上高效運行而設計,並提供了統一的記憶體模型,使得操作可以在任何支持的設備類型上進行,而無需進行數據複製。這個框架基於ArrayFire、Jax和PyTorch,可以高效率訓練AI工作,或者是執行AI推理工作。

MLX框架在AI研究和開發方面代表了重大進展,尤其是在影像生成速度上,與PyTorch相比有顯著優勢。此外,MLX框架還支援像是Stable Diffusion和OpenAI的Whisper這樣的工具,這些都顯示了蘋果在AI研究和開發領域的進步。例如,蘋果報告稱,使用MLX生成16張圖片大約需要90秒,而PyTorch則需要約120秒​。

​而根據第三方的測試,在蘋果M系列處理器上執行Whisper這個AI語音轉錄應用時,蘋果處理器能表現出比NVIDIA的RTX4090顯示卡更強大的性能表現,值得注意的是,用來測試的蘋果筆記型電腦的價格跟RTX4090顯示卡差不多。

值得注意的是,雖然在這個測試中的RTX4090顯示卡使用的是未最佳化的模型,所以性能表現較弱,但以同樣的測試基準來看,蘋果系統的總功耗僅約50W,4090單單是顯示卡就消耗超過300W,就純粹的能效比來看,蘋果仍然領先。

圖:蘋果M3的AI性能實測超越NVIDIA的RTX4090高階顯卡。​​一張含有 文字, 螢幕擷取畫面, 字型, 圖表 的圖片  自動產生的描述
​資料來源:AppleInsider。

這些進步意味著,蘋果在PC產業中引入AI功能方面處於領先地位。MLX的推出不僅讓蘋果的硬體更具吸引力,也為AI研究者和開發者提供了更好的相容性以及開發體驗。這個框架的目標是使蘋果的平台對AI研究者和開發者更具吸引力。隨著蘋果進一步開發其AI技術,未來可能會在MacBook上創建類似ChatGPT的生成AI應用程式。

結論

不論從略微姍姍來遲的X86架構,或者是早在AI經營已久的ARM產品,AIGC進入人們的日常生活已經是不可改變的趨勢,AI PC的到來也宣示著AIGC要擺脫娛樂用途,轉而邁向生產力應用。當然,談到生產力,英特爾看起來很重視使用者或是開發者應用生態的經營,但蘋果似乎略勝一籌,而AMD、高通和聯發科及NVIDIA也都在磨刀霍霍。但無論如何,消費者也能選擇配備使用NVIDIA或AMD的GPU產品的PC產品,CPU不需換代也能具備AI功能。

但我們同意,AI PC的興起不僅代表了一次技術上的革命,更是一次運算方式和用戶體驗的全面變革。隨著AI技術的不斷成熟,我們可以預期,在不久的將來,AI PC將成為個人和專業領域的標準配置,從而為我們的生活和工作帶來深遠的影響。並帶領產業進入一個更加智慧、高效和創新的時代。

 

作者: 林宗輝
現任: 北美智權報資深編輯
學歷: 大葉大學
經歷: 電子時報半導體資深分析師
MIT Techreview 中文版研究經理
財訊雙周刊撰述委員
美國波士頓Arthur wood 投資顧問公司分析師

 

 

Facebook 在北美智權報粉絲團上追踪我們       

 





感謝您閱讀「北美智權報」,歡迎分享智權報連結。如果您對北美智權電子報內容有任何建議或欲獲得授權,請洽:Editorial@naipo.com
本電子報所登載之文章皆受著作權保護,未經本公司授權, 請勿轉載!
© 北美智權股份有限公司 & 北美聯合專利商標事務所 版權所有     234新北市永和區福和路389號五樓 TEL:+886-2-8923-7350