分類
REVIEW

林修民 : 為何中國的科技巨頭們 也不買單華為的AI晶片


Wccftech 在2025年6月5日引述The Information報導,包括抖音(TikTok)母公司字節跳動(ByteDance)、阿里巴巴(Alibaba)及騰訊(Tencent)在內的中國科技巨擘,至今仍未向華為下單訂購大量AI晶片,因此華為的AI晶片目前主要仍然銷售給中國國有企業及地方政府。

AI算力是比系統作戰,不是只看晶片是幾奈米製程
整體的AI算力必須根據整體的架構來計算才會準確,不可以只根據晶片效能,甚至只看晶片所使用的製程來決定。事實上所謂的幾奈米大部分的情況都可能是廠商自己宣傳的製程,就連整體晶片的效能都也是廠商自己宣稱的,無法當作一個衡量的絕對標準。衡量晶片的效能有很多種面向,很難用單一的成績來決定一個晶片真正的效能。例如在30年前,當intel用時脈(clock)來作為效能產品的區分標籤,這時候他的競爭對手AMD等就會喜歡弄一個跟他一樣的數字在後面加+(Plus)來,表示本產品超越intel同級的競爭對手。所以華為現在所面對的情況,不是只有一個我有用6奈米製程做或者是我用5奈米製程的晶片,就表示他離競爭對手輝達的距離有所進步。華為目前所採取的對策就是以量取勝,利用多顆的晶片來追趕,希望在整個系統效能上可以追上輝達,但如同筆者在之前專欄所寫的文章,目前看來即使是新的CloudMatrix 384仍然完全不可行。

中國的科技巨頭不用的最大原因︰ 關鍵在軟體 CUDA
除了硬體方面以外,另外一個華為無法取代輝達的重要關鍵敗筆就是軟體問題。輝達在GPU軟體提出了自己的CUDA 應用程式介面(API),事實上這個API已經發展了十多年,全球的程式設計師們透過CUDA幫忙累積了非常多種類的應用程式,這豐富的應用程式群不是華為短短一兩年就可以追上的。而事實上,即使是業界其他想要取代輝達CUDA的公開標準應用程式介面,到目前為止市佔率也非常的低。上圖我們可以看到回答最新版本的CUDA-X,有超過400個種類可以選擇,從AI或者是電腦視覺,或者是資料處理都有專門的API。而上面這些原因就是中國的科技巨頭們不想使用華為的原因,因為他不想重新為這些已經在實際營運的軟體,重新用華為支持的API來重新開發軟體。這就是根據The Information報導,為何許多科技公司希望華為能夠適應CUDA平台,而不是華為硬要這些中資企業適應華為的系統的主要原因。

AI加速卡的三本柱: 第一︰速度、第二︰速度、第三︰速度。
既然我們強調AI晶片最主要的應用就是加速,那就表示速度對AI晶片是絕對它賣這麼貴的原因。如果我們不在意速度,其實用任何一個小晶片都可以運算,只是可能要花幾十年幾百年才能夠做完AI的訓練。那如何達到最快的速度? 就是要透過軟硬體的結合,所以上述軟體的API CUDA就非常的重要,而CUDA基本上也根據每一代輝達晶片硬體架構的不同,都能夠推出最佳化它硬體的計算速度的新一代版本,在這種情況底下,華為並沒有辦法直接使用輝達的CUDA,而華為的客人又不願意改寫,中資企業只好繼續用現有的庫存輝達晶片。

輝達不只硬體狂勝,軟體也創新
輝達軟體的創新當中,最新的Blackwell晶片支持FP-4 量化模型的格式,我們可以從上圖可以看到他提出的新格式,基本上快要可以得到跟FP16一樣的畫質效果,這表示利用新的軟體格式,回答的晶片可以節省¼的記憶體使用量,或者在同樣的記憶體容量當中可以訓練更大的模型參數。

美國出口管制更是重擊
美國商務部2025年5月發布的指導原則顯示,未申請執照就使用華為晶片的企業、將被認定違反美國出口管制。這項規定對擁有海外市場的中國實體造成重大打擊,這讓中國科技巨頭們更不敢採用。

中國國有企業及地方政府為苦主
綜上所述、在中國科技公司採用華為的新晶片不但得面對技術上的問題,還得面臨政治上的美國究責。只剩中國國有企業及地方政府被迫採用華為系統。這個分離的狀況如果在中共繼續獨裁恐怖統治下,恐怕不是幾年就會改變的

(作者為科技專欄作家)
原文出處 自由時報