DeepSeek捨棄輝達 V4新模型率先改採華為最新設計國產晶片運作

DeepSeek「V4」新模型率先改採華為最新設計國產晶片運作。圖/取自Coin Bureau《推特》官方帳號
DeepSeek「V4」新模型率先改採華為最新設計國產晶片運作。圖/取自Coin Bureau《推特》官方帳號

中國人工智慧企業深度求索(DeepSeek)新一代旗艦模型「V4」,預計將在未來數周內正式亮相。據美國科技媒體《The Information》報導,這款模型將全面運行在華為(Huawei)最新設計的國產晶片上,標誌著中國AI產業在算力自主化道路上取得重要進展。

報導指出,為迎接V4發布,包括阿里巴巴、字節跳動(ByteDance)及騰訊控股等中國科技巨頭,已向華為即將推出的新一代晶片下達大規模訂單,總量高達數十萬枚。消息人士透露,DeepSeek團隊過去數月與華為及另一家中國晶片設計商寒武紀科技(Cambricon)密切合作,重新編寫模型部分底層代碼,並針對國產硬體特性進行多輪壓力測試,以確保在華為晶片上的運行效率與穩定性。

此技術路線選擇與業界慣例明顯不同。DeepSeek此次並未將即將推出的旗艦模型提供給輝達(NVIDIA)等美國晶片商進行性能優化,而是提前向華為等國內供應商開放早期測試權限。此舉被視為對國產晶片生態的實質支持,也反映出在當前中美科技競爭背景下,中國企業加速供應鏈多元化的戰略趨勢。

據報導,DeepSeek-V4系列將包含三個不同定位的變體版本,每個版本針對特定應用場景進行優化,並全部基於中國晶片架構設計,目標是實現從軟體到硬體的完整自主可控技術棧。這在人工智慧領域屬於較為大膽的全棧式創新嘗試。

市場對DeepSeek-V4高度關注,主要源於其前代產品的強大影響力。去年推出的低成本模型V3與R1,以高性價比優勢震撼全球AI產業,不僅引發國際科技股大幅震盪,更讓投資人開始質疑美國AI企業是否需要持續投入巨額資金購買高階算力。外界普遍期待V4能否延續「低成本、高效能」的顛覆性路線。

不過,業界也指出,中國目前先進製程仍大致停留在5奈米水準,與全球主流先進製程存在一定差距。華為晶片在實際運行大型AI模型時的長期效能與能耗表現,仍有待市場進一步驗證。中國科技媒體先前報導稱,V4很大機率仍是開源領域最強模型,但「很難達到碾壓級」優勢。

DeepSeek與華為均未對相關報導立即回應。分析人士認為,若V4順利推出並展現良好效能,將進一步提振中國國產AI晶片信心,並可能重塑全球人工智慧技術競爭格局。隨著國際科技環境日益複雜,中國AI產業的自主發展路徑正受到全球密切關注。

延伸閱讀

熱門文章

分享