首次不給輝達! DeepSeek最新模型優先開放華爲優化
▲DeepSeek。(圖/路透)
記者張靖榕/綜合報導
中國AI新創鉅頭DeepSeek(深度求索)去年以低成本模型震撼全球市場,如今傳出在新一代旗艦模型V4發佈前,未依慣例向美國晶片大廠提供預覽版本進行效能優化,而是優先開放給中國本土供應商,包括華爲(Huawei Technologies),引發關注。
優先開放給華爲等中國晶片商
路透社引述兩名知情人士指出,AI開發商通常會在重大模型更新前,將預發佈版本提供給輝達(NVIDIA)與超微(Advanced Micro Devices, AMD)等主要晶片商,以確保軟體能在主流硬體上順暢運行。DeepSeek過去也曾與輝達技術團隊密切合作,不過,此次預計於農歷新年期間發佈的V4模型,DeepSeek未向輝達與超微開放測試,反而讓華爲等中國晶片商提前數週優化軟體。
輝達與超微對此拒絕置評,DeepSeek與華爲亦未迴應媒體詢問。路透社暫時無法確認DeepSeek此舉的具體原因。
擬因配合中國政策 在中消減美硬體與模型優勢
研究機構Creative Strategies執行長巴加林(Ben Bajarin)表示,此舉對輝達與超微在通用資料加速器市場的影響有限,因多數企業並未實際運行DeepSeek模型,其更像是一項基準測試工具。他並指出,新一代AI程式開發工具已將軟體適配硬體的時間,從數月縮短至數週。
巴加林認爲,這項做法可能是中國政府更廣泛策略的一環,目的是在中國市場削弱美國硬體與模型的優勢。
DeepSeek最新模型恐違反美國禁令
此外,一名川普政府高層官員向路透社表示,DeepSeek最新AI模型其實是在中國境內使用輝達最先進的Blackwell晶片叢集進行訓練,此舉可能違反美國出口管制規定。該名官員指出,DeepSeek可能試圖移除顯示其使用美國AI晶片的技術痕跡,並計劃對外宣稱模型是使用華爲晶片訓練。
DeepSeek自2025年1月崛起以來,其模型在開源平臺Hugging Face上的下載次數已超過7500萬次,帶動中國開源模型與美國AI實驗室競爭的浪潮。過去一年在該平臺發佈的模型中,中國模型下載量已超越其他國家。