AI新創公司「DeepSeek」在今年1月底開源發布大型語言模型「R1」,以較低成本獲得高效能,引發市場對美國AI晶片大廠輝達(NVIDIA)前景的憂慮,導致輝達股價在1月27日大跌17%,市值蒸發600億美元,但此後已收復大部分跌幅。對此,輝達執行長黃仁勳在接受《DDN》採訪時表示,DeepSeek的發布「令人難以置信地興奮」,它擴大並加速市場對更高效AI模型的追求,從而推動整個行業的發展,但投資人「判斷錯誤」,誤以為這對輝達及AI產業是不利的。
黃仁勳解釋,投資人有一心智模型認為AI世界是「預訓練」然後是「推理」,但事實並非如此,「我不知道這是誰的錯,但顯然這種思維方式是錯的。」他強調,預訓練是為了奠定基礎以便進行「後訓練」,而後訓練將持續發揮重要作用,因為這個階段是「學習解決問題」的過程。
黃仁勳認為市場過度擔心預訓練大幅減少,卻忽略了後訓練運算需求其實非常龐大。他提到「第三擴展定律」,即在回答問題之前,推理得越多,效果就越好,「推理本身是一個運算密集的過程。」整體而言,黃仁勳指出,股市對DeepSeek R1的反應是「我的天啊,AI完了」,但實際情況「恰恰相反」,DeepSeek的創新提振AI產業的活力,「R1開源在全球激起的活力令人驚嘆」。
標題:DeepSeek問世對輝達不利?黃仁勳首回應:市場解讀錯誤
聲明: 本文版權屬原作者。轉載內容僅供資訊傳遞,不涉及任何投資建議。如有侵權,請立即告知,我們將儘速處理。感謝您的理解。