SaaS 已死!黃仁勳最新演講宣判:所有軟體公司都將變成Agent 即服務


2026年3月16日,英偉達GTC 2026大會正式開幕,英偉達創辦人兼CEO黃仁勳發表了主題演講。

在這場被視為「AI產業年度朝聖」的大會上,黃仁勳闡述了英偉達從一家「晶片公司」向「AI基礎設施和工廠公司」的蛻變。面對市場最關心的業績持續性與成長空間問題,黃仁勳詳細拆解了驅動未來成長的底層商業邏輯—「Token工廠經濟學」。

01

業績指引極度樂觀,“2027年至少1兆美元的需求”

過去兩年,全球AI運算需求呈指數級爆炸。隨著大模型從“感知”、“生成”進化到“推理”與“行動(執行任務)”,算力的消耗量急劇攀升。針對市場高度關注的訂單與營收天花板,黃仁勳給出了極為強勁的預期。

黃仁勳在演講中直言不諱:「去年這個時候,我說過,我們看到了5000億美元的高確信度需求,覆蓋Blackwell和Rubin直到2026年。現在,就在此時此地,我看到到2027年至少有1萬億美元的需求(at least $1 trillion)。」

黃仁勳的萬億預期一度推動英偉達股價漲超4.3%。

不僅如此,他更是對這一數字做出了補充:“這合理嗎?這就是我接下來要講的。事實上,我們甚至會供不應求。我確定,實際的計算需求會比這高得多。”

黃仁勳指出,如今的英偉達系統已經證明了自己是全球「成本最低的基礎設施」。由於英偉達能運行幾乎所有領域的AI模型,這種通用性使得客戶投入的這1兆美元能夠被充分利用並維持長久的生命週期。

目前,英偉達60%的業務來自排名前五的超大型雲端服務商,另外40%的業務則廣泛分佈於主權雲端、企業、工業、機器人和邊緣運算等各個領域。

02

Token工廠經濟學,每瓦性能決定商業命脈

為了解釋這1兆需求的合理性,黃仁勳向全球企業CEO展示了一套全新的商業思維。他指出,未來的資料中心不再是儲存文件的倉庫,而是生產Token(AI產生的基本單位)的「工廠」。

黃仁勳強調:“每一座數據中心、每一座工廠,從定義上來說都是受電力限制的。一座1GW(吉瓦)的工廠永遠不會變成2GW,這是物理和原子的定律。在固定的功率下,誰的每瓦Token吞吐量最高,誰的生產成本就最低。”

黃仁勳將未來的AI服務分為以下商業層級:

  • 免費層(高吞吐、低速度)

  • 中級層(~每百萬token 3美元)

  • 高級層(~每百萬token 6美元)

  • 高速層(~每百萬token 45美元)

  • 超高速層(~每百萬token 150美元)

他指出,隨著模型越來越大、上下文越來越長,AI會變得更聰明,但Token的生成速率會降低。黃仁勳表示:“在這個Token工廠裡,你的吞吐量和Token生成速度,將直接轉化為你明年的精確收入。”

黃仁勳強調英偉達的架構能讓客戶在免費層達到極高的吞吐量,同時在最高價值的推理層級上,將效能提升驚人的35倍。

03

Vera Rubin兩年達到350倍加速,Groq填補極速推理

在這個物理極限的限制下,英偉達介紹其有史以來最複雜的AI計算系統,Vera Rubin。黃仁勳表示:“過去提到Hopper,我會舉起一塊芯片,那很可愛。但提到Vera Rubin,大家想到的是整個系統。在這個100%液冷、完全消滅了傳統線纜的系統中,過去需要兩天安裝的機架,現在只需兩小時。”

黃仁勳指出,透過極致的端到端軟硬體協同設計,Vera Rubin在同一座1GW資料中心裡創造了驚人的資料跨越:「在短短兩年時間內,我們將Token的生成速率從2200萬提升到了7億,實現了350倍的增長。摩爾定律在同時期僅能帶來約1.5倍的提升。」

為了解決極速推理(如1000 Tokens/秒)條件下的頻寬瓶頸,英偉達給出了整合被收購公司Groq的最終方案:非對稱式的分離推理。黃仁勳解釋:“這兩款處理器的特點截然不同。Groq晶片擁有500MB的SRAM,而一顆Rubin晶片擁有288GB的記憶體。”

黃仁勳指出,英偉達透過Dynamo軟體系統,將需要大量運算和顯存的「預先填充(Pre-fill)」階段交給Vera Rubin,將對延遲極度敏感的「解碼」階段交給Groq。黃仁勳也對企業算力配置給出了建議:“如果你的工作主要是高吞吐,100%使用Vera Rubin;如果你有大量高價值的編程級別的Token生成需求,拿出25%的數據中心規模給Groq。”

據透露,由三星代工的Groq LP30晶片已在量產,預計第三季出貨,而首支Vera Rubin機架已在微軟Azure雲端上運行。

此外,針對光互聯技術,黃仁勳展示了全球首款量產的共封裝光學(首席採購長)交換器Spectrum X,並平息了市場對於“銅退光進”的路線之爭:“我們需要更多的銅纜產能,更多的光芯片產能,更多的CPO產能。”

04

Agent終結傳統SaaS,「年薪+Token」成矽谷標配

除了硬體壁壘,黃仁勳把大量篇幅留給了AI軟體和生態的革命,特別是Agent(智能體)的爆發。

他將開源專案OpenClaw形容為“人類歷史上最受歡迎的開源專案”,稱其僅用幾週時間就超越了Linux在過去30年取得的成就。黃仁勳直言,OpenClaw本質上就是Agent電腦的「作業系統」。

黃仁勳斷言:「每一個SaaS(軟體即服務)公司都將變成AaaS(Agent-as-a-Service,智能體即服務)公司。毫無疑問,為了讓這種具備訪問敏感數據和執行代碼能力的智能體安全落地,英偉達推出了企業級的NeMo Claw參考設計,增加了策略引擎和隱私路由器。」

對於一般職場人,這場變革同樣近在咫尺。黃仁勳描繪了未來的職場新形態:「在未來,我們公司的每一位工程師都需要一個年度Token預算。他們的基礎年薪可能是幾十萬美元,我會在此基礎上再拿出大約一半的金額作為Token額度給他們,讓他們實現10x的效率提升。這已經是矽谷的新籌碼裡帶了:你的多少籌碼?

演講最後,黃仁勳也「劇透」了下一代運算架構Feynman,它將首次實現銅線與CPO的共同水平擴展。更引人遐想的是,英偉達正在研發部署在太空的資料中心電腦“Vera Rubin Space-1”,徹底打開了AI算力向地球之外延伸的想像空間。

來源|華爾街見聞

鳳凰投訴平台正式上線!專治金融消費亂象,幫你討回公道!

如果你也遇過這些糟心事兒:貸款被收砍頭息、高利貸壓身;存錢時被忽悠,存款莫名變成保險;銀行卡扣費不明不白,被霸王條款逼得有苦說不出…

你只需一鍵提交投訴,「鳳凰投訴」將持續跟進,讓你的聲音被聽見,推動問題解決。

平台同時涵蓋全品類消費維權:醫美套路陷阱、新能源汽車數據虛標、旅遊出行強制消費、互聯網霸王條款、數碼/AI 產品虛假宣傳、餐飲衛生亂像等所有消費不公,我們也將傾力為你發聲、助你維權!

分享你的喜愛