NVIDIA CEO 黃仁勳巴黎演講:AI工廠時代來臨,歐洲產業革命再起
目錄
巴黎首次GTC大會:歐洲AI基礎建設的新起點
NVIDIA創辦人黃仁勳首次在巴黎舉辦GTC大會,標誌著歐洲在全球AI發展中的重要地位。儘管這是NVIDIA第一次在巴黎舉辦GTC,但黃仁勳強調,NVIDIA在歐洲已有悠久的合作歷史,見證了從工作站革命到CAD革命,再到今日的數位雙生革命。
CUDA-X:從圖形運算到AI運算的完整生態
黃仁勳回顧了NVIDIA從GeForce圖形卡發展到今日完整AI運算生態系統的歷程。CUDA-X現在包含超過400個函式庫,每一個都針對特定應用領域進行加速優化。
關鍵函式庫包括:
- cuDNN:深度神經網路最重要的函式庫
- Dynamo:分散式複雜推理工作負載的全新函式庫
- Earth-2:天氣與氣候模型的模擬環境
- MONAI:醫學影像處理框架
- cuQuantum:量子運算函式庫
量子運算的轉折點:CUDA-Q的重大突破
黃仁勳宣布量子運算正處於關鍵轉折點。從1995年錯誤修正演算法發明,到2023年Google展示世界第一個邏輯量子位元,量子運算已經準備好解決實際問題。
Grace Blackwell:一台思考機器的誕生
黃仁勳將Grace Blackwell系統比作一台「思考機器」,因為它能夠推理、規劃,並且花費大量時間自我對話,就像人類思考一樣。
Grace Blackwell驚人規格:
MVLink技術是Grace Blackwell的核心創新,它不是網路而是運算結構,直接連接所有MVLink系統的CPU。130 TB/s的頻寬超過了全球網際網路的尖峰流量,黃仁勳形容這是「將網際網路縮小到60磅重」。
AI工廠:新時代的基礎建設
黃仁勳提出了一個革命性的概念:AI資料中心不再是傳統意義上的資料中心,而是「AI工廠」。這些工廠只有一個目標:生產智能代幣(tokens)。
- 專門設計用於製造代幣
- 是創收設施,不是成本中心
- 成為國家基礎建設的一部分
- 推動新的工業革命
黃仁勳強調:「沒有人真正將他們的資料中心視為創收設施,但他們將工廠視為創收設施。這些AI工廠的想法是完全相同的。」
歐洲AI基礎建設大躍進
黃仁勳宣布,在未來兩年內,歐洲的AI運算能力將增加10倍。這包括:
- 歐洲本土AI基礎建設建設
- 歐洲雲端服務供應商AI基礎建設
- 歐洲超級運算中心次世代AI超級電腦
- 額外20座AI工廠規劃,其中數座為千兆瓦級
AI智能體:從單次對話到複雜推理
黃仁勳詳細介紹了AI發展的三個階段:感知AI、生成式AI,以及現在的智能體AI。智能體AI能夠理解、推理、規劃,並執行複雜任務。
NVIDIA企業AI智能體平台
NVIDIA推出完整的企業AI智能體開發平台,包括:
- Nemo Nemotron:世界級推理大型語言模型
- Nemo Retriever:多模態語義搜尋引擎
- AIQ:通用智能體藍圖
- 完整工具套件:從資料策劃到部署的完整生命週期
歐洲合作夥伴關係:七國AI技術中心
NVIDIA宣布將在歐洲七個國家建立AI技術中心,目標是進行協作研究、支援新創公司,並建立生態系統。
法國重要合作夥伴關係
Nemotron:開源模型的重大提升
NVIDIA的Nemotron計畫致力於提升開源AI模型的性能,包括:
- 後訓練優化
- 神經架構搜索
- 強化學習技術
- 推理能力擴展
- 上下文長度增加
第四次工業革命:歐洲工業AI
黃仁勳特別強調歐洲在工業革命史上的重要地位,並宣布歐洲將再次引領第四次工業革命。
歐洲工業AI合作夥伴
- BMW:在Omniverse中建構次世代工廠
- Mercedes-Benz:建立工廠數位雙生
- Siemens:1992年即發明神經網路電腦Synapse One
- Schneider Electric:數位化建設AI工廠
機器人與自動駕駛:未來移動的革命
黃仁勳預測,所有會移動的東西都將成為機器人,都將由AI驅動。汽車是最明顯的下一個目標。
NVIDIA Drive自動駕駛平台
NVIDIA Drive平台建立在Halo安全系統之上,包括:
- 大規模多樣化資料訓練
- Omniverse和Cosmos合成訓練資料
- 獨立古典堆疊並行運行
- 冗餘感測器和運算架構
人形機器人的突破
黃仁勳展示了人形機器人Grock,這個機器人完全在Omniverse虛擬環境中學習行走和操作。
常見問題解答
什麼是AI工廠?
AI工廠是NVIDIA提出的新概念,指專門用於生產智能代幣(tokens)的資料中心設施。與傳統資料中心不同,AI工廠是直接創收的生產基地,就像汽車工廠一樣,每座AI工廠都能為企業帶來實際收益。
Grace Blackwell系統有什麼特別之處?
Grace Blackwell被稱為「思考機器」,重達2.5噸,包含120萬個零件,具備130TB/s的MVLink頻寬,超越全球網際網路尖峰流量。目前已進入每週1000套的量產階段。
CUDA-Q量子運算平台的突破意義?
CUDA-Q實現了量子-古典協同運算,標誌著量子運算進入實用化階段。從1995年錯誤修正演算法發明到2023年首個邏輯量子位元展示,量子運算已準備好解決實際問題。
歐洲在這場AI革命中扮演什麼角色?
歐洲將成為第四次工業革命的重要戰場,NVIDIA計劃在7個歐洲國家建立AI技術中心,未來兩年內AI運算能力將增長10倍,並規劃20座新AI工廠。
結論:AI時代的歐洲機遇
黃仁勳在演講結尾強調,新的工業革命已經開始,下一波AI浪潮已經啟動。歐洲擁有深厚的工業基礎和科學傳統,將在這場革命中扮演關鍵角色。
- 推理使用者從800萬增加到8億人(兩年內增長100倍)
- 每週生產1000套Grace Blackwell系統
- 歐洲AI運算能力兩年內增長10倍
- 2兆美元的歐洲生態系統合作夥伴關係
正如黃仁勳所說:「我們非常高興看到歐洲全力投入AI。在接下來的幾年中,這裡建設的AI基礎建設數量將增加一個數量級。」
NVIDIA GTC Paris 2025 黃仁勳完整演講紀錄
開場致意與歡迎
黃仁勳以法語向巴黎觀眾致意:
他強調這是NVIDIA首次在巴黎舉辦GTC大會,並特別感謝多年來的合作夥伴。雖然這是他第一次在巴黎舉辦GTC,但NVIDIA在歐洲已有很長的合作歷史。
CUDA-X生態系統展示
黃仁勳回顧NVIDIA的願景起源:
他詳細介紹了CUDA-X函式庫生態系統,這個生態系統讓加速運算變得特別的原因不僅僅是新的處理器,而是需要重新構思運算方式和演算法。
- Computational Lithography (cuLitho):半導體設計中最重要的應用之一,在TSMC、三星等大型晶圓廠中運行
- cuSolver:直接稀疏求解器和代數多網格求解器
- cuOpt:剛開源的令人興奮的應用函式庫,加速決策制定以優化數百萬變數和約束條件的問題
- Warp:用於表達幾何和物理求解器的Python框架
- cuDF和cuML:結構化資料庫和資料框架,經典機器學習演算法
- cuDNN:可能是NVIDIA有史以來創建的最重要函式庫,加速深度神經網路的基元
- Dynamo:全新函式庫,使複雜推理工作負載能夠在整個AI工廠中調度、協調和分散
黃仁勳表示,這些函式庫總共有400多個,每一個都加速特定應用領域,為開發者和生態系統夥伴開啟新機會。
CUDA-Q量子運算突破
黃仁勳宣布了量子運算領域的重大進展:
他回顧了量子運算的重要里程碑:
- 近30年前首次展示物理量子位元
- 1995年發明錯誤修正演算法
- 2023年Google展示世界第一個邏輯量子位元
黃仁勳預測邏輯量子位元數量將遵循類似摩爾定律的成長:每5年增長10倍,每10年增長100倍。這些邏輯量子位元將變得更好、錯誤修正能力更強、更穩定、性能更高、更有韌性,並持續可擴展。
黃仁勳強調,在接下來的幾年中,每一台下一代超級電腦都將配備QPU(量子處理單元)並連接到GPU。QPU將進行量子運算,而GPU將用於預處理、控制、錯誤修正以及後處理等運算密集型任務。
AI發展三個階段:從感知到智能體
黃仁勳詳細闡述了AI發展的三個重要階段:
第一波:感知AI - 讓電腦能夠識別和理解資訊
第二波:生成式AI - 多模態AI能夠學習圖像和語言,因此可以用語言提示並生成圖像
第三波:智能體AI - 現在正在開始的新浪潮
他解釋智能的基本要素包括理解、感知、推理、規劃任務如何解決問題,然後執行任務。這種能力讓我們能夠應用先前學到的規則來解決從未見過的問題。
在物理實現方面,智能體AI的體現就是生成動作而非生成影片、圖像或文字。這種AI生成局部動作的能力 - 如行走或伸手抓取物體、使用工具的能力,實際上就是機器人技術。
從GeForce到數位雙生的演進
黃仁勳回顧了NVIDIA的技術演進歷程,從GeForce帶來電腦圖形學開始:
然後深度學習革命性地改變了電腦圖形學,使NVIDIA能夠將電腦圖形學提升到全新水準。
黃仁勳特別強調接下來展示的所有內容都是電腦模擬,而非動畫:
由於現在模擬的規模和速度,幾乎所有東西都可以變成數位雙生。因為一切都可以成為數位雙生,所以可以在投入物理世界之前完全數位化地設計、規劃、優化和操作。
Grace Blackwell NVL72:思考機器的誕生
黃仁勳展示了NVIDIA最新的超級系統,並將其與原始GeForce進行對比:
- 重量:2.5噸
- 零件數量:120萬個
- 價格:約300萬美元
- 功耗:120千瓦
- 製造工廠:150座
- 技術合作夥伴:200家
- 研發預算:約400億美元
黃仁勳解釋Grace Blackwell的核心概念是將其設計為一個巨大的虛擬GPU。就像GeForce是一個GPU一樣,GB200也是一個巨大的虛擬GPU。為了實現這個目標,他們必須將其分解成許多元件,創建新的網路技術和互連技術。
從Hopper到Blackwell的革命性躍進
黃仁勳詳細比較了Hopper系統和新的Grace Blackwell系統:
Hopper系統包含8個GPU通過NVLink連接,加上CPU托盤和系統記憶體,構成一個AI超級電腦節點,價值約50萬美元。這是讓NVIDIA在AI領域聲名大噪的著名系統。
而整個Hopper系統(包括CPU)現在被單一的Grace Blackwell節點取代。一個運算托盤包含兩個CPU和四個GPU,性能超過整個Hopper系統,並且採用完全液冷設計。
為了連接多個系統,NVIDIA創建了革命性的NVLink系統。NVLink是記憶體語義互連,是運算結構而非網路。它直接連接到所有NVLink系統運算節點的CPU。
NVLink spine是100%銅質同軸電纜,直接連接所有NVLink晶片到所有GPU。整個spine上的144個Blackwell晶片或72個不同封裝能夠同時互相通信,無阻塞。
頻寬:130 TB/s - 超過全球網際網路尖峰流量的資料速率。
Blackwell推理性能的巨大躍進
黃仁勳解釋為什麼需要如此巨大的性能提升:
與一次性的ChatGPT不同,現在的推理模型會自我對話,產生大量代幣。當你思考時,你會逐步分解問題,推理,嘗試不同路徑 - 可能是思維鏈、思維樹、最佳回答,甚至會反思自己的答案。
這些思考模型和推理模型實現了令人難以置信的性能,但需要更多運算能力。
一個架構的多元應用:從雲端到邊緣
黃仁勳強調雖然全世界都在談論Grace Blackwell系統,但不是每個人和每個資料中心都能處理這些液冷系統。因此NVIDIA開發了多種配置:
- DGX Spark:桌面版Grace Blackwell系統
- DGX Station:桌邊系統
- RTX Pro Server:企業級系統
- 各種x86系統
所有這些系統從架構角度來看都是相同的,對軟體開發者而言看起來完全一樣,唯一區別是規模和速度。
RTX Pro Server:通用企業系統
黃仁勳特別介紹了RTX Pro Server,稱其為最複雜的系統之一:
- 8個Super NICs交換機連接8個GPU
- 200 Gbps最先進網路晶片
- 8個Blackwell RTX Pro 6000 GPU(剛投產)
- 世界上唯一能運行所有軟體的伺服器
- 支援AI、Omniverse、RTX遊戲、Windows、Linux、Kubernetes、VMware
- 甚至能運行《Crisis》遊戲
AI工廠:新型態的基礎建設
黃仁勳提出了一個重要觀察:
他強調這些AI工廠看起來像資料中心,因為裡面有很多電腦,但設計方式、製造規模、使用方式和操作方式都完全不同。
AI工廠現在是國家基礎建設的一部分,這就是為什麼黃仁勳在世界各地與國家元首會談,因為他們都希望擁有AI工廠,希望AI成為他們基礎建設的一部分,成為他們的成長製造業。
這代表了一場新的工業革命,因為每個行業都受到影響,AI成為了一個新的產業,就像電力和網際網路一樣,因為影響如此廣泛,成為了新的基礎建設。
歐洲AI基礎建設大規模擴張
- 歐洲Telcos AI基礎建設與NVIDIA合作
- 歐洲雲端服務供應商建設AI基礎建設
- 歐洲超級運算中心建設次世代AI超級電腦
- 額外規劃20座AI工廠,其中數座為千兆瓦級
七國AI技術中心建立
NVIDIA宣布與七個不同國家建立AI技術中心,目標包括:
- 協作研究
- 與新創公司合作
- 建立生態系統
黃仁勳展示了英國、德國、義大利等國的合作夥伴生態系統,特別強調了與各國研究機構、開發者、企業和雲端服務供應商的廣泛合作。
法國合作夥伴關係亮點
重要合作包括:
- Schneider Electric:數位化建設AI工廠
- Mistral AI:建立AI雲端合作夥伴關係
Nemotron:提升開源模型性能
黃仁勳展示了開源模型與專有模型的發展速度對比,強調開源模型只落後幾個月,包括Mistral、Llama、DeepSeek R1等都表現卓越。
Nemotron的改進包括:
- 後訓練優化
- 神經架構搜索
- 提供更好的資料
- 強化學習技術
- 增強推理能力
- 擴展上下文長度
所有這些能力都封裝在可下載的NIM中,可以直接從NVIDIA網站下載API和最先進的AI模型。
主權大型語言模型與區域合作
黃仁勳強調各國資料的重要性,以NVIDIA 33年的資料和西門子180年的資料為例,說明企業和國家應該使用自己的資料來增強開源模型。
NVIDIA還宣布與Perplexity合作,將區域模型連接到Perplexity中,讓使用者能夠用自己國家的語言、文化和感性來提問和獲得答案。
智能體AI:從單次對話到複雜推理
黃仁勳詳細說明了智能體AI如何解決早期AI的限制:
所有這些批評都是正確的,但相關技術正在世界各地開發,包括:
- 檢索增強生成(RAG)
- 網路搜尋
- 多模態理解
- 推理和規劃
- 自我評估
黃仁勳強調,原本在聊天機器人中的一個提示詞可能產生幾百個代幣,但現在通過智能體解決問題,必須產生一萬倍以上的代幣。這就是為什麼需要Grace Blackwell,為什麼系統需要如此高的性能提升。
NVIDIA企業AI智能體平台
黃仁勳解釋雖然有很多現成的智能體可以使用,但企業需要建立專門的智能體:
NVIDIA為此創建了一個完整的平台和框架:
- 底層:NVIDIA Nemo Nemotron推理大型語言模型
- 檢索:Nemo Retriever多模態語義搜尋引擎
- 藍圖:AIQ通用智能體示範
- 工具套件:智能體導入、資料策劃、評估、護欄、監督、訓練、強化學習到部署的完整工具
這個工具套件整合到AI運營生態系統中,企業可以從網站下載,也大量整合到AI運營生態系統中。
企業智能體應用案例
黃仁勳展示了多家公司如何使用NVIDIA平台建立專門的智能體:
- Cisco:為安全建立AI平台
- SAP:在NVIDIA上建立AI商業應用自動化
- DeepL:在NVIDIA上建立語言框架和平台
- PhotoRoom:影片編輯和AI編輯平台
- Codium:令人難以置信的編碼智能體
- Iola:語音平台
- 臨床試驗平台:世界最大的臨床試驗自動化平台
所有這些都基於相同概念:將Nemotron大型語言模型封裝在虛擬容器中,可以部署到任何地方,然後整合涵蓋AI智能體整個生命週期的函式庫。
DGX Cloud Lepton:雲端部署解決方案
為了解決在不同雲端環境部署智能體的挑戰,NVIDIA推出了DGX Cloud Lepton:
- 一個超級雲端(雲端的雲端)
- 統一部署到Lambda Cloud、AWS、GCP、開發者機器等
- 一個模型架構,一次部署,到處運行
- 從DGX Spark到大型雲端的無縫擴展
連接開發者與全球AI運算
NVIDIA宣布與Hugging Face合作,連接Lepton和Hugging Face:
工業AI:歐洲的歷史使命
黃仁勳特別向西門子的Roland Busch致意,強調歐洲在神經網路電腦發展史上的重要地位:
Roland Busch希望Jensen永遠不要忘記,1992年西門子就發明了神經網路電腦。NVIDIA與西門子在多個領域建立偉大的合作夥伴關係,從設計到模擬,到工廠數位雙生,到工廠中AI的運營。
這提醒了歐洲令人難以置信的工業能力,以及對歐洲來說這是多麼非凡的機會。AI是真正聰明的軟體,這個聰明軟體終於可以革命性地改變歐洲所服務的各個產業。
向歐洲的情書:工業革命的傳承
歐洲工業AI合作夥伴展示
黃仁勳展示了與歐洲主要工業公司的合作:
- BMW:在Omniverse中建立下一代工廠
- Kühne+Nagel:倉儲物流數位雙生
- Mercedes-Benz:工廠數位雙生
- Schäfer:倉儲數位雙生
- 法國火車站:火車站數位雙生
- Toyota:倉儲數位雙生
黃仁勳強調為什麼數位雙生必須看起來逼真並遵守物理定律:
這包括一個令人難以置信的複雜融合反應爐數位雙生,沒有AI,下一代融合反應爐將無法實現。
世界首個工業AI雲端
雖然這些工業AI雲端是大量雲端電腦,但其要求、性能和安全要求根本不同。黃仁勳表示週五將詳細說明,但今天只是預告部分內容。
這個工業雲端將用於:
- 設計和模擬
- 虛擬風洞 - 可以直接走進去的虛擬風洞
- 即時設計和模擬
- 數位工廠中的即時建造
- 讓機器人學習成為優秀機器人
- 建造未來的機器人
NVIDIA Drive自動駕駛平台
黃仁勳強調所有會移動的東西都將是機器人技術,都將由AI驅動,汽車是最明顯的下一個目標。
NVIDIA在三個層面建立AI超級電腦:
- 雲端訓練模型的AI超級電腦
- Omniverse數位雙生的AI超級電腦
- 機器人本身的AI超級電腦
在每種情況下,NVIDIA都提供完整的堆疊:電腦本身、運行在電腦上的作業系統,以及頂層的transformer模型。
- 高速感測器豊富
- 功能安全 - 在任何情況下都不能完全失效
- 極高的安全要求
- transformer推理模型
- 從感測器輸入到路徑規劃輸出
- 生成式AI模型基於transformer
NVIDIA的AV團隊是唯一連續兩年贏得CVPR端到端自動駕駛挑戰賽的團隊。
黃仁勳強調全球有10億輛汽車,平均每年行駛1萬英里,總計10兆英里。自動駕駛的未來顯然是巨大的,將由AI驅動。NVIDIA的核心是安全,特別自豪的是Halo系統,從晶片架構到系統設計、作業系統、AI模型、軟體開發方法、測試方式等全方位的安全設計。
NVIDIA Isaac機器人開發平台
黃仁勳解釋了人形機器人發展的關鍵突破:
人形機器人將可能成為有史以來最大的產業之一,需要知道如何製造東西的公司,製造具有非凡能力的東西。這對歐洲國家來說是巨大機會,因為世界許多產業都基於此。
假設世界上有10億個機器人是非常合理的想法。之前沒有實現的原因很簡單:今天的機器人太難編程了。只有最大的公司才能負擔得起安裝機器人、教導它、編程它做正確的事情。
現在NVIDIA將提供本質上可以教導的機器人,它們會從你那裡學習,就像討論智能體AI一樣,現在有了可以從你的教導中學習的人形AI。
- Thor電腦:機器人電腦,完全自包含的開發套件
- 機器人作業系統:專為機器人設計
- Transformer模型:接收感測器和指令,轉換並生成飛行路徑和馬達控制
人形機器人的最大挑戰是訓練所需的資料量很難獲得。解決方案是在遵守物理定律的Omniverse數位雙生世界中進行訓練。
NVIDIA最近宣布與迪士尼研究院和DeepMind建立重大合作夥伴關係,共同創建世界最複雜的物理模擬。
機器人Grock現場演示
黃仁勳解釋Grock在Omniverse中學習行走,遵守物理定律。在Omniverse中創造了數十萬種場景,當Grock學會在各種環境中操作、行走和操縱 - 沙地、碎石、滑地板、混凝土、地毯上,然後當Grock來到物理世界時,物理世界只是第100,001種版本的世界。
結語:新工業革命的開始
黃仁勳總結演講:
他強調現在擁有教導機器人操縱、模擬以及manifing令人難以置信機器人的技術。我們現在有物理機器人和資訊機器人(稱為智能體)。
下一波AI將需要推理工作負載呈指數增長。使用推理的人數從800萬增加到8億,兩年內增長100倍。每個提示產生的代幣數量從幾百個增加到數千個,我們比以往任何時候都更多地使用AI。
因此需要專門為思考和推理設計的特殊電腦,這就是Blackwell - 一台思考機器。這些Blackwell將進入新型資料中心,本質上是專為一件事設計的AI工廠:生產代幣。