來源租賃:財聯社
隨著新年以來Anthropic、字節跳動等AI巨頭不斷髮布爆款應用,疊加“龍蝦”熱潮推動開源大模型的呼叫激增,英偉達的H100晶片在租賃市場迎來身價“V型”反轉的高光時刻租賃。
要知道,這款晶片是黃仁勳在2022年3月GTC上釋出,同年秋季開始出貨的產品租賃。
據半導體研究機構SemiAnalysis週四推出的“H100一年期租賃合約價格指數”,這款“老晶片”的租賃合約價格從2025年10月觸及每小時1.7美元后,已經在今年3月飆升至每小時每塊GPU 2.35美元,飆升近40%租賃。
(來源:SemiAnalysis)
該指數基於對100多家雲服務提供商、算力資源的買家和賣家進行的直接調查資料構建,每月採集一次租賃。
最新報告指出,按需租用的GPU算力在所有型別GPU中都已售罄——即便近期價格上漲,那些已經鎖定按需例項的客戶也不願把這些算力釋放回資源池租賃。該機構也比喻稱,在2026年初尋找GPU算力,就像試圖預訂“最後一班離開航班”的機票一樣:價格高昂,而且幾乎沒有可用資源。
研究人員補充稱:“客戶正爭相以每塊GPU每小時14美元的價格搶購亞馬遜雲服務的p6-b200競價例項,一些新興雲服務巨頭(Neocloud Giants)甚至已經不再提供單節點銷售;部分英偉達H100 GPU仍按2—3年前簽訂時的原價續約,甚至有些H100合同直接續簽到2028年租賃。”
至於架構更先進的Blackwell晶片?研究人員表示,由於對開放權重模型的強勁需求以及推理需求的持續激增,新部署Blackwell的交付週期現在正延長至6到7個月租賃。
在2025年晚些時候,市場一度預期隨著效能更強、算力成本更低的Blackwell晶片加速部署,Hopper晶片(H100、H200)的租賃價格可能會出現大幅下降租賃。但最新的情況恰恰相反,現在市場對H100的需求不僅保持堅挺,在許多情況下甚至還在增強。
SemiAnalysis在報告中指出,今年初算力需求的重要驅動因素之一來自原生媒體生成租賃。例如,字節跳動的Seedance(即夢)和谷歌Nano Banana驅動使用者大量生成和最佳化影片/影像期間,推動詞元(token)吞吐量大幅上升。更顯著的需求來源是多智慧體(multi-agent)工作負載的興起,推動詞元使用量和算力消耗呈拋物線式增長。
SemiAnalysis表示,光是他們自己“在過去一週裡就消耗數十億詞元”,每百萬詞元成本在5美元左右租賃。不過公司也心滿意足地表示,由此節省的時間以及工作流程與能力的擴充套件,帶來的回報遠超算力成本。
報告也指出,算力供應收緊且價格上漲的動態,與廣泛的市場情緒存在脫節租賃。CoreWeave、Nebius等新興雲服務商的股價正處於過去6到12個月區間的低端。分析指出,目前市場仍然錨定在“終將出現供給過剩與算力商品化”的敘事框架上。但現實的情況卻是,在激進的供給緊張環境下,幾乎所有型別的算力資源都會保持旺盛需求——無論其相對效能差異如何。
展望未來,研究人員給出三個關鍵觀察點來判斷GPU租賃價格是否仍會維持高位租賃。
首先,隨著GB300叢集在整個2026年逐步放量,市場將關注新增供給究竟能否緩解當前的算力緊張局面租賃。其次,需要關注持續中的晶片短缺是否進一步惡化。最後,還要觀察各大AI巨頭的年度經常性收入(ARR)擴張情況,以及AI應用的普及速度和詞元消耗規模的持續增長節奏。