
IDC重磅預(yù)測(cè):從“盲目擴(kuò)張”到“財(cái)務(wù)清算”,AI落地的至暗時(shí)刻
如果你的企業(yè)正在如火如荼地采購(gòu)GPU、租用云算力,準(zhǔn)備在AI賽道上大干一場(chǎng),那么IDC的一項(xiàng)最新預(yù)測(cè)可能會(huì)讓你背脊發(fā)涼。
預(yù)測(cè):到2027年,全球1000強(qiáng)企業(yè)將低估其AI基礎(chǔ)設(shè)施成本高達(dá)30%。
這不僅是簡(jiǎn)單的預(yù)算超支,更是一場(chǎng)即將來(lái)臨的“基礎(chǔ)設(shè)施清算”(Infrastructure Reckoning)。
為什么經(jīng)驗(yàn)豐富的CIO們會(huì)在AI成本上集體翻車?在這個(gè)萬(wàn)億級(jí)的燒錢游戲中,企業(yè)該如何守住錢袋子?
???讀完本文,你將獲得關(guān)于AI成本控制的3大核心洞察。
IDC副總裁Jevin Jensen指出,AI項(xiàng)目的成本結(jié)構(gòu)與傳統(tǒng)的ERP或IT系統(tǒng)根本不同。
傳統(tǒng)IT:線性增長(zhǎng),可預(yù)測(cè)。買多少服務(wù)器,跑多少業(yè)務(wù),一清二楚。
AI項(xiàng)目:指數(shù)增長(zhǎng),不可預(yù)測(cè)。
模型體積翻倍,算力消耗可能翻10倍。
推理成本是個(gè)無(wú)底洞:訓(xùn)練是一次性的,但推理是持續(xù)的。隨著業(yè)務(wù)量增長(zhǎng),推理成本會(huì)像滾雪球一樣失控。
隱形成本驚人:監(jiān)控、漂移檢測(cè)、合規(guī)檢查等“周邊系統(tǒng)”的算力消耗,有時(shí)甚至超過(guò)模型推理本身。
睿信咨詢顧問(wèn)解讀:
AI預(yù)算不再是一個(gè)靜態(tài)的Excel表格,而是一個(gè)“活的有機(jī)體”(Living Organism)。它會(huì)隨著數(shù)據(jù)、用戶行為和模型迭代而自我生長(zhǎng)、消耗資源。如果用管理傳統(tǒng)IT的思維去管理AI預(yù)算,爆倉(cāng)是必然的。
為什么現(xiàn)在的AI算力這么貴?
IBM CEO Arvind Krishna算了一筆賬:建設(shè)100吉瓦的數(shù)據(jù)中心需要8萬(wàn)億美元。要支付這筆巨資的利息,供應(yīng)商每年至少需要賺取8000億美元的利潤(rùn)。
這導(dǎo)致了一個(gè)殘酷的現(xiàn)實(shí):供需失衡與成本轉(zhuǎn)嫁。
AWS、微軟、谷歌等超大規(guī)模廠商(Hyperscalers)投入了數(shù)千億美元,他們必須在短期內(nèi)維持高價(jià),才能收回成本。
好消息是: IDC預(yù)測(cè),2027年之后,隨著競(jìng)爭(zhēng)加劇和硬件成本下降,AI基礎(chǔ)設(shè)施價(jià)格有望回落。
壞消息是: 在這之前,企業(yè)將不得不為供應(yīng)商的“軍備競(jìng)賽”買單。
面對(duì)不可預(yù)測(cè)的成本和供應(yīng)商的高價(jià)鐮刀,CIO唯一的防御武器是:FinOps(云財(cái)務(wù)運(yùn)營(yíng))。
但傳統(tǒng)的FinOps(只看賬單)已經(jīng)不夠用了。思科專家Nik Kale建議,必須升級(jí)為“AI FinOps”:
模型級(jí)監(jiān)控:不僅要看花了多少錢,還要看每個(gè)模型的具體表現(xiàn)。
“小模型”策略:引導(dǎo)團(tuán)隊(duì)使用能滿足需求的最小模型,而不是默認(rèn)使用最昂貴的SOTA(State-of-the-Art)模型。
GPU利用率優(yōu)化:解決由于調(diào)度不佳導(dǎo)致的GPU空轉(zhuǎn)問(wèn)題。
睿信咨詢顧問(wèn)解讀:
在AI時(shí)代,F(xiàn)inOps必須從“周期性審計(jì)”轉(zhuǎn)變?yōu)椤俺掷m(xù)性可視”。
CIO需要建立一個(gè)實(shí)時(shí)儀表盤(pán),一旦發(fā)現(xiàn)某個(gè)推理任務(wù)的Token消耗異常飆升,立即介入干預(yù)?!白屆恳环炙懔Χ蓟ㄔ诘度猩稀?,將成為AI團(tuán)隊(duì)的核心KPI。
為了避免成為那低估成本的30%,建議采取以下行動(dòng):
1、建立“混合架構(gòu)”以避免鎖定:不要把雞蛋放在一個(gè)籃子里。采用混合云架構(gòu),保持在不同供應(yīng)商之間遷移工作負(fù)載的能力,以此作為議價(jià)籌碼。
2、戰(zhàn)略性耐心(Strategic Patience):不要盲目追求最新技術(shù)。如果你的競(jìng)爭(zhēng)對(duì)手正在某個(gè)不成熟的AI項(xiàng)目上燒錢虧損,讓他們?nèi)ヌ?。做一個(gè)聰明的跟隨者(Smart Follower),等技術(shù)成熟、成本下降后再入場(chǎng)。
3、實(shí)施“模型瘦身”計(jì)劃:全面審查現(xiàn)有的AI應(yīng)用,問(wèn)一個(gè)問(wèn)題:“這個(gè)任務(wù)真的需要這么大的模型嗎?” 通過(guò)量化、壓縮或蒸餾技術(shù),將大模型替換為專用小模型,可立竿見(jiàn)影地降低成本。
AI是一場(chǎng)馬拉松,不是百米沖刺。
在這場(chǎng)長(zhǎng)跑中,決定勝負(fù)的不僅是誰(shuí)跑得快(技術(shù)),更是誰(shuí)跑得久(成本)。
CIO們,請(qǐng)立即啟動(dòng)你們的“基礎(chǔ)設(shè)施清算”,別讓AI的輝煌前景,被一張付不起的賬單扼殺。
IDC 表示,AI 消費(fèi)和定價(jià)的不可預(yù)測(cè)性,加上供應(yīng)商的巨額投資,將在未來(lái)幾年引發(fā)“基礎(chǔ)設(shè)施清算”。

圖源:Rob Schultz /?Shutterstock
IDC 預(yù)測(cè),未來(lái)幾年大型企業(yè)將嚴(yán)重誤估其 AI 基礎(chǔ)設(shè)施成本,這將促使更多 CIO 擴(kuò)大其 FinOps(金融運(yùn)營(yíng))團(tuán)隊(duì)的職能范圍。
IDC 基礎(chǔ)設(shè)施與運(yùn)營(yíng)研究副總裁 Jevin Jensen 表示,隨著 CIO 和財(cái)務(wù)領(lǐng)導(dǎo)者意識(shí)到標(biāo)準(zhǔn)預(yù)算預(yù)測(cè)方法對(duì)計(jì)算密集型 AI 項(xiàng)目無(wú)效,企業(yè) AI 用戶正走向一場(chǎng)“AI 基礎(chǔ)設(shè)施清算”。IDC 預(yù)測(cè),到 2027 年,全球 1000 強(qiáng)公司將低估其 AI 基礎(chǔ)設(shè)施成本達(dá)?30%。
Jensen 指出,加速 AI 項(xiàng)目的成本結(jié)構(gòu)與企業(yè)幾十年來(lái)部署的新 ERP 解決方案或其他 IT 系統(tǒng)有著根本不同。計(jì)算 GPU、推理、網(wǎng)絡(luò)和 Token(令牌)的成本可能比為傳統(tǒng) IT 系統(tǒng)制定預(yù)算要復(fù)雜得多,此外 CIO 還需要考慮安全性、治理和員工培訓(xùn)的成本。
他在一篇博客文章中寫(xiě)道:“AI 昂貴、不可預(yù)測(cè),與傳統(tǒng) IT 項(xiàng)目截然不同,且增長(zhǎng)速度超過(guò)了大多數(shù)預(yù)算所能追蹤的速度。AI 驅(qū)動(dòng)的應(yīng)用往往是資源密集型的,加上不透明的消費(fèi)模式,已經(jīng)超出了傳統(tǒng) IT 預(yù)算手冊(cè)的范疇。”
Jensen 寫(xiě)道,IT 領(lǐng)導(dǎo)者常常低估了與擴(kuò)展 AI 相關(guān)的定價(jià)復(fù)雜性。
摘自博客文章:“體積翻倍的模型可能消耗 10 倍的計(jì)算量。推理工作負(fù)載是持續(xù)運(yùn)行的,在訓(xùn)練結(jié)束后很久仍會(huì)持續(xù)消耗 GPU 周期。曾經(jīng)看似是一個(gè)固定預(yù)算條目的東西,現(xiàn)在卻像一個(gè)活生生的有機(jī)體——不可預(yù)測(cè)地生長(zhǎng)、適應(yīng)并消耗資源?!?/span>
一、無(wú)法回頭的時(shí)刻
隨著 CIO 們?cè)诠浪?AI 成本方面苦苦掙扎,一些批評(píng)人士指出,OpenAI 和 Anthropic 等大型 AI 廠商的瘋狂支出加劇了回收投資的壓力。在最近一期《Decoder》播客中,IBM 首席執(zhí)行官?Arvind Krishna警告稱,建設(shè) 100 吉瓦(GW)數(shù)據(jù)中心容量的成本約為?8 萬(wàn)億美元,這是支撐大型廠商 AI 雄心所需的預(yù)計(jì)燃料。
Krishna 說(shuō):“在我看來(lái),你不可能從中獲得回報(bào),因?yàn)?8 萬(wàn)億美元的資本支出(Capex)意味著你僅支付利息就需要大約?8000 億美元的利潤(rùn)。”
IBM 基礎(chǔ)設(shè)施首席運(yùn)營(yíng)官兼 IBM 系統(tǒng)總經(jīng)理?Barry Baker補(bǔ)充說(shuō),這筆賬怎么算都不對(duì)。他表示,短期內(nèi),建設(shè)單個(gè)吉瓦級(jí)數(shù)據(jù)中心的成本可能超過(guò)?750 億美元,這呼應(yīng)了他老板的擔(dān)憂。
Baker 說(shuō):“這些投資大多是并行發(fā)生的,導(dǎo)致需求遠(yuǎn)超供應(yīng),并大幅推高了成本等式中每一個(gè)要素的價(jià)格——從人力、混凝土到芯片。”
同時(shí),他補(bǔ)充道,AI 數(shù)據(jù)中心硬件的使用壽命是有限的。Baker 說(shuō):“除了這些驚人的數(shù)字之外,現(xiàn)實(shí)情況是實(shí)際的計(jì)算設(shè)備每隔幾年就需要更換一次,這就產(chǎn)生了一個(gè)持續(xù)的再投資周期,而許多組織在其長(zhǎng)期規(guī)劃中未能充分考慮到這一點(diǎn)?!?/span>
IDC 的 Jensen 同意,供應(yīng)商和超大規(guī)模云廠商(如 AWS、Microsoft Azure 和 Google Cloud)的巨額 AI 支出可能會(huì)在短期內(nèi)維持價(jià)格高位?!八麄?cè)噲D通過(guò)向你出售價(jià)值 1500 億美元的服務(wù),來(lái)回收他們數(shù)千億美元的成本,”他說(shuō)。
不過(guò),他預(yù)測(cè)?2027 年以后,AI 基礎(chǔ)設(shè)施價(jià)格應(yīng)該會(huì)下降。英偉達(dá)(Nvidia)等制造商的 GPU 價(jià)格可能會(huì)回落,超大規(guī)模企業(yè)和 AI 廠商最終可能會(huì)通過(guò)降價(jià)來(lái)刺激需求,以努力回收成本。
二、難以估算成本
一些專家表示,除了關(guān)于數(shù)據(jù)中心和 GPU 巨額支出的討論外,許多使用 AI 基礎(chǔ)設(shè)施服務(wù)的企業(yè) IT 領(lǐng)導(dǎo)者發(fā)現(xiàn)很難估算成本。
思科(Cisco)客戶體驗(yàn)工程、云安全和 AI 平臺(tái)首席工程師?Nik Kale表示,IDC 關(guān)于成本被低估的預(yù)測(cè)是可信的,甚至可能還保守了。他補(bǔ)充說(shuō),許多組織將 AI 基礎(chǔ)設(shè)施成本預(yù)測(cè)得就像可預(yù)測(cè)的云工作負(fù)載一樣。
“一旦模型被引入業(yè)務(wù),使用量會(huì)迅速擴(kuò)大,”他說(shuō)?!盀橐粋€(gè)團(tuán)隊(duì)設(shè)計(jì)的工作流程往往會(huì)變成全公司共享的服務(wù),導(dǎo)致需求顯著增長(zhǎng),而這在原始成本模型中并未被捕捉到?!?/span>
Kale 補(bǔ)充說(shuō),為了降低 AI 運(yùn)行風(fēng)險(xiǎn)所需的系統(tǒng)——包括監(jiān)控、漂移檢測(cè)、日志記錄和驗(yàn)證檢查——可能會(huì)比預(yù)期消耗更多的計(jì)算能力。
他說(shuō):“在幾個(gè)企業(yè)環(huán)境中,這些支持系統(tǒng)的成本已經(jīng)增長(zhǎng)到與模型推理本身相當(dāng),甚至更高。”
三、FinOps 的必要性
專家表示,CIO 在試圖確定 AI 基礎(chǔ)設(shè)施成本時(shí)需要采取預(yù)防措施。IDC 的 Jensen 認(rèn)為,企業(yè)對(duì)?FinOps(云財(cái)務(wù)運(yùn)營(yíng))解決方案的依賴日益增加,采用 FinOps 已不再是可選項(xiàng)。他指出,CIO 將對(duì)此負(fù)責(zé),因?yàn)?FinOps 團(tuán)隊(duì)最常見(jiàn)的匯報(bào)結(jié)構(gòu)通常設(shè)在 CIO 辦公室。
他說(shuō),F(xiàn)inOps 實(shí)踐對(duì)于理解特定企業(yè)最適合哪些 AI 項(xiàng)目至關(guān)重要。良好的 FinOps 實(shí)踐將迫使 IT 領(lǐng)導(dǎo)者專注于那些具有最佳 ROI 概率的 AI 項(xiàng)目,了解基礎(chǔ)設(shè)施成本,并隨著條件變化進(jìn)行調(diào)整。
“AI 已經(jīng)將技術(shù)支出從‘可預(yù)測(cè)的消費(fèi)’轉(zhuǎn)變?yōu)椤怕市孕袨椤?/span>,”他說(shuō)?!斑@意味著財(cái)務(wù)可見(jiàn)性必須變成持續(xù)性的,而不是周期性的?!?/span>
Jensen 說(shuō),IT 領(lǐng)導(dǎo)者應(yīng)首先關(guān)注那些容易獲勝的 AI 項(xiàng)目(Easy Wins),但每個(gè)組織的情況都不同;在一個(gè)企業(yè)相對(duì)簡(jiǎn)單的 AI 項(xiàng)目,在另一個(gè)企業(yè)可能根本無(wú)法實(shí)現(xiàn)。
“如果你有一個(gè)項(xiàng)目的想法,但你的競(jìng)爭(zhēng)對(duì)手正在上面虧錢,那就讓他們繼續(xù)虧錢,”他說(shuō)?!叭绻胁煌?,你就得改變策略。”
思科的 Kale 表示,采用 FinOps 實(shí)踐是一個(gè)好的開(kāi)始,但 IT 領(lǐng)導(dǎo)者需要更進(jìn)一步。傳統(tǒng)的 FinOps 提供了一種基于資源使用情況來(lái)跟蹤支出和分配成本的機(jī)制,但對(duì)于 AI,成本控制團(tuán)隊(duì)需要了解模型的性能,并識(shí)別組織在何處消耗了不必要的計(jì)算資源。
他說(shuō),F(xiàn)inOps 團(tuán)隊(duì)?wèi)?yīng)使用運(yùn)營(yíng)分析,不僅讓組織看到錢花在哪里,還要展示工作負(fù)載是如何運(yùn)行的。
“限制不必要資源消耗的一個(gè)可行策略是,引導(dǎo)團(tuán)隊(duì)使用能滿足特定任務(wù)的最小模型,”他補(bǔ)充道?!巴ǔ#?qǐng)求可以被重新路由到更小或蒸餾過(guò)的模型,而不會(huì)影響用戶體驗(yàn)?!?/span>
Kale 建議,F(xiàn)inOps 團(tuán)隊(duì)還應(yīng)評(píng)估其 AI 檢索系統(tǒng)、驗(yàn)證管道和策略檢查的設(shè)計(jì),確保它們獨(dú)立運(yùn)行,且運(yùn)行頻率不超過(guò)必要限度。
他補(bǔ)充說(shuō),CIO 還應(yīng)關(guān)注 GPU 的使用情況。“由于調(diào)度不佳和缺乏整合的工作負(fù)載管理,GPU 節(jié)點(diǎn)往往只運(yùn)行在其總?cè)萘康囊恍〔糠郑彼f(shuō)?!案倪M(jìn)的編排和工作負(fù)載放置可以帶來(lái)顯著的成本節(jié)約?!?/span>
四、避免供應(yīng)商鎖定
IBM 的 Baker 建議組織采用混合架構(gòu),以避免過(guò)度依賴單一 AI 基礎(chǔ)設(shè)施提供商。此外,CIO 應(yīng)始終關(guān)注運(yùn)行其 AI 工作負(fù)載所需的計(jì)算資源。
“合理調(diào)整(Right-sizing)AI 技術(shù)投資提供了顯著的節(jié)省機(jī)會(huì),”他補(bǔ)充道?!安⒎敲總€(gè)問(wèn)題都需要最大的模型或最快的響應(yīng)時(shí)間。”
Baker 說(shuō),組織應(yīng)考慮量化和壓縮技術(shù),并部署針對(duì)特定任務(wù)微調(diào)的較小模型,而不是通用的大語(yǔ)言模型?!笆褂眠m當(dāng)?shù)挠?jì)算資源,而不是默認(rèn)選擇可用的最強(qiáng)大選項(xiàng)?!?/span>
他補(bǔ)充說(shuō),許多組織也能從戰(zhàn)略性耐心中受益?!氨苊馔顿Y那些尚不需要的能力,可以讓組織向早期采用者學(xué)習(xí),因?yàn)楹笳咄袚?dān)‘過(guò)早入場(chǎng)’的代價(jià)。”
作者: Grant Gross