你的AI預(yù)算可能會(huì)“爆倉(cāng)”——為何CIO將低估30%的基建成本？

作者：CIO.com&睿觀來(lái)源：CIOCDO 發(fā)布時(shí)間：2025年12月24日點(diǎn)擊數(shù)：

這是一個(gè)可能會(huì)讓許多CIO在未來(lái)兩年內(nèi)“丟飯碗”的嚴(yán)峻預(yù)警。在AI狂熱的背后，是一筆筆算不清、管不住、甚至還不起的巨額賬單。我們不僅要看到30%的超支數(shù)字，更要看到數(shù)字背后的結(jié)構(gòu)性危機(jī)：計(jì)算不可預(yù)測(cè)、供應(yīng)商成本轉(zhuǎn)嫁、以及缺乏有效的FinOps（財(cái)務(wù)運(yùn)營(yíng)）治理。

IDC重磅預(yù)測(cè)：從“盲目擴(kuò)張”到“財(cái)務(wù)清算”，AI落地的至暗時(shí)刻

如果你的企業(yè)正在如火如荼地采購(gòu)GPU、租用云算力，準(zhǔn)備在AI賽道上大干一場(chǎng)，那么IDC的一項(xiàng)最新預(yù)測(cè)可能會(huì)讓你背脊發(fā)涼。

預(yù)測(cè)：到2027年，全球1000強(qiáng)企業(yè)將低估其AI基礎(chǔ)設(shè)施成本高達(dá)30%。

這不僅是簡(jiǎn)單的預(yù)算超支，更是一場(chǎng)即將來(lái)臨的“基礎(chǔ)設(shè)施清算”（Infrastructure Reckoning）。

為什么經(jīng)驗(yàn)豐富的CIO們會(huì)在AI成本上集體翻車？在這個(gè)萬(wàn)億級(jí)的燒錢游戲中，企業(yè)該如何守住錢袋子？

???讀完本文，你將獲得關(guān)于AI成本控制的3大核心洞察。

?? 洞察一：AI成本是“生物體”，不是“死賬目”

IDC副總裁Jevin Jensen指出，AI項(xiàng)目的成本結(jié)構(gòu)與傳統(tǒng)的ERP或IT系統(tǒng)根本不同。

傳統(tǒng)IT：線性增長(zhǎng)，可預(yù)測(cè)。買多少服務(wù)器，跑多少業(yè)務(wù)，一清二楚。
AI項(xiàng)目：指數(shù)增長(zhǎng)，不可預(yù)測(cè)。

模型體積翻倍，算力消耗可能翻10倍。
推理成本是個(gè)無(wú)底洞：訓(xùn)練是一次性的，但推理是持續(xù)的。隨著業(yè)務(wù)量增長(zhǎng)，推理成本會(huì)像滾雪球一樣失控。
隱形成本驚人：監(jiān)控、漂移檢測(cè)、合規(guī)檢查等“周邊系統(tǒng)”的算力消耗，有時(shí)甚至超過(guò)模型推理本身。

睿信咨詢顧問(wèn)解讀：

AI預(yù)算不再是一個(gè)靜態(tài)的Excel表格，而是一個(gè)“活的有機(jī)體”（Living Organism）。它會(huì)隨著數(shù)據(jù)、用戶行為和模型迭代而自我生長(zhǎng)、消耗資源。如果用管理傳統(tǒng)IT的思維去管理AI預(yù)算，爆倉(cāng)是必然的。

?? 洞察二：供應(yīng)商的“回本焦慮”將轉(zhuǎn)嫁給客戶

為什么現(xiàn)在的AI算力這么貴？

IBM CEO Arvind Krishna算了一筆賬：建設(shè)100吉瓦的數(shù)據(jù)中心需要8萬(wàn)億美元。要支付這筆巨資的利息，供應(yīng)商每年至少需要賺取8000億美元的利潤(rùn)。

這導(dǎo)致了一個(gè)殘酷的現(xiàn)實(shí)：供需失衡與成本轉(zhuǎn)嫁。

AWS、微軟、谷歌等超大規(guī)模廠商（Hyperscalers）投入了數(shù)千億美元，他們必須在短期內(nèi)維持高價(jià)，才能收回成本。

好消息是： IDC預(yù)測(cè)，2027年之后，隨著競(jìng)爭(zhēng)加劇和硬件成本下降，AI基礎(chǔ)設(shè)施價(jià)格有望回落。

壞消息是：在這之前，企業(yè)將不得不為供應(yīng)商的“軍備競(jìng)賽”買單。

??? 洞察三：FinOps不再是選項(xiàng)，而是救命稻草

面對(duì)不可預(yù)測(cè)的成本和供應(yīng)商的高價(jià)鐮刀，CIO唯一的防御武器是：FinOps（云財(cái)務(wù)運(yùn)營(yíng)）。

但傳統(tǒng)的FinOps（只看賬單）已經(jīng)不夠用了。思科專家Nik Kale建議，必須升級(jí)為“AI FinOps”：

模型級(jí)監(jiān)控：不僅要看花了多少錢，還要看每個(gè)模型的具體表現(xiàn)。
“小模型”策略：引導(dǎo)團(tuán)隊(duì)使用能滿足需求的最小模型，而不是默認(rèn)使用最昂貴的SOTA（State-of-the-Art）模型。
GPU利用率優(yōu)化：解決由于調(diào)度不佳導(dǎo)致的GPU空轉(zhuǎn)問(wèn)題。

睿信咨詢顧問(wèn)解讀：

在AI時(shí)代，F(xiàn)inOps必須從“周期性審計(jì)”轉(zhuǎn)變?yōu)椤俺掷m(xù)性可視”。
CIO需要建立一個(gè)實(shí)時(shí)儀表盤(pán)，一旦發(fā)現(xiàn)某個(gè)推理任務(wù)的Token消耗異常飆升，立即介入干預(yù)?！白屆恳环炙懔Χ蓟ㄔ诘度猩稀?，將成為AI團(tuán)隊(duì)的核心KPI。

?? 戰(zhàn)略啟示：給CIO的避坑指南

為了避免成為那低估成本的30%，建議采取以下行動(dòng)：

1、建立“混合架構(gòu)”以避免鎖定：不要把雞蛋放在一個(gè)籃子里。采用混合云架構(gòu)，保持在不同供應(yīng)商之間遷移工作負(fù)載的能力，以此作為議價(jià)籌碼。

2、戰(zhàn)略性耐心（Strategic Patience）：不要盲目追求最新技術(shù)。如果你的競(jìng)爭(zhēng)對(duì)手正在某個(gè)不成熟的AI項(xiàng)目上燒錢虧損，讓他們?nèi)ヌ?。做一個(gè)聰明的跟隨者（Smart Follower），等技術(shù)成熟、成本下降后再入場(chǎng)。

3、實(shí)施“模型瘦身”計(jì)劃：全面審查現(xiàn)有的AI應(yīng)用，問(wèn)一個(gè)問(wèn)題：“這個(gè)任務(wù)真的需要這么大的模型嗎？” 通過(guò)量化、壓縮或蒸餾技術(shù)，將大模型替換為專用小模型，可立竿見(jiàn)影地降低成本。

總結(jié)

AI是一場(chǎng)馬拉松，不是百米沖刺。

在這場(chǎng)長(zhǎng)跑中，決定勝負(fù)的不僅是誰(shuí)跑得快（技術(shù)），更是誰(shuí)跑得久（成本）。

CIO們，請(qǐng)立即啟動(dòng)你們的“基礎(chǔ)設(shè)施清算”，別讓AI的輝煌前景，被一張付不起的賬單扼殺。

全文：CIO們將低估 30% 的 AI 基礎(chǔ)設(shè)施成本

IDC 表示，AI 消費(fèi)和定價(jià)的不可預(yù)測(cè)性，加上供應(yīng)商的巨額投資，將在未來(lái)幾年引發(fā)“基礎(chǔ)設(shè)施清算”。

圖源：Rob Schultz /?Shutterstock

IDC 預(yù)測(cè)，未來(lái)幾年大型企業(yè)將嚴(yán)重誤估其 AI 基礎(chǔ)設(shè)施成本，這將促使更多 CIO 擴(kuò)大其 FinOps（金融運(yùn)營(yíng)）團(tuán)隊(duì)的職能范圍。

IDC 基礎(chǔ)設(shè)施與運(yùn)營(yíng)研究副總裁 Jevin Jensen 表示，隨著 CIO 和財(cái)務(wù)領(lǐng)導(dǎo)者意識(shí)到標(biāo)準(zhǔn)預(yù)算預(yù)測(cè)方法對(duì)計(jì)算密集型 AI 項(xiàng)目無(wú)效，企業(yè) AI 用戶正走向一場(chǎng)“AI 基礎(chǔ)設(shè)施清算”。IDC 預(yù)測(cè)，到 2027 年，全球 1000 強(qiáng)公司將低估其 AI 基礎(chǔ)設(shè)施成本達(dá)?30%。

Jensen 指出，加速 AI 項(xiàng)目的成本結(jié)構(gòu)與企業(yè)幾十年來(lái)部署的新 ERP 解決方案或其他 IT 系統(tǒng)有著根本不同。計(jì)算 GPU、推理、網(wǎng)絡(luò)和 Token（令牌）的成本可能比為傳統(tǒng) IT 系統(tǒng)制定預(yù)算要復(fù)雜得多，此外 CIO 還需要考慮安全性、治理和員工培訓(xùn)的成本。

他在一篇博客文章中寫(xiě)道：“AI 昂貴、不可預(yù)測(cè)，與傳統(tǒng) IT 項(xiàng)目截然不同，且增長(zhǎng)速度超過(guò)了大多數(shù)預(yù)算所能追蹤的速度。AI 驅(qū)動(dòng)的應(yīng)用往往是資源密集型的，加上不透明的消費(fèi)模式，已經(jīng)超出了傳統(tǒng) IT 預(yù)算手冊(cè)的范疇。”

Jensen 寫(xiě)道，IT 領(lǐng)導(dǎo)者常常低估了與擴(kuò)展 AI 相關(guān)的定價(jià)復(fù)雜性。

摘自博客文章：“體積翻倍的模型可能消耗 10 倍的計(jì)算量。推理工作負(fù)載是持續(xù)運(yùn)行的，在訓(xùn)練結(jié)束后很久仍會(huì)持續(xù)消耗 GPU 周期。曾經(jīng)看似是一個(gè)固定預(yù)算條目的東西，現(xiàn)在卻像一個(gè)活生生的有機(jī)體——不可預(yù)測(cè)地生長(zhǎng)、適應(yīng)并消耗資源?！?/span>

一、無(wú)法回頭的時(shí)刻

隨著 CIO 們?cè)诠浪?AI 成本方面苦苦掙扎，一些批評(píng)人士指出，OpenAI 和 Anthropic 等大型 AI 廠商的瘋狂支出加劇了回收投資的壓力。在最近一期《Decoder》播客中，IBM 首席執(zhí)行官?Arvind Krishna警告稱，建設(shè) 100 吉瓦（GW）數(shù)據(jù)中心容量的成本約為?8 萬(wàn)億美元，這是支撐大型廠商 AI 雄心所需的預(yù)計(jì)燃料。

Krishna 說(shuō)：“在我看來(lái)，你不可能從中獲得回報(bào)，因?yàn)?8 萬(wàn)億美元的資本支出（Capex）意味著你僅支付利息就需要大約?8000 億美元的利潤(rùn)。”

IBM 基礎(chǔ)設(shè)施首席運(yùn)營(yíng)官兼 IBM 系統(tǒng)總經(jīng)理?Barry Baker補(bǔ)充說(shuō)，這筆賬怎么算都不對(duì)。他表示，短期內(nèi)，建設(shè)單個(gè)吉瓦級(jí)數(shù)據(jù)中心的成本可能超過(guò)?750 億美元，這呼應(yīng)了他老板的擔(dān)憂。

Baker 說(shuō)：“這些投資大多是并行發(fā)生的，導(dǎo)致需求遠(yuǎn)超供應(yīng)，并大幅推高了成本等式中每一個(gè)要素的價(jià)格——從人力、混凝土到芯片。”

同時(shí)，他補(bǔ)充道，AI 數(shù)據(jù)中心硬件的使用壽命是有限的。Baker 說(shuō)：“除了這些驚人的數(shù)字之外，現(xiàn)實(shí)情況是實(shí)際的計(jì)算設(shè)備每隔幾年就需要更換一次，這就產(chǎn)生了一個(gè)持續(xù)的再投資周期，而許多組織在其長(zhǎng)期規(guī)劃中未能充分考慮到這一點(diǎn)?！?/span>

IDC 的 Jensen 同意，供應(yīng)商和超大規(guī)模云廠商（如 AWS、Microsoft Azure 和 Google Cloud）的巨額 AI 支出可能會(huì)在短期內(nèi)維持價(jià)格高位?！八麄?cè)噲D通過(guò)向你出售價(jià)值 1500 億美元的服務(wù)，來(lái)回收他們數(shù)千億美元的成本，”他說(shuō)。

不過(guò)，他預(yù)測(cè)?2027 年以后，AI 基礎(chǔ)設(shè)施價(jià)格應(yīng)該會(huì)下降。英偉達(dá)（Nvidia）等制造商的 GPU 價(jià)格可能會(huì)回落，超大規(guī)模企業(yè)和 AI 廠商最終可能會(huì)通過(guò)降價(jià)來(lái)刺激需求，以努力回收成本。

二、難以估算成本

一些專家表示，除了關(guān)于數(shù)據(jù)中心和 GPU 巨額支出的討論外，許多使用 AI 基礎(chǔ)設(shè)施服務(wù)的企業(yè) IT 領(lǐng)導(dǎo)者發(fā)現(xiàn)很難估算成本。

思科（Cisco）客戶體驗(yàn)工程、云安全和 AI 平臺(tái)首席工程師?Nik Kale表示，IDC 關(guān)于成本被低估的預(yù)測(cè)是可信的，甚至可能還保守了。他補(bǔ)充說(shuō)，許多組織將 AI 基礎(chǔ)設(shè)施成本預(yù)測(cè)得就像可預(yù)測(cè)的云工作負(fù)載一樣。

“一旦模型被引入業(yè)務(wù)，使用量會(huì)迅速擴(kuò)大，”他說(shuō)?！盀橐粋€(gè)團(tuán)隊(duì)設(shè)計(jì)的工作流程往往會(huì)變成全公司共享的服務(wù)，導(dǎo)致需求顯著增長(zhǎng)，而這在原始成本模型中并未被捕捉到?！?/span>

Kale 補(bǔ)充說(shuō)，為了降低 AI 運(yùn)行風(fēng)險(xiǎn)所需的系統(tǒng)——包括監(jiān)控、漂移檢測(cè)、日志記錄和驗(yàn)證檢查——可能會(huì)比預(yù)期消耗更多的計(jì)算能力。

他說(shuō)：“在幾個(gè)企業(yè)環(huán)境中，這些支持系統(tǒng)的成本已經(jīng)增長(zhǎng)到與模型推理本身相當(dāng)，甚至更高。”

三、FinOps 的必要性

專家表示，CIO 在試圖確定 AI 基礎(chǔ)設(shè)施成本時(shí)需要采取預(yù)防措施。IDC 的 Jensen 認(rèn)為，企業(yè)對(duì)?FinOps（云財(cái)務(wù)運(yùn)營(yíng)）解決方案的依賴日益增加，采用 FinOps 已不再是可選項(xiàng)。他指出，CIO 將對(duì)此負(fù)責(zé)，因?yàn)?FinOps 團(tuán)隊(duì)最常見(jiàn)的匯報(bào)結(jié)構(gòu)通常設(shè)在 CIO 辦公室。

他說(shuō)，F(xiàn)inOps 實(shí)踐對(duì)于理解特定企業(yè)最適合哪些 AI 項(xiàng)目至關(guān)重要。良好的 FinOps 實(shí)踐將迫使 IT 領(lǐng)導(dǎo)者專注于那些具有最佳 ROI 概率的 AI 項(xiàng)目，了解基礎(chǔ)設(shè)施成本，并隨著條件變化進(jìn)行調(diào)整。

“AI 已經(jīng)將技術(shù)支出從‘可預(yù)測(cè)的消費(fèi)’轉(zhuǎn)變?yōu)椤怕市孕袨椤?/span>，”他說(shuō)?！斑@意味著財(cái)務(wù)可見(jiàn)性必須變成持續(xù)性的，而不是周期性的?！?/span>

Jensen 說(shuō)，IT 領(lǐng)導(dǎo)者應(yīng)首先關(guān)注那些容易獲勝的 AI 項(xiàng)目（Easy Wins），但每個(gè)組織的情況都不同；在一個(gè)企業(yè)相對(duì)簡(jiǎn)單的 AI 項(xiàng)目，在另一個(gè)企業(yè)可能根本無(wú)法實(shí)現(xiàn)。

“如果你有一個(gè)項(xiàng)目的想法，但你的競(jìng)爭(zhēng)對(duì)手正在上面虧錢，那就讓他們繼續(xù)虧錢，”他說(shuō)?！叭绻胁煌?，你就得改變策略。”

思科的 Kale 表示，采用 FinOps 實(shí)踐是一個(gè)好的開(kāi)始，但 IT 領(lǐng)導(dǎo)者需要更進(jìn)一步。傳統(tǒng)的 FinOps 提供了一種基于資源使用情況來(lái)跟蹤支出和分配成本的機(jī)制，但對(duì)于 AI，成本控制團(tuán)隊(duì)需要了解模型的性能，并識(shí)別組織在何處消耗了不必要的計(jì)算資源。

他說(shuō)，F(xiàn)inOps 團(tuán)隊(duì)?wèi)?yīng)使用運(yùn)營(yíng)分析，不僅讓組織看到錢花在哪里，還要展示工作負(fù)載是如何運(yùn)行的。

“限制不必要資源消耗的一個(gè)可行策略是，引導(dǎo)團(tuán)隊(duì)使用能滿足特定任務(wù)的最小模型，”他補(bǔ)充道?！巴ǔ＃?qǐng)求可以被重新路由到更小或蒸餾過(guò)的模型，而不會(huì)影響用戶體驗(yàn)?！?/span>

Kale 建議，F(xiàn)inOps 團(tuán)隊(duì)還應(yīng)評(píng)估其 AI 檢索系統(tǒng)、驗(yàn)證管道和策略檢查的設(shè)計(jì)，確保它們獨(dú)立運(yùn)行，且運(yùn)行頻率不超過(guò)必要限度。

他補(bǔ)充說(shuō)，CIO 還應(yīng)關(guān)注 GPU 的使用情況。“由于調(diào)度不佳和缺乏整合的工作負(fù)載管理，GPU 節(jié)點(diǎn)往往只運(yùn)行在其總?cè)萘康囊恍〔糠郑彼f(shuō)?！案倪M(jìn)的編排和工作負(fù)載放置可以帶來(lái)顯著的成本節(jié)約?！?/span>

四、避免供應(yīng)商鎖定

IBM 的 Baker 建議組織采用混合架構(gòu)，以避免過(guò)度依賴單一 AI 基礎(chǔ)設(shè)施提供商。此外，CIO 應(yīng)始終關(guān)注運(yùn)行其 AI 工作負(fù)載所需的計(jì)算資源。

“合理調(diào)整（Right-sizing）AI 技術(shù)投資提供了顯著的節(jié)省機(jī)會(huì)，”他補(bǔ)充道?！安⒎敲總€(gè)問(wèn)題都需要最大的模型或最快的響應(yīng)時(shí)間。”

Baker 說(shuō)，組織應(yīng)考慮量化和壓縮技術(shù)，并部署針對(duì)特定任務(wù)微調(diào)的較小模型，而不是通用的大語(yǔ)言模型?！笆褂眠m當(dāng)?shù)挠?jì)算資源，而不是默認(rèn)選擇可用的最強(qiáng)大選項(xiàng)?！?/span>

他補(bǔ)充說(shuō)，許多組織也能從戰(zhàn)略性耐心中受益?！氨苊馔顿Y那些尚不需要的能力，可以讓組織向早期采用者學(xué)習(xí)，因?yàn)楹笳咄袚?dān)‘過(guò)早入場(chǎng)’的代價(jià)。”

作者： Grant Gross

上一篇：別再教AI“怎么做”了！從AI工具到“自主…

下一篇：別再假裝“懂業(yè)務(wù)”了！CIO提升影響力的…

av婷婷久久网,91视频这里只有精品,91午夜福利一区二区,啊啊啊一区二区久久久,啪啪亚洲视频,www.插插,亚洲婷婷精品二区,开心五月激情射,久青草在在线