av婷婷久久网,91视频这里只有精品,91午夜福利一区二区,啊啊啊一区二区久久久,啪啪亚洲视频,www.插插,亚洲婷婷精品二区,开心五月激情射,久青草在在线

你好,歡迎您來(lái)到福建信息主管(CIO)網(wǎng)! 設(shè)為首頁(yè)|加入收藏|會(huì)員中心
您現(xiàn)在的位置:>> 新聞資訊 >>
你的AI預(yù)算可能會(huì)“爆倉(cāng)”——為何CIO將低估30%的基建成本?
作者:CIO.com&睿觀 來(lái)源:CIOCDO 發(fā)布時(shí)間:2025年12月24日 點(diǎn)擊數(shù):

這是一個(gè)可能會(huì)讓許多CIO在未來(lái)兩年內(nèi)“丟飯碗”的嚴(yán)峻預(yù)警。在AI狂熱的背后,是一筆筆算不清、管不住、甚至還不起的巨額賬單。我們不僅要看到30%的超支數(shù)字,更要看到數(shù)字背后的結(jié)構(gòu)性危機(jī):計(jì)算不可預(yù)測(cè)、供應(yīng)商成本轉(zhuǎn)嫁、以及缺乏有效的FinOps(財(cái)務(wù)運(yùn)營(yíng))治理。


IDC重磅預(yù)測(cè):從“盲目擴(kuò)張”到“財(cái)務(wù)清算”,AI落地的至暗時(shí)刻

如果你的企業(yè)正在如火如荼地采購(gòu)GPU、租用云算力,準(zhǔn)備在AI賽道上大干一場(chǎng),那么IDC的一項(xiàng)最新預(yù)測(cè)可能會(huì)讓你背脊發(fā)涼。

預(yù)測(cè):到2027年,全球1000強(qiáng)企業(yè)將低估其AI基礎(chǔ)設(shè)施成本高達(dá)30%。

這不僅是簡(jiǎn)單的預(yù)算超支,更是一場(chǎng)即將來(lái)臨的“基礎(chǔ)設(shè)施清算”(Infrastructure Reckoning)。

為什么經(jīng)驗(yàn)豐富的CIO們會(huì)在AI成本上集體翻車?在這個(gè)萬(wàn)億級(jí)的燒錢游戲中,企業(yè)該如何守住錢袋子?

???讀完本文,你將獲得關(guān)于AI成本控制的3大核心洞察。


?? 洞察一:AI成本是“生物體”,不是“死賬目”


IDC副總裁Jevin Jensen指出,AI項(xiàng)目的成本結(jié)構(gòu)與傳統(tǒng)的ERP或IT系統(tǒng)根本不同。

  • 傳統(tǒng)IT:線性增長(zhǎng),可預(yù)測(cè)。買多少服務(wù)器,跑多少業(yè)務(wù),一清二楚。

  • AI項(xiàng)目:指數(shù)增長(zhǎng),不可預(yù)測(cè)。

    • 模型體積翻倍,算力消耗可能翻10倍。

    • 推理成本是個(gè)無(wú)底洞:訓(xùn)練是一次性的,但推理是持續(xù)的。隨著業(yè)務(wù)量增長(zhǎng),推理成本會(huì)像滾雪球一樣失控。

    • 隱形成本驚人:監(jiān)控、漂移檢測(cè)、合規(guī)檢查等“周邊系統(tǒng)”的算力消耗,有時(shí)甚至超過(guò)模型推理本身。

睿信咨詢顧問(wèn)解讀:

AI預(yù)算不再是一個(gè)靜態(tài)的Excel表格,而是一個(gè)“活的有機(jī)體”(Living Organism)。它會(huì)隨著數(shù)據(jù)、用戶行為和模型迭代而自我生長(zhǎng)、消耗資源。如果用管理傳統(tǒng)IT的思維去管理AI預(yù)算,爆倉(cāng)是必然的。


?? 洞察二:供應(yīng)商的“回本焦慮”將轉(zhuǎn)嫁給客戶


為什么現(xiàn)在的AI算力這么貴?

IBM CEO Arvind Krishna算了一筆賬:建設(shè)100吉瓦的數(shù)據(jù)中心需要8萬(wàn)億美元。要支付這筆巨資的利息,供應(yīng)商每年至少需要賺取8000億美元的利潤(rùn)。

這導(dǎo)致了一個(gè)殘酷的現(xiàn)實(shí):供需失衡與成本轉(zhuǎn)嫁。

AWS、微軟、谷歌等超大規(guī)模廠商(Hyperscalers)投入了數(shù)千億美元,他們必須在短期內(nèi)維持高價(jià),才能收回成本。

好消息是: IDC預(yù)測(cè),2027年之后,隨著競(jìng)爭(zhēng)加劇和硬件成本下降,AI基礎(chǔ)設(shè)施價(jià)格有望回落。

壞消息是: 在這之前,企業(yè)將不得不為供應(yīng)商的“軍備競(jìng)賽”買單。


??? 洞察三:FinOps不再是選項(xiàng),而是救命稻草


面對(duì)不可預(yù)測(cè)的成本和供應(yīng)商的高價(jià)鐮刀,CIO唯一的防御武器是:FinOps(云財(cái)務(wù)運(yùn)營(yíng))。

但傳統(tǒng)的FinOps(只看賬單)已經(jīng)不夠用了。思科專家Nik Kale建議,必須升級(jí)為“AI FinOps”

  1. 模型級(jí)監(jiān)控:不僅要看花了多少錢,還要看每個(gè)模型的具體表現(xiàn)。

  2. “小模型”策略:引導(dǎo)團(tuán)隊(duì)使用能滿足需求的最小模型,而不是默認(rèn)使用最昂貴的SOTA(State-of-the-Art)模型。

  3. GPU利用率優(yōu)化:解決由于調(diào)度不佳導(dǎo)致的GPU空轉(zhuǎn)問(wèn)題。


睿信咨詢顧問(wèn)解讀:

在AI時(shí)代,F(xiàn)inOps必須從“周期性審計(jì)”轉(zhuǎn)變?yōu)椤俺掷m(xù)性可視”。

CIO需要建立一個(gè)實(shí)時(shí)儀表盤(pán),一旦發(fā)現(xiàn)某個(gè)推理任務(wù)的Token消耗異常飆升,立即介入干預(yù)?!白屆恳环炙懔Χ蓟ㄔ诘度猩稀?,將成為AI團(tuán)隊(duì)的核心KPI。


?? 戰(zhàn)略啟示:給CIO的避坑指南


為了避免成為那低估成本的30%,建議采取以下行動(dòng):

1、建立“混合架構(gòu)”以避免鎖定:不要把雞蛋放在一個(gè)籃子里。采用混合云架構(gòu),保持在不同供應(yīng)商之間遷移工作負(fù)載的能力,以此作為議價(jià)籌碼。

2、戰(zhàn)略性耐心(Strategic Patience):不要盲目追求最新技術(shù)。如果你的競(jìng)爭(zhēng)對(duì)手正在某個(gè)不成熟的AI項(xiàng)目上燒錢虧損,讓他們?nèi)ヌ?。做一個(gè)聰明的跟隨者(Smart Follower),等技術(shù)成熟、成本下降后再入場(chǎng)。

3、實(shí)施“模型瘦身”計(jì)劃:全面審查現(xiàn)有的AI應(yīng)用,問(wèn)一個(gè)問(wèn)題:“這個(gè)任務(wù)真的需要這么大的模型嗎?” 通過(guò)量化、壓縮或蒸餾技術(shù),將大模型替換為專用小模型,可立竿見(jiàn)影地降低成本。


總結(jié)

AI是一場(chǎng)馬拉松,不是百米沖刺。

在這場(chǎng)長(zhǎng)跑中,決定勝負(fù)的不僅是誰(shuí)跑得快(技術(shù)),更是誰(shuí)跑得久(成本)。

CIO們,請(qǐng)立即啟動(dòng)你們的“基礎(chǔ)設(shè)施清算”,別讓AI的輝煌前景,被一張付不起的賬單扼殺。



全文:CIO們將低估 30% 的 AI 基礎(chǔ)設(shè)施成本


IDC 表示,AI 消費(fèi)和定價(jià)的不可預(yù)測(cè)性,加上供應(yīng)商的巨額投資,將在未來(lái)幾年引發(fā)“基礎(chǔ)設(shè)施清算”。

圖源:Rob Schultz /?Shutterstock

IDC 預(yù)測(cè),未來(lái)幾年大型企業(yè)將嚴(yán)重誤估其 AI 基礎(chǔ)設(shè)施成本,這將促使更多 CIO 擴(kuò)大其 FinOps(金融運(yùn)營(yíng))團(tuán)隊(duì)的職能范圍。

IDC 基礎(chǔ)設(shè)施與運(yùn)營(yíng)研究副總裁 Jevin Jensen 表示,隨著 CIO 和財(cái)務(wù)領(lǐng)導(dǎo)者意識(shí)到標(biāo)準(zhǔn)預(yù)算預(yù)測(cè)方法對(duì)計(jì)算密集型 AI 項(xiàng)目無(wú)效,企業(yè) AI 用戶正走向一場(chǎng)“AI 基礎(chǔ)設(shè)施清算”。IDC 預(yù)測(cè),到 2027 年,全球 1000 強(qiáng)公司將低估其 AI 基礎(chǔ)設(shè)施成本達(dá)?30%。

Jensen 指出,加速 AI 項(xiàng)目的成本結(jié)構(gòu)與企業(yè)幾十年來(lái)部署的新 ERP 解決方案或其他 IT 系統(tǒng)有著根本不同。計(jì)算 GPU、推理、網(wǎng)絡(luò)和 Token(令牌)的成本可能比為傳統(tǒng) IT 系統(tǒng)制定預(yù)算要復(fù)雜得多,此外 CIO 還需要考慮安全性、治理和員工培訓(xùn)的成本。

他在一篇博客文章中寫(xiě)道:“AI 昂貴、不可預(yù)測(cè),與傳統(tǒng) IT 項(xiàng)目截然不同,且增長(zhǎng)速度超過(guò)了大多數(shù)預(yù)算所能追蹤的速度。AI 驅(qū)動(dòng)的應(yīng)用往往是資源密集型的,加上不透明的消費(fèi)模式,已經(jīng)超出了傳統(tǒng) IT 預(yù)算手冊(cè)的范疇。”

Jensen 寫(xiě)道,IT 領(lǐng)導(dǎo)者常常低估了與擴(kuò)展 AI 相關(guān)的定價(jià)復(fù)雜性。

摘自博客文章:“體積翻倍的模型可能消耗 10 倍的計(jì)算量。推理工作負(fù)載是持續(xù)運(yùn)行的,在訓(xùn)練結(jié)束后很久仍會(huì)持續(xù)消耗 GPU 周期。曾經(jīng)看似是一個(gè)固定預(yù)算條目的東西,現(xiàn)在卻像一個(gè)活生生的有機(jī)體——不可預(yù)測(cè)地生長(zhǎng)、適應(yīng)并消耗資源?!?/span>

一、無(wú)法回頭的時(shí)刻

隨著 CIO 們?cè)诠浪?AI 成本方面苦苦掙扎,一些批評(píng)人士指出,OpenAI 和 Anthropic 等大型 AI 廠商的瘋狂支出加劇了回收投資的壓力。在最近一期《Decoder》播客中,IBM 首席執(zhí)行官?Arvind Krishna警告稱,建設(shè) 100 吉瓦(GW)數(shù)據(jù)中心容量的成本約為?8 萬(wàn)億美元,這是支撐大型廠商 AI 雄心所需的預(yù)計(jì)燃料。

Krishna 說(shuō):“在我看來(lái),你不可能從中獲得回報(bào),因?yàn)?8 萬(wàn)億美元的資本支出(Capex)意味著你僅支付利息就需要大約?8000 億美元的利潤(rùn)。”

IBM 基礎(chǔ)設(shè)施首席運(yùn)營(yíng)官兼 IBM 系統(tǒng)總經(jīng)理?Barry Baker補(bǔ)充說(shuō),這筆賬怎么算都不對(duì)。他表示,短期內(nèi),建設(shè)單個(gè)吉瓦級(jí)數(shù)據(jù)中心的成本可能超過(guò)?750 億美元,這呼應(yīng)了他老板的擔(dān)憂。

Baker 說(shuō):“這些投資大多是并行發(fā)生的,導(dǎo)致需求遠(yuǎn)超供應(yīng),并大幅推高了成本等式中每一個(gè)要素的價(jià)格——從人力、混凝土到芯片。”

同時(shí),他補(bǔ)充道,AI 數(shù)據(jù)中心硬件的使用壽命是有限的。Baker 說(shuō):“除了這些驚人的數(shù)字之外,現(xiàn)實(shí)情況是實(shí)際的計(jì)算設(shè)備每隔幾年就需要更換一次,這就產(chǎn)生了一個(gè)持續(xù)的再投資周期,而許多組織在其長(zhǎng)期規(guī)劃中未能充分考慮到這一點(diǎn)?!?/span>

IDC 的 Jensen 同意,供應(yīng)商和超大規(guī)模云廠商(如 AWS、Microsoft Azure 和 Google Cloud)的巨額 AI 支出可能會(huì)在短期內(nèi)維持價(jià)格高位?!八麄?cè)噲D通過(guò)向你出售價(jià)值 1500 億美元的服務(wù),來(lái)回收他們數(shù)千億美元的成本,”他說(shuō)。

不過(guò),他預(yù)測(cè)?2027 年以后,AI 基礎(chǔ)設(shè)施價(jià)格應(yīng)該會(huì)下降。英偉達(dá)(Nvidia)等制造商的 GPU 價(jià)格可能會(huì)回落,超大規(guī)模企業(yè)和 AI 廠商最終可能會(huì)通過(guò)降價(jià)來(lái)刺激需求,以努力回收成本。

二、難以估算成本

一些專家表示,除了關(guān)于數(shù)據(jù)中心和 GPU 巨額支出的討論外,許多使用 AI 基礎(chǔ)設(shè)施服務(wù)的企業(yè) IT 領(lǐng)導(dǎo)者發(fā)現(xiàn)很難估算成本。

思科(Cisco)客戶體驗(yàn)工程、云安全和 AI 平臺(tái)首席工程師?Nik Kale表示,IDC 關(guān)于成本被低估的預(yù)測(cè)是可信的,甚至可能還保守了。他補(bǔ)充說(shuō),許多組織將 AI 基礎(chǔ)設(shè)施成本預(yù)測(cè)得就像可預(yù)測(cè)的云工作負(fù)載一樣。

“一旦模型被引入業(yè)務(wù),使用量會(huì)迅速擴(kuò)大,”他說(shuō)?!盀橐粋€(gè)團(tuán)隊(duì)設(shè)計(jì)的工作流程往往會(huì)變成全公司共享的服務(wù),導(dǎo)致需求顯著增長(zhǎng),而這在原始成本模型中并未被捕捉到?!?/span>

Kale 補(bǔ)充說(shuō),為了降低 AI 運(yùn)行風(fēng)險(xiǎn)所需的系統(tǒng)——包括監(jiān)控、漂移檢測(cè)、日志記錄和驗(yàn)證檢查——可能會(huì)比預(yù)期消耗更多的計(jì)算能力。

他說(shuō):“在幾個(gè)企業(yè)環(huán)境中,這些支持系統(tǒng)的成本已經(jīng)增長(zhǎng)到與模型推理本身相當(dāng),甚至更高。

三、FinOps 的必要性

專家表示,CIO 在試圖確定 AI 基礎(chǔ)設(shè)施成本時(shí)需要采取預(yù)防措施。IDC 的 Jensen 認(rèn)為,企業(yè)對(duì)?FinOps(云財(cái)務(wù)運(yùn)營(yíng))解決方案的依賴日益增加,采用 FinOps 已不再是可選項(xiàng)。他指出,CIO 將對(duì)此負(fù)責(zé),因?yàn)?FinOps 團(tuán)隊(duì)最常見(jiàn)的匯報(bào)結(jié)構(gòu)通常設(shè)在 CIO 辦公室。

他說(shuō),F(xiàn)inOps 實(shí)踐對(duì)于理解特定企業(yè)最適合哪些 AI 項(xiàng)目至關(guān)重要。良好的 FinOps 實(shí)踐將迫使 IT 領(lǐng)導(dǎo)者專注于那些具有最佳 ROI 概率的 AI 項(xiàng)目,了解基礎(chǔ)設(shè)施成本,并隨著條件變化進(jìn)行調(diào)整。

“AI 已經(jīng)將技術(shù)支出從‘可預(yù)測(cè)的消費(fèi)’轉(zhuǎn)變?yōu)椤怕市孕袨椤?/span>,”他說(shuō)?!斑@意味著財(cái)務(wù)可見(jiàn)性必須變成持續(xù)性的,而不是周期性的?!?/span>

Jensen 說(shuō),IT 領(lǐng)導(dǎo)者應(yīng)首先關(guān)注那些容易獲勝的 AI 項(xiàng)目(Easy Wins),但每個(gè)組織的情況都不同;在一個(gè)企業(yè)相對(duì)簡(jiǎn)單的 AI 項(xiàng)目,在另一個(gè)企業(yè)可能根本無(wú)法實(shí)現(xiàn)。

“如果你有一個(gè)項(xiàng)目的想法,但你的競(jìng)爭(zhēng)對(duì)手正在上面虧錢,那就讓他們繼續(xù)虧錢,”他說(shuō)?!叭绻胁煌?,你就得改變策略。”

思科的 Kale 表示,采用 FinOps 實(shí)踐是一個(gè)好的開(kāi)始,但 IT 領(lǐng)導(dǎo)者需要更進(jìn)一步。傳統(tǒng)的 FinOps 提供了一種基于資源使用情況來(lái)跟蹤支出和分配成本的機(jī)制,但對(duì)于 AI,成本控制團(tuán)隊(duì)需要了解模型的性能,并識(shí)別組織在何處消耗了不必要的計(jì)算資源。

他說(shuō),F(xiàn)inOps 團(tuán)隊(duì)?wèi)?yīng)使用運(yùn)營(yíng)分析,不僅讓組織看到錢花在哪里,還要展示工作負(fù)載是如何運(yùn)行的。

“限制不必要資源消耗的一個(gè)可行策略是,引導(dǎo)團(tuán)隊(duì)使用能滿足特定任務(wù)的最小模型,”他補(bǔ)充道?!巴ǔ#?qǐng)求可以被重新路由到更小或蒸餾過(guò)的模型,而不會(huì)影響用戶體驗(yàn)?!?/span>

Kale 建議,F(xiàn)inOps 團(tuán)隊(duì)還應(yīng)評(píng)估其 AI 檢索系統(tǒng)、驗(yàn)證管道和策略檢查的設(shè)計(jì),確保它們獨(dú)立運(yùn)行,且運(yùn)行頻率不超過(guò)必要限度。

他補(bǔ)充說(shuō),CIO 還應(yīng)關(guān)注 GPU 的使用情況。“由于調(diào)度不佳和缺乏整合的工作負(fù)載管理,GPU 節(jié)點(diǎn)往往只運(yùn)行在其總?cè)萘康囊恍〔糠郑彼f(shuō)?!案倪M(jìn)的編排和工作負(fù)載放置可以帶來(lái)顯著的成本節(jié)約?!?/span>

四、避免供應(yīng)商鎖定

IBM 的 Baker 建議組織采用混合架構(gòu),以避免過(guò)度依賴單一 AI 基礎(chǔ)設(shè)施提供商。此外,CIO 應(yīng)始終關(guān)注運(yùn)行其 AI 工作負(fù)載所需的計(jì)算資源。

合理調(diào)整(Right-sizing)AI 技術(shù)投資提供了顯著的節(jié)省機(jī)會(huì),”他補(bǔ)充道?!安⒎敲總€(gè)問(wèn)題都需要最大的模型或最快的響應(yīng)時(shí)間。”

Baker 說(shuō),組織應(yīng)考慮量化和壓縮技術(shù),并部署針對(duì)特定任務(wù)微調(diào)的較小模型,而不是通用的大語(yǔ)言模型?!笆褂眠m當(dāng)?shù)挠?jì)算資源,而不是默認(rèn)選擇可用的最強(qiáng)大選項(xiàng)?!?/span>

他補(bǔ)充說(shuō),許多組織也能從戰(zhàn)略性耐心中受益?!氨苊馔顿Y那些尚不需要的能力,可以讓組織向早期采用者學(xué)習(xí),因?yàn)楹笳咄袚?dān)‘過(guò)早入場(chǎng)’的代價(jià)。”

作者: Grant Gross

临猗县| 苍溪县| 平江县| 裕民县| 湖南省| 顺平县| 麻江县| 宜宾县| 孟州市| 洪雅县| 溧水县| 郧西县| 彭山县| 浦江县| 江山市| 文水县| 墨江| 乐业县| 铜陵市| 永年县| 宁海县| 房产| 田林县| 信丰县| 武山县| 噶尔县| 东乡族自治县| 义马市| 巴里| 滕州市| 连江县| 祁门县| 潮州市| 沂南县| 防城港市| 来安县| 泸定县| 绥化市| 林周县| 康平县| 大石桥市|