
各位CIO和技術(shù)領(lǐng)袖:
過(guò)去十年,“云優(yōu)先”(Cloud-First)幾乎是IT界的政治正確。
普遍觀點(diǎn)認(rèn)為:上云 = 敏捷 + 擴(kuò)展性 + 成本效益。 但現(xiàn)實(shí)卻給了我們一記重拳。
VMware的最新調(diào)查顯示,企業(yè)31%的CIO浪費(fèi)了一半的云支出,2025年預(yù)計(jì)有445億美元被浪費(fèi)在未充分利用的資源上。
面對(duì)不斷攀升的開(kāi)支和AI帶來(lái)的新挑戰(zhàn),一場(chǎng)靜悄悄的革命正在發(fā)生。Hylaine技術(shù)副總裁Ryan McElroy斷言:“向云端的全面沖刺已經(jīng)結(jié)束。”
頂級(jí)企業(yè)如思科(Cisco)和寶潔(P&G),正在從“云優(yōu)先”轉(zhuǎn)向“云智能”(Cloud-Smart)。
今天,我將為你深度拆解這場(chǎng)變革背后的邏輯,以及CIO如何重新定義“云”的價(jià)值。
原因一:成本失控
“租用裝滿昂貴英偉達(dá)GPU的服務(wù)器整整三年,財(cái)務(wù)上將比直接購(gòu)買這些顯卡更為經(jīng)濟(jì)上損失慘重,”McElroy直言。在AI時(shí)代,云端的高昂推理成本和數(shù)據(jù)流出費(fèi)用(Egress Fees),正在吞噬企業(yè)的利潤(rùn)。
原因二:AI帶來(lái)的“數(shù)據(jù)重力”
AI不僅僅是算力,更是數(shù)據(jù)。思科的首席工程師Nik Kale指出,訓(xùn)練和微調(diào)大型模型需要對(duì)客戶數(shù)據(jù)有強(qiáng)有力的控制。 “云智能不僅僅是為了回歸(Repatriation)——而是讓AI的‘?dāng)?shù)據(jù)重力’與正確的控制平面對(duì)齊?!?/span>
思科并沒(méi)有完全拋棄公有云,而是變得更加“精明”。他們根據(jù)AI工作負(fù)載的特性,重新劃分了領(lǐng)地:
私有云(Private Cloud):訓(xùn)練、微調(diào)、客戶敏感數(shù)據(jù)。 思科將模型訓(xùn)練和反饋循環(huán)遷移到區(qū)域私有云,獲得了完整的審計(jì)能力,并顯著降低了數(shù)據(jù)傳輸成本。
邊緣計(jì)算(Edge/On-Prem):實(shí)時(shí)推理、特征提取。 在處理14萬(wàn)個(gè)客戶環(huán)境的拍字節(jié)級(jí)數(shù)據(jù)時(shí),思科將特征提取和異常檢測(cè)轉(zhuǎn)移到客戶本地采集器,只向云端發(fā)送高級(jí)別風(fēng)險(xiǎn)信號(hào)。結(jié)果:大幅降低了逃逸率,同時(shí)提升了模型真實(shí)度。
公有云(Public Cloud):編排、無(wú)狀態(tài)服務(wù)。 編排層和非敏感服務(wù)留在公有云,利用其彈性實(shí)現(xiàn)規(guī)模化。
【成效】這種混合架構(gòu)不僅改善了合規(guī)態(tài)勢(shì),還實(shí)現(xiàn)了兩位數(shù)的云支出減少。
World Insurance Associates的CIO Michael Corrigan展示了另一種“云智能”策略:用AI來(lái)管理AI成本。
他們?cè)O(shè)計(jì)了一套智能路由系統(tǒng):
簡(jiǎn)單查詢??小語(yǔ)言模型(SLM):消耗處理能力少,成本低。
復(fù)雜流程??大語(yǔ)言模型(LLM):只有當(dāng)SLM搞不定時(shí),才升級(jí)到昂貴的LLM。
“我們只使用基于復(fù)雜流程的真正需要消耗的部分,”Corrigan說(shuō)。
寶潔CTO Paola Lucetti將云戰(zhàn)略形容為“一個(gè)活的框架”(a living framework)。
從“云優(yōu)先”到“云智能”,本質(zhì)上是從“為了上云而上云”回歸到“為了業(yè)務(wù)價(jià)值而選擇基礎(chǔ)設(shè)施”。
對(duì)于CIO而言,這不僅是技術(shù)的抉擇,更是財(cái)務(wù)和戰(zhàn)略的成熟。正如McElroy所說(shuō):“任何盲目遷移到云端的人,現(xiàn)在都很難回頭。但那些擁有新思維的CIO,正在重新掌握主動(dòng)權(quán)?!?/span>
面對(duì)不斷攀升的開(kāi)支,IT 領(lǐng)導(dǎo)者正在重新思考云計(jì)算方法,使其更具成本效益和效率,并更符合業(yè)務(wù)價(jià)值的戰(zhàn)略性。

圖源:Rob Schultz /?Shutterstock
長(zhǎng)期以來(lái),普遍觀點(diǎn)認(rèn)為“云優(yōu)先”(cloud-first)的做法將為首席信息官(CIO)帶來(lái)敏捷性、可擴(kuò)展性和成本效益等應(yīng)用和工作負(fù)載的優(yōu)勢(shì)。雖然云仍然是大多數(shù)IT領(lǐng)導(dǎo)者首選的基礎(chǔ)設(shè)施平臺(tái),但許多人正在重新思考云戰(zhàn)略,從“云優(yōu)先”轉(zhuǎn)向“云智能”(cloud-smart),即選擇針對(duì)特定工作負(fù)載的最佳方案,而非僅僅將所有工作搬到外部,并將云置于其他考慮之上。
云成本優(yōu)化是促使這一重新思考的一個(gè)因素,組織在快速增長(zhǎng)的背景下難以控制不斷攀升的云費(fèi)用。根據(jù)VMware最近的一項(xiàng)調(diào)查,估計(jì)企業(yè)云基礎(chǔ)設(shè)施支出中有21%(相當(dāng)于2025年的445億美元)被浪費(fèi)在未充分利用的資源上——其中31%的CIO浪費(fèi)了一半的云支出。
技術(shù)咨詢公司Hylaine的技術(shù)副總裁Ryan McElroy表示,向云端的全面沖刺已經(jīng)結(jié)束。云智能組織擁有一套明確且經(jīng)過(guò)驗(yàn)證的流程,用于確定哪些工作負(fù)載最適合云端。
例如,McElroy說(shuō),“必須快速交付并支持未來(lái)大規(guī)模的項(xiàng)目應(yīng)該在云端構(gòu)建。那些依賴遺留技術(shù)、必須托管在虛擬機(jī)上或工作負(fù)載高度可預(yù)測(cè)且可持續(xù)多年的解決方案,應(yīng)部署到管理良好的數(shù)據(jù)中心?!?/span>
McElroy表示,云智能趨勢(shì)受到了更好的本地技術(shù)、更長(zhǎng)的硬件周期、與超大規(guī)模云服務(wù)提供商(hyperscalers)的超高利潤(rùn)率以及行業(yè)典型的炒作周期的影響。所有這些都支持混合基礎(chǔ)設(shè)施方案。
然而,他補(bǔ)充道:“人工智能(AI)又帶來(lái)了一個(gè)重大問(wèn)題——數(shù)據(jù)和計(jì)算的孤立。許多組織對(duì)構(gòu)建高性能GPU數(shù)據(jù)中心不感興趣或無(wú)法實(shí)現(xiàn),需要使用云端。但如果他們保守或成本規(guī)避,數(shù)據(jù)可能就在混合基礎(chǔ)設(shè)施的本地組件中?!?/span>
McElroy表示,這些變量導(dǎo)致了復(fù)雜性或意想不到的成本,無(wú)論是遷移費(fèi)用還是數(shù)據(jù)傳出費(fèi)用(data egress charges)。
他估計(jì),“只有10%的行業(yè)成員公開(kāi)承認(rèn)他們正在向云智能邁進(jìn)?!彪m然這個(gè)數(shù)字看起來(lái)偏低,但McElroy表示其意義重大。
“要調(diào)節(jié)云端姿態(tài)有很多前提條件,”他解釋道?!笆紫?,你通常必須是新任CIO或CTO。任何(曾經(jīng))遷移到云端的人都很難回頭?!?/span>
此外,組織還需要留住并提升管理其擁有數(shù)據(jù)中心或托管設(shè)施的人才。McElroy表示,他們還必須有超出云端在原始敏捷性和分時(shí)計(jì)算方面帶來(lái)好處的基礎(chǔ)設(shè)施需求。
一、選擇與重新評(píng)估合適的超大規(guī)模運(yùn)營(yíng)商
寶潔公司(Procter & Gamble)的CTO兼高級(jí)副總裁Paola Lucetti表示,公司在大約八年前開(kāi)始遷移工作負(fù)載時(shí),采用了云優(yōu)先戰(zhàn)略。Lucetti說(shuō),當(dāng)時(shí)的規(guī)定是所有新應(yīng)用都部署在公有云,現(xiàn)有工作負(fù)載將從傳統(tǒng)托管環(huán)境遷移到超大規(guī)模服務(wù)商。
“這種方法使我們能夠快速實(shí)現(xiàn)現(xiàn)代化,減少對(duì)遺留基礎(chǔ)設(shè)施的依賴,并利用云平臺(tái)所提供的可擴(kuò)展性和韌性,”她說(shuō)。
如今,幾乎所有P&G的工作負(fù)載都運(yùn)行在云端上。Lucetti說(shuō):“我們選擇將部分工作負(fù)載放在公有云之外,是因?yàn)槲覀儠?huì)定期重新評(píng)估延遲或性能需求。這一基礎(chǔ)在數(shù)字化轉(zhuǎn)型的關(guān)鍵階段為我們帶來(lái)了速度和靈活性?!?/span>
隨著公司的云生態(tài)系統(tǒng)日益成熟,其業(yè)務(wù)優(yōu)先事項(xiàng)也在不斷調(diào)整。“成本優(yōu)化、可持續(xù)性和敏捷性成為了核心,”她說(shuō)?!癙&G的云智能意味著選擇并定期重新評(píng)估適合特定工作負(fù)載的超大規(guī)模服務(wù)商,嵌入FinOps(金融運(yùn)營(yíng))實(shí)踐以實(shí)現(xiàn)透明度和治理,并利用混合架構(gòu)支持特定用例?!?/span>
Lucetti表示,這種方法通過(guò)自動(dòng)化、AI和代理(agentic)技術(shù)賦能開(kāi)發(fā)者,能夠更快地創(chuàng)造價(jià)值。“這種方法不僅僅是技術(shù)層面——更是文化層面。它體現(xiàn)了戰(zhàn)略靈活性的思維方式,技術(shù)決策與業(yè)務(wù)成果相契合?!?/span>
二、人工智能正在重塑云決策
McElroy表示,人工智能代表著巨大的潛在支出需求,并提高了基礎(chǔ)設(shè)施戰(zhàn)略的賭注。
他說(shuō):“租用裝滿昂貴英偉達(dá)GPU的服務(wù)器整天運(yùn)行三年,財(cái)務(wù)上將比直接購(gòu)買這些顯卡更為經(jīng)濟(jì)上損失慘重,但能夠無(wú)縫使用明年型號(hào)的靈活性可能帶來(lái)戰(zhàn)略優(yōu)勢(shì)?!?/span>
以思科(Cisco)為例,首席工程師兼產(chǎn)品架構(gòu)師Nik Kale表示,他們對(duì)公有云真正屬于什么變得更加深思熟慮。成本是一個(gè)因素,但主要驅(qū)動(dòng)力是人工智能數(shù)據(jù)治理。
“云智能不僅僅是為了回歸(repatriation)——而是讓AI的‘?dāng)?shù)據(jù)重力’與正確的控制平面對(duì)齊,”他說(shuō)。
IT部門已經(jīng)區(qū)分出哪些應(yīng)該放在私有云,哪些要進(jìn)入公有云。Kale解釋道:“訓(xùn)練和微調(diào)大型模型需要對(duì)客戶和遙測(cè)數(shù)據(jù)的強(qiáng)有力控制。因此,我們?cè)絹?lái)越傾向于混合架構(gòu),其中推理和數(shù)據(jù)處理在安全、私密的環(huán)境中進(jìn)行,而編排和非敏感服務(wù)則留在公有云中?!?/span>
思科的云智能戰(zhàn)略始于數(shù)據(jù)分類和工作負(fù)載分析。他說(shuō),任何具有客戶可識(shí)別信息、診斷痕跡和模型反饋循環(huán)的內(nèi)容,都將在區(qū)域合規(guī)的私有云中處理。
此外,還有“無(wú)狀態(tài)服務(wù)、內(nèi)容分發(fā)和遙測(cè)聚合,這些都受益于公有云彈性以實(shí)現(xiàn)規(guī)模和效率,”Kale說(shuō)。
他說(shuō),思科的方法還包括“將原本云端部署的功能打包到客戶環(huán)境中安全部署——在本地提供相同的AI驅(qū)動(dòng)洞察和自動(dòng)化,同時(shí)不將數(shù)據(jù)暴露給共享基礎(chǔ)設(shè)施。這為客戶提供了在不犧牲數(shù)據(jù)駐留權(quán)、隱私或成本的情況下,靈活采用AI能力?!?/span>
Kale表示,這些做法改善了思科的合規(guī)態(tài)勢(shì),降低了推斷延遲,并實(shí)現(xiàn)了可衡量的兩位數(shù)云支出減少。
人工智能在大規(guī)模威脅檢測(cè)領(lǐng)域,已經(jīng)從根本上改變了其云計(jì)算方法?!拔覀兡P偷脑缙诎姹就耆\(yùn)行在公有云上,但一旦我們開(kāi)始針對(duì)客戶特定的遙測(cè)進(jìn)行微調(diào),數(shù)據(jù)的敏感性和體量使得云端傳出(egress)既昂貴又難以治理,”他說(shuō)?!皩⑴嘤?xùn)和反饋循環(huán)遷移到區(qū)域私有云,使我們獲得了完整的審計(jì)能力,顯著降低了傳輸成本,同時(shí)保持推理混合,使受監(jiān)管地區(qū)的客戶能夠獲得亞秒級(jí)的響應(yīng)時(shí)間?!?/span>
IT部門也在其生成式AI支持助手中遇到了類似問(wèn)題。Kale說(shuō):“最初,病例記錄和診斷日志是在公有云LLM中處理的。隨著金融和醫(yī)療領(lǐng)域的客戶對(duì)數(shù)據(jù)流出其環(huán)境提出合理?yè)?dān)憂,我們重新設(shè)計(jì)了架構(gòu),使其能夠直接在其[虛擬專用云]或本地集群中運(yùn)行?!?/span>
Kale補(bǔ)充說(shuō),編排層仍存在于公有云,但敏感數(shù)據(jù)從未離開(kāi)其控制平面。
人工智能還重塑了思科客戶體驗(yàn)(CX)產(chǎn)品組合中遙測(cè)分析的處理方式。IT從超過(guò)14萬(wàn)個(gè)客戶環(huán)境中收集拍字節(jié)(PB)級(jí)的運(yùn)營(yíng)數(shù)據(jù)。
Kale說(shuō):“當(dāng)我們轉(zhuǎn)向?qū)崟r(shí)預(yù)測(cè)AI時(shí),將原始時(shí)間序列數(shù)據(jù)傳輸?shù)皆贫说某杀竞脱舆t成為瓶頸。通過(guò)將特征提取和異常檢測(cè)轉(zhuǎn)移到客戶本地采集器,并只向云端發(fā)送高級(jí)別風(fēng)險(xiǎn)信號(hào),我們大幅降低了數(shù)據(jù)傳出量,同時(shí)提升了模型的真實(shí)度?!?/span>
在所有情況下,“人工智能明確了架構(gòu)上的權(quán)衡:特定工作負(fù)載受益于公有云的彈性,但最敏感、數(shù)據(jù)密集且延遲最關(guān)鍵的人工智能功能需要更貼近數(shù)據(jù),”Kale說(shuō)?!皩?duì)我們來(lái)說(shuō),云智能已經(jīng)不再只是回歸,而是將數(shù)據(jù)重力、隱私邊界和推理經(jīng)濟(jì)學(xué)與正確的控制平面對(duì)齊?!?/span>
三、更經(jīng)濟(jì)的執(zhí)行路徑
與寶潔一樣,World Insurance Associates認(rèn)為云智能意味著實(shí)施FinOps框架。CIO Michael Corrigan表示,這意味著要根據(jù)業(yè)務(wù)用例為虛擬機(jī)構(gòu)建一個(gè)優(yōu)化且一致的版本,并了解所需的存儲(chǔ)和計(jì)算量。
這些是決定成本的主要驅(qū)動(dòng)因素,“因此我們根據(jù)用例制定了一套一致的環(huán)境規(guī)模標(biāo)準(zhǔn),”Corrigan說(shuō)。這賦予了World Insurance Corrigan所說(shuō)的自動(dòng)化架構(gòu)。
“然后我們優(yōu)化構(gòu)建,確保像彈性這樣的功能都開(kāi)啟了。所以當(dāng)服務(wù)通常在夜間未被使用時(shí),它們會(huì)關(guān)閉,減少存儲(chǔ)空間以關(guān)閉計(jì)算量”,所以公司并沒(méi)有為此買單,他說(shuō)。“一切都從優(yōu)化或標(biāo)準(zhǔn)的基礎(chǔ)開(kāi)始。”
World Insurance與其云服務(wù)提供商在不同層面的承諾上合作。以Microsoft為例,保險(xiǎn)公司可以選擇使用虛擬機(jī),或者Corrigan所說(shuō)的“預(yù)留實(shí)例”(reserved instance)。通過(guò)告訴供應(yīng)商他們計(jì)劃使用多少臺(tái)機(jī)器或打算花費(fèi)多少錢,他可以嘗試爭(zhēng)取折扣。
“這正是FinOps框架必須真正到位的地方……因?yàn)轱@然,你不想承諾一個(gè)你原本不會(huì)消費(fèi)的支出水平,”Corrigan說(shuō)?!斑@對(duì)消費(fèi)者或我們這些使用云服務(wù)的組織來(lái)說(shuō),是提前獲得非常顯著折扣的好方法?!?/span>
World Insurance正在利用人工智能進(jìn)行自動(dòng)化和警報(bào)。人工智能工具通?;谟?jì)算處理模型收費(fèi),“你可以設(shè)計(jì)查詢,使得如果是較簡(jiǎn)單的內(nèi)容,它會(huì)走更低成本的執(zhí)行路徑”,然后進(jìn)入一個(gè)小語(yǔ)言模型(SLM),后者消耗的處理能力較少,Corrigan說(shuō)。
用戶獲得滿意的結(jié)果,“因?yàn)槟阆牡牧繙p少,成本也更低”,他說(shuō)。
這就是公司采取的策略——將AI查詢路由到更便宜的模型上。如果有更復(fù)雜的工作流程或流程,會(huì)先被引導(dǎo)到SLM,“看看是否符合要求(checks the box),”Corrigan說(shuō)。如果需求更復(fù)雜,則會(huì)進(jìn)入下一階段,成本更高,通常涉及需要處理更多數(shù)據(jù)以滿足終端用戶需求的大型語(yǔ)言模型(LLM)。
“所以我們也嘗試用這種方式管理成本,只消耗基于復(fù)雜流程的真正需要消耗的部分,”他說(shuō)。
四、云是一個(gè)“活的框架”
Hylaine的McElroy表示,CIO和CTO需要更加開(kāi)放地討論混合基礎(chǔ)設(shè)施配置的優(yōu)勢(shì),以及過(guò)去幾年技術(shù)水平的變化。
“許多組織都在為云計(jì)算成本苦惱,盡管他們本能地知道云成本過(guò)高,但當(dāng)首席財(cái)務(wù)官(CFO)不知道自己錯(cuò)過(guò)了多少節(jié)省時(shí),幾乎沒(méi)有動(dòng)力去承擔(dān)高風(fēng)險(xiǎn)的回歸工作,”他說(shuō)。
Lucetti將寶潔的云戰(zhàn)略形容為“一個(gè)活的框架”(a living framework),并表示未來(lái)幾年公司將繼續(xù)利用合適的云能力,賦能AI和代理技術(shù)以實(shí)現(xiàn)商業(yè)價(jià)值。
“目標(biāo)很簡(jiǎn)單:讓技術(shù)與業(yè)務(wù)增長(zhǎng)保持一致,同時(shí)在快速變化的數(shù)字環(huán)境中保持敏捷,”她說(shuō)?!霸妻D(zhuǎn)型不是終點(diǎn)——而是一段旅程。在P&G,我們深知成功來(lái)自于將技術(shù)決策與業(yè)務(wù)成果相結(jié)合,并擁抱靈活性?!?/span>