將"新云"(neoclouds)視為云計算領(lǐng)域中聚焦專業(yè)領(lǐng)域的新興細分玩家——只要你為智能連接做好規(guī)劃,它們就能提供高性價比的AI功能。

圖源:Shutterstock.com - Shutterstock AI Generator
在過去兩年里,我注意到技術(shù)領(lǐng)導者談?wù)揂I基礎(chǔ)設(shè)施的方式發(fā)生了顯著變化。一年前,討論的焦點還集中在GPU的可用性和成本上;但如今,提出的問題不再那么絕對。無論是首席信息官還是首席技術(shù)官都在詢問那些被稱為"新云"的專業(yè)化AI云服務(wù)提供商是否真的已經(jīng)足夠成熟,以支撐企業(yè)的長期增長戰(zhàn)略。他們希望了解這些新興提供商與亞馬遜云科技(AWS)、微軟Azure和谷歌云等超大規(guī)模云服務(wù)商之間的關(guān)系定位,以及它們在一個均衡、具有韌性的云環(huán)境中能夠扮演何種角色。
"新云"通過摒棄傳統(tǒng)超大規(guī)模云服務(wù)商"樣樣通、樣樣松"的模式迅速崛起,轉(zhuǎn)而專注于一項專業(yè)化定位:以低于通用云服務(wù)商的價格提供面向AI工作負載的GPU算力。這一細分市場使它們得以極速擴張。根據(jù)Synergy Research Group的數(shù)據(jù),2025年"新云"收入突破230億美元,同比增長200%,預(yù)計到本年代末將達到1800億美元。但快速增長本身并不能回答企業(yè)決策者最關(guān)心的問題:這些平臺的可持續(xù)性和企業(yè)級就緒程度究竟如何?
在我看來,正確的態(tài)度不應(yīng)是將"新云"視為超大規(guī)模云服務(wù)商的替代品,也不應(yīng)將其當作實驗性的邊緣項目。它們是響應(yīng)真實市場需求而涌現(xiàn)的專業(yè)化基礎(chǔ)設(shè)施提供商。對首席信息官而言,更相關(guān)的問題是如何將其智能地整合到一種始終保持可移植性、韌性并符合監(jiān)管與性能要求的架構(gòu)之中。
一、訓練關(guān)乎算力容量,推理關(guān)乎用戶體驗
當我與考慮采用"新云"的企業(yè)團隊交流時,我通常會先問一個簡單的問題:你們主要是在訓練模型,還是在大規(guī)模運行推理?這個答案幾乎決定了后續(xù)的一切。
AI訓練通常是集中式的。大規(guī)模數(shù)據(jù)集被遷移到算力充沛且成本效益高的地方,往往是那些電力、土地和冷卻資源更容易獲取的地點。在這種環(huán)境下,原始算力容量和每GPU小時的價格理所應(yīng)當?shù)刂鲗в懻?。連接性依然重要,尤其是在使用新數(shù)據(jù)進行模型微調(diào)時,但很少成為決定性因素。工作負載可以容忍一定的距離,因為核心目標是吞吐量。
推理則完全顛覆了這一理念。一旦模型部署完成并開始為用戶提供服務(wù),響應(yīng)速度就成為成敗關(guān)鍵。每一次與AI智能體或應(yīng)用的交互,無論是機器對機器還是用戶對機器及其反向交互,都取決于請求傳輸?shù)侥P偷乃俣纫约绊憫?yīng)返回的快慢。盡管我們談?wù)摰氖菙?shù)字系統(tǒng),但物理學的原理并沒有消失。從很多方面來看,這是一個"物理+數(shù)字"的生態(tài)系統(tǒng),必須達到恰到好處的平衡。如果基礎(chǔ)設(shè)施距離用戶太遠,體驗就會變得緩慢而笨拙,導致許多AI應(yīng)用場景完全失效。我們大多數(shù)人都還記得,當年在線視頻需要盯著緩沖圖標等待內(nèi)容加載;AI推理現(xiàn)在正處于同樣的境地,只不過負責管理自主工廠或解讀自動駕駛汽車信號的AI系統(tǒng)無法容忍任何網(wǎng)絡(luò)延遲。
這就是我說的評估標準需要與技術(shù)同步演進。當推理成為優(yōu)先事項(現(xiàn)在往往如此),僅僅比較GPU規(guī)格和標價已經(jīng)不夠了。你需要了解提供商的地理位置、分布廣度以及它與你的用戶、合作伙伴和數(shù)據(jù)源之間的連接效率。推理獎勵的是鄰近性、韌性和架構(gòu)精良的連接性。隨著更多AI應(yīng)用場景投入生產(chǎn),這些因素開始直接影響業(yè)務(wù)成果,從客戶滿意度到員工生產(chǎn)力。
二、平衡成本與風險
"新云"之所以吸引如此多的關(guān)注,原因之一在于其定價易于比較。GPU小時費率公開透明,基準測試數(shù)據(jù)共享,采購團隊可以快速計算出相對于超大規(guī)模云服務(wù)商的潛在節(jié)省。某些成本節(jié)省空間極具吸引力——據(jù)Uptime Institute數(shù)據(jù)。例如,2025年從超大規(guī)模云服務(wù)商購買Nvidia DGX H100的平均成本為每小時98美元;但從"新云"購買同等實例時,成本降至34美元,總節(jié)省約達66%。在AI預(yù)算承壓之際,這種底線明晰性頗具吸引力。但在早期評估中不那么明顯的是提供商的連接能力態(tài)勢。對于推理密集型工作負載,連接性決定了延遲、韌性,最終影響用戶體驗。當我審視這一領(lǐng)域的提供商時,我的關(guān)注超越了硬件規(guī)格和價格。我希望了解它們的物理位置、分布廣度以及與接入網(wǎng)絡(luò)、企業(yè)網(wǎng)絡(luò)和其他云環(huán)境的互聯(lián)程度。
如果知道該關(guān)注什么,企業(yè)可以務(wù)實應(yīng)對。公共路由和對等互聯(lián)數(shù)據(jù)能夠揭示一個平臺的真實互聯(lián)程度,以及它是否依賴狹窄的上游提供商集合。地理覆蓋范圍、互聯(lián)節(jié)點的多樣性以及與用戶的鄰近性都會影響性能和連續(xù)性。我還建議應(yīng)用許多組織已在多云策略中使用的相同原則。很少有企業(yè)將所有關(guān)鍵工作負載置于單一提供商,同樣的準則也應(yīng)指導AI基礎(chǔ)設(shè)施決策。最佳實踐設(shè)想的是提供商的多樣性,故障轉(zhuǎn)移機制和網(wǎng)絡(luò)冗余設(shè)計是基礎(chǔ)設(shè)施設(shè)計的核心。在這方面,"新云"可以成為這一組合中的額外組成部分,在特定區(qū)域內(nèi)提供技術(shù)專業(yè)化和潛在的強大地理覆蓋。無論選擇哪些提供商,從一開始就面向可移植性和互操作性進行架構(gòu)設(shè)計,可以降低風險敞口并保持敏捷性和韌性。
三、主權(quán)正在成為架構(gòu)考量
除了性能和韌性,我還看到數(shù)據(jù)主權(quán)正從政策討論轉(zhuǎn)變?yōu)榛驹O(shè)計要求。數(shù)據(jù)保護法規(guī)已經(jīng)重塑了企業(yè)對存儲和處理的思考方式。歐盟《通用數(shù)據(jù)保護條例》(GDPR)的出臺迫使許多組織重新審視個人數(shù)據(jù)的存儲位置、跨境流動方式以及哪些第三方可以訪問。對某些企業(yè)而言,這意味著重構(gòu)云部署、重新談判合同或?qū)⒛承┕ぷ髫撦d本地化。隨著AI更深入地嵌入決策流程,類似的問題現(xiàn)在也被問及模型的訓練地點、托管地點以及哪些司法管轄區(qū)管轄對其的訪問。
不同之處在于,主權(quán)不再僅僅是合規(guī)問題,它現(xiàn)在影響著運營控制權(quán)。如果AI模型支撐客戶體驗或欺詐檢測等服務(wù)的自動化,企業(yè)需要確信該模型不會被以損害組織利益的方式篡改、限制或訪問。這使得數(shù)據(jù)流和基礎(chǔ)設(shè)施位置的透明度成為絕對必要。因此,在評估"新云"提供商時,我鼓勵決策者詢問數(shù)據(jù)在何處處理、流量如何在區(qū)域間流動以及圍繞司法管轄控制存在哪些保障措施。"新云"作為更年輕、更具區(qū)域性或本地化的云服務(wù)商,可以被利用來確保這一點。隨著監(jiān)管框架成熟和地緣政治緊張局勢持續(xù)塑造技術(shù)政策,這些早期架構(gòu)決策將產(chǎn)生深遠影響,而AI越是深入嵌入流程和系統(tǒng),這種影響就越顯著。
四、成熟度的體現(xiàn)
"新云"已在市場中站穩(wěn)腳跟,但若要在超大規(guī)模云服務(wù)商的激烈競爭風浪中實現(xiàn)可持續(xù)發(fā)展,它們需要以新的方式演進和差異化。它們早期的吸引力建立在成本效益和快速獲取GPU容量的基礎(chǔ)上。但隨著AI持續(xù)崛起,領(lǐng)導者需要就性能、韌性、可見性和控制提出更深入的問題。在我看來,這些問題被提出本身就意味著成熟而非不確定。當前最有效的策略是將"新云"視為超大規(guī)模云格局的補充,而不是二選一的決策。當用于合適的工作負載時,它們可以與成熟的超大規(guī)模云服務(wù)商并存,增加靈活性、選擇權(quán)和數(shù)據(jù)主權(quán)。它們是響應(yīng)真實需求的專業(yè)化基礎(chǔ)設(shè)施提供商,組織應(yīng)以對待任何新技術(shù)或提供商的方式對待它們——深思熟慮,并充分考慮它們?nèi)绾巫鳛橹С挚梢浦残浴⑼该鞫群晚g性的更廣泛架構(gòu)的一部分發(fā)揮作用。
AI將在未來幾年繼續(xù)重塑連接策略,隨著這一進程,曾經(jīng)感覺純粹技術(shù)性的基礎(chǔ)設(shè)施決策將越來越多地影響客戶體驗、監(jiān)管態(tài)勢和運營連續(xù)性。以這種更廣闊的視角評估"新云"的決策者,將是那些能夠超越炒作、為其企業(yè)創(chuàng)造持續(xù)優(yōu)勢的人。
睿觀:“新云”崛起:企業(yè)如何將專業(yè)AI算力融入現(xiàn)代云架構(gòu)?
隨著AI基礎(chǔ)設(shè)施的演進,企業(yè)IT領(lǐng)導者的關(guān)注點正從單純的GPU獲取成本,轉(zhuǎn)向?qū)Α靶略疲∟eoclouds)”成熟度的審視。這類摒棄了傳統(tǒng)超大規(guī)模云服務(wù)商(如AWS、Azure)“大而全”模式的新興玩家,憑借為AI工作負載提供極具性價比的專業(yè)GPU算力迅速崛起,2025年其市場收入已破230億美元。
面對這一迅猛趨勢,企業(yè)決策者不能僅被低價所吸引,而應(yīng)以全局視角評估并整合“新云”。其核心考量主要集中在以下三個維度:
一、區(qū)分業(yè)務(wù)場景:訓練看算力,推理看連接
AI訓練是集中式的,對地理位置容忍度高,核心是算力容量與成本;但AI推理直接決定了用戶體驗,對網(wǎng)絡(luò)延遲“零容忍”。因此,在推理主導的場景下,評估“新云”絕不能只看GPU標價,更要考量其物理節(jié)點的分布廣度、以及與用戶和企業(yè)網(wǎng)絡(luò)的連接效率。
二、平衡成本與風險:堅持多云策略與可移植性
“新云”在價格上極具殺傷力(例如同等實例成本可比巨頭低66%),但在享受成本紅利時必須兼顧風險控制。企業(yè)應(yīng)將現(xiàn)有的多云策略延伸至AI基礎(chǔ)設(shè)施,考察“新云”的網(wǎng)絡(luò)冗余度和對等互聯(lián)能力。從第一天起就以“可移植性”和“互操作性”為核心進行架構(gòu)設(shè)計,避免被單一供應(yīng)商綁定。
三、考量數(shù)據(jù)主權(quán):從合規(guī)升級為運營控制
隨著AI深度嵌入企業(yè)核心決策,數(shù)據(jù)與模型存放在哪里、受何種法律管轄變得至關(guān)重要。相比全球化的超大云巨頭,更具區(qū)域化、本地化特征的“新云”反而能更好地契合GDPR等嚴苛的數(shù)據(jù)隱私法規(guī),幫助企業(yè)實現(xiàn)敏感工作負載的本地化,確保對AI模型的絕對控制權(quán)。
面對“新云”的浪潮,在此奉上一句:?“將‘新云’視為超大規(guī)模云服務(wù)商的顛覆者是一種誤解,它們實則是構(gòu)建高韌性、高性價比且數(shù)據(jù)自主的現(xiàn)代AI架構(gòu)中不可或缺的專業(yè)拼圖?!?/span>
總而言之,“新云”不應(yīng)是巨頭的完全替代品,也不應(yīng)是邊緣實驗項目。CIO們唯有跨越價格炒作,將其智能地融入現(xiàn)有的多云生態(tài)中,兼顧性能、合規(guī)與連續(xù)性,才能在AI時代為企業(yè)構(gòu)筑持久的戰(zhàn)略優(yōu)勢。