導(dǎo)語:很多企業(yè)滿懷信心地引入 AI 智能體(AI Agents),以為能大幅削減人力成本。但當(dāng)月底的賬單寄來時(shí),CIO 們卻傻眼了——在沒有嚴(yán)格控制的情況下,一個(gè) AI 智能體每天的 API 調(diào)用成本竟然高達(dá) 300 美元!折算下來年薪超過 10 萬美元,而它干的活,甚至還不到一個(gè)普通員工的一小部分。

這是近期硅谷頂級(jí)播客《All In Podcast》中爆出的殘酷真相。科技圈的大佬們正在發(fā)出警告:如果不加限制,你的 AI 代理比雇人還要貴得多。
一、為什么 AI 代理會(huì)變成“吞金獸”?
導(dǎo)致 AI 成本失控的幾個(gè)核心原因:
“大炮打蚊子”的粗放部署:給一個(gè)通用的大模型(如最頂配的 Claude 或 GPT-4)下達(dá)一個(gè)極其寬泛、邊界模糊的任務(wù),讓它無休止地進(jìn)行多步推理和循環(huán)。這就像雇了一個(gè)沒有明確工作范圍的外包團(tuán)隊(duì),賬單自然會(huì)讓你震驚。
盲目放權(quán)的代價(jià):很多工程師為了偷懶,讓 AI 智能體盲目地擦除和重寫大段代碼。這種“無人值守”的模式不僅消耗海量 Token,還會(huì)因?yàn)?AI 產(chǎn)生的幻覺和錯(cuò)誤,帶來巨大的安全和質(zhì)量風(fēng)險(xiǎn)。
缺乏集中可見性(影子 AI):團(tuán)隊(duì)里有人試用了一個(gè)智能體覺得不錯(cuò),于是口口相傳。突然之間,公司里同時(shí)跑著 15 個(gè)無人監(jiān)管的 AI 智能體,財(cái)務(wù)部門甚至不知道錢花在了哪里。
二、CIO 如何踩下剎車,扭虧為盈?
AI 依然是極其強(qiáng)大的生產(chǎn)力工具,前提是你必須學(xué)會(huì)“算經(jīng)濟(jì)賬”:
模型降維打擊:不是所有任務(wù)都需要最前沿的大模型。對(duì)于邊界清晰、重復(fù)性高的任務(wù),使用經(jīng)過微調(diào)的小參數(shù)模型(甚至在本地運(yùn)行),成本可以降低 10 倍以上。
物理硬性限額:像管理云資源一樣管理 AI智能體。為每個(gè)團(tuán)隊(duì)或工程師分配獨(dú)立的 API 密鑰,并設(shè)置絕對(duì)的每月資金消耗上限(Hard Cap)。
以“產(chǎn)出價(jià)值”衡量成本:如果一個(gè)高級(jí) SRE(站點(diǎn)可靠性工程師)年薪 20 萬美元,而一個(gè)定制化的垂直 AI 智能體能以極低的成本完成他 80% 的事故排查工作,這筆錢就花得值。
總結(jié):
“AI 是工具,不是你大腦的替代品?!蔽磥淼内A家,不是那些盲目堆砌 AI 智能體的公司,而是那些從第一天起,就將 AI 視為“可變成本運(yùn)營(yíng)資源”,并為其建立嚴(yán)格預(yù)算、審計(jì)和問責(zé)機(jī)制的企業(yè)。
全文:沒有管控的 AI 智能體,成本可能比雇傭員工還要高
播客主持人爆料稱 AI 智能體每天的消耗高達(dá) 300 美元,而人工智能專家表示:如果 IT 團(tuán)隊(duì)不對(duì)其使用設(shè)定嚴(yán)格的限制,這個(gè)夸張的數(shù)字完全是現(xiàn)實(shí)。

來源:Rob Schultz / Shutterstock
科技圈知名投資人 Jason Calacanis 和風(fēng)險(xiǎn)投資家 Chamath Palihapitiya(兩人也是熱門播客《All In Podcast》的聯(lián)合主持人)指出,如果沒有適當(dāng)?shù)目刂疲珹I 智能體(AI Agents)的消耗成本可能會(huì)遠(yuǎn)遠(yuǎn)超過其產(chǎn)出的實(shí)際價(jià)值。
在最近的一期節(jié)目中,資深科技投資者 Calacanis 透露,在他旗下的一家公司中,在使用 Claude API 時(shí),AI?智能體的成本迅速飆升至每天 300 美元。令人尷尬的是,這些相當(dāng)于“年薪 10 萬美元”的 AI?智能體,所能替代的僅僅是普通員工一小部分的工作量。
“Token(代幣)的消耗速度什么時(shí)候會(huì)超過員工的工資?”他質(zhì)問道。“答案是:你馬上就要越過這條紅線了。我也即將觸及這條紅線。”
Social Capital 風(fēng)險(xiǎn)投資公司的 CEO Palihapitiya 則表示,他的公司為最頂尖的開發(fā)者設(shè)定了明確的 Token 預(yù)算上限。他警告說,無節(jié)制地濫用 AI?智能體,代價(jià)將是極其昂貴的。
“如果你把所有員工的 AI 消耗加總起來,你會(huì)清晰地看到一種可怕的趨勢(shì),你會(huì)被迫去想:‘好吧,既然這些 AI 花了這么多錢,那員工的生產(chǎn)力現(xiàn)在至少得翻倍才行’,”他說。
他補(bǔ)充道,設(shè)置限制是絕對(duì)必要的,否則他很快就會(huì)把公司的錢燒光。
這期播客在 X(前 Twitter)和 LinkedIn 上引發(fā)了廣泛的討論。一些網(wǎng)友認(rèn)為 AI 公司的利潤(rùn)率實(shí)在太高了;而另一些人則表示,這兩位主持人的親身經(jīng)歷,恰恰證明了為什么企業(yè)必須對(duì) AI?智能體的支出保持嚴(yán)密的管控。
“這并不是在否定 AI?智能體的價(jià)值,”AI 解決方案供應(yīng)商 Addo AI 的 CEO Ayesha Khanna 在 LinkedIn 上寫道?!罢嬲膯栴}在于,你運(yùn)行 AI 的方式在經(jīng)濟(jì)學(xué)上是否站得住腳。遺憾的是,目前大多數(shù)團(tuán)隊(duì)的做法在經(jīng)濟(jì)上都是不劃算的?!?/span>
其他幾位 AI 專家也證實(shí),如果 IT 領(lǐng)導(dǎo)者不勒緊支出的韁繩,每天 300 美元的成本是完全可能發(fā)生的。但他們同時(shí)也指出,只要落實(shí)了正確的管控措施,AI 代理的成本根本不需要這么高。
“Fractional CTO(共享首席技術(shù)官)”服務(wù)提供商 Solidmatics 的 CEO Vygandas Pliasas 表示,如果沒有管控機(jī)制,當(dāng)企業(yè)使用昂貴且高度定制化的智能體系統(tǒng)進(jìn)行代碼編寫,并且通過不斷調(diào)用 API 來運(yùn)行,而不是直接使用現(xiàn)成的編程輔助工具時(shí),智能體的成本就會(huì)像火箭一樣飆升。
“有時(shí)我在一周內(nèi)的 API 消耗就能達(dá)到 500 美元,而且這還是在我采取了非??酥频摹⒂扇祟愔鲗?dǎo)的干預(yù)方式下產(chǎn)生的,”他說?!皢栴}的核心在于,如果你放任 AI?智能體盲目地擦除和重寫大段代碼,你其實(shí)已經(jīng)不再是自己真正在把控工作了,而且我也會(huì)對(duì)產(chǎn)出的代碼質(zhì)量打上一個(gè)巨大的問號(hào)?!?/span>
他補(bǔ)充說,允許 AI?智能體徹底接管編碼和其他核心任務(wù),極有可能引發(fā)安全漏洞和其他不可預(yù)知的風(fēng)險(xiǎn)。
“我總是強(qiáng)調(diào),AI 是工具,不是你大腦的替代品,”Pliasas 說?!澳惚仨氂媚愕拇竽X來主導(dǎo)。你利用 AI 來更快地尋找答案;但如果你盲目地信任它、放任它自動(dòng)運(yùn)行,那你遲早會(huì)收到那張?zhí)靸r(jià)賬單。而且,它產(chǎn)出的結(jié)果往往配不上這個(gè)價(jià)格?!?/span>
此外,AI 驅(qū)動(dòng)的站點(diǎn)可靠性工程(SRE)供應(yīng)商 Cleric 的 CEO 兼數(shù)據(jù)科學(xué)家 Shahram Anver 補(bǔ)充道,脫離具體語境去談?wù)摗懊刻?300 美元”的成本是具有誤導(dǎo)性的?!?span style="font-family: 微軟雅黑, "Microsoft YaHei"; font-size: 16px; -webkit-tap-highlight-color: rgba(0, 0, 0, 0); margin: 0px; padding: 0px; outline: 0px; max-width: 100%; font-weight: bold;">當(dāng)你給一個(gè)極其龐大、通用的 AI 模型下達(dá)了一個(gè)邊界非常寬泛的任務(wù),然后任由它去狂奔時(shí),天價(jià)賬單就會(huì)產(chǎn)生,”他說?!斑@就像你雇傭了一個(gè)外包團(tuán)隊(duì),卻沒有給出明確的工作范圍(Scope),等收到發(fā)票時(shí)你自然會(huì)驚掉下巴。”
Cleric 公司構(gòu)建了一個(gè)專門的站點(diǎn)可靠性工程(SRE)代理,其運(yùn)行成本僅僅是“每天 300 美元”的一小部分。因?yàn)樗兄鴺O其明確的特定目標(biāo),它知道該問什么問題,也知道在什么時(shí)候應(yīng)該停止運(yùn)行。
Anver 指出,在很多業(yè)務(wù)場(chǎng)景中,盡管存在成本超支的潛在風(fēng)險(xiǎn),但使用 AI?智能體依然比招聘更多的 IT 員工要?jiǎng)澦愕枚唷!耙粋€(gè)高級(jí) SRE 的年薪加上各種福利的完全成本(Fully loaded cost)超過 20 萬美元,”他補(bǔ)充道?!?span style="font-family: 微軟雅黑, "Microsoft YaHei"; font-size: 16px; -webkit-tap-highlight-color: rgba(0, 0, 0, 0); margin: 0px; padding: 0px; outline: 0px; max-width: 100%; font-weight: bold;">如果一個(gè) AI?智能體能以極其低廉的成本,完成這個(gè)專家 80% 的事故排查工作,那么真正重要的考量標(biāo)準(zhǔn)是‘這個(gè)智能體的產(chǎn)出是否足夠可靠’,而不是去計(jì)較它到底花了多少 API 調(diào)用費(fèi)。”
不過他警告說,如果 IT 領(lǐng)導(dǎo)者不設(shè)立規(guī)矩,企業(yè)依然很容易在這種新事物中迷失方向。
“大多數(shù)公司都在用交學(xué)費(fèi)的笨辦法來吸取教訓(xùn),”Anver 補(bǔ)充道?!皥F(tuán)隊(duì)里有個(gè)人為了完成某項(xiàng)任務(wù)偷偷啟動(dòng)了一個(gè)智能體,發(fā)現(xiàn)效果不錯(cuò),就告訴了隊(duì)友。突然之間,你的公司里同時(shí)跑著 15 個(gè)無人監(jiān)管的 AI?智能體,而你對(duì)它們到底在干什么、消耗了多少資源一無所知?!?/span>
專注于聊天機(jī)器人和技術(shù)支持優(yōu)化的 AI 提供商 Katico 的 CX/CS 軟件分析師 Kateryna Babenko 指出,部署 AI?智能體既有奢華的玩法,也有極其經(jīng)濟(jì)的玩法。
“如果你非要讓一個(gè)持續(xù)運(yùn)行的智能體(比如OpenClaw),去對(duì)接最昂貴的前沿模型(Frontier Model)API,并且伴隨著海量的 Token 消耗、超長(zhǎng)的上下文窗口、復(fù)雜的多步推理以及長(zhǎng)篇大論的輸出,那么這筆經(jīng)濟(jì)賬很快就會(huì)變得非常難看,”她說。“在某些極端情況下,AI 完成單項(xiàng)任務(wù)的成本,甚至比直接雇一個(gè)人來做還要高?!?/span>
然而,Babenko 補(bǔ)充說,如果將一個(gè)“任務(wù)邊界極其嚴(yán)密”的智能體,與一個(gè)經(jīng)過針對(duì)性微調(diào)的較小 AI 模型搭配使用(無論是在本地運(yùn)行,還是在受控的推理層上運(yùn)行),成本將呈斷崖式下降。
她指出,在這條智能體光譜的兩端,存在著完全不同的運(yùn)營(yíng)模式,但許多公司并沒有把它們區(qū)分開來?!八麄円宦牭健瓵I?智能體’這個(gè)詞,就理所當(dāng)然地認(rèn)為這只代表一種固定的支出類別,但事實(shí)并非如此,”她說。“這是一個(gè)極寬的光譜,一個(gè)精打細(xì)算的智能體部署與一個(gè)粗放式的草率部署之間,其運(yùn)營(yíng)成本的差距輕輕松松就能達(dá)到 10 倍以上。”
因此,她強(qiáng)烈建議 IT 領(lǐng)導(dǎo)者應(yīng)該基于具體任務(wù)進(jìn)行 Token 消耗量建模,在他們準(zhǔn)備使用的模型層級(jí)上建立推理成本基準(zhǔn),然后將這些成本與他們?cè)噲D替換或增強(qiáng)的傳統(tǒng)工作流的人力成本進(jìn)行嚴(yán)密的對(duì)比。
“真正能證明其成本合理性的 AI?智能體,是那些被應(yīng)用于‘人類極其厭惡的手工重復(fù)勞動(dòng)’的代理,這些任務(wù)必須具有明確的邊界,輸出結(jié)果易于自動(dòng)化檢查,并且人類監(jiān)督員能夠在錯(cuò)誤引發(fā)連鎖災(zāi)難之前,及時(shí)將其攔截,”Babenko 補(bǔ)充道。
IT 領(lǐng)導(dǎo)者不僅需要思考技術(shù)的實(shí)現(xiàn),更必須算清 AI?智能體的經(jīng)濟(jì)賬?!澳切┠軐?AI?智能體運(yùn)行得風(fēng)生水起的組織,一定是那些將 AI 視為‘可變成本運(yùn)營(yíng)資源’的組織。從引入 AI 的第一天起,他們就將預(yù)算、控制、所有權(quán)歸屬以及問責(zé)機(jī)制,深深地植入了系統(tǒng)的骨髓之中,”她說。
Solidmatics 的 Pliasas 建議對(duì) AI?智能體的使用設(shè)置硬性的預(yù)算上限(Caps)。他指出,目前主流的 AI 提供商都允許客戶為每個(gè) API 密鑰或整個(gè)組織設(shè)定絕對(duì)的支出上限。IT 領(lǐng)導(dǎo)者可以為每個(gè)團(tuán)隊(duì)甚至每位工程師生成獨(dú)立的 API 密鑰,并設(shè)置每月的美元消耗紅線。
對(duì)于像 Cursor、GitHub Copilot 或 Claude 專業(yè)版這類托管型 AI 工具,企業(yè)的 IT 團(tuán)隊(duì)?wèi)?yīng)該集中管理許可證(Licenses),統(tǒng)一決定誰有資格獲得使用席位、他們分配在哪個(gè)權(quán)限層級(jí),以及他們只能使用基礎(chǔ)模型還是可以訪問極其昂貴的高級(jí)模型。
然而,Pliasas 同時(shí)也建議 IT 領(lǐng)導(dǎo)者在預(yù)算上限的執(zhí)行上保持一定的靈活性。
“這最終取決于員工交付的價(jià)值,”他說?!?span style="font-family: 微軟雅黑, "Microsoft YaHei"; font-size: 16px; -webkit-tap-highlight-color: rgba(0, 0, 0, 0); margin: 0px; padding: 0px; outline: 0px; max-width: 100%; font-weight: bold;">如果一名頂級(jí)工程師正在借助 AI 推出高質(zhì)量、高影響力的核心功能,或許他一個(gè)人的產(chǎn)出,就相當(dāng)于一個(gè) 10 人團(tuán)隊(duì)辛苦一年的成果。在這種情況下,他消耗的高昂 API 成本絕對(duì)是物超所值的,你不能簡(jiǎn)單粗暴地拿這個(gè)數(shù)字去和一個(gè)普通員工的固定薪水做比較。”