由于缺乏對(duì)代理型人工智能的標(biāo)準(zhǔn)描述,首席信息官可能會(huì)購買錯(cuò)誤的人工智能工具,或者為未按宣傳效果運(yùn)作的產(chǎn)品支付更多費(fèi)用。

圖片來源:Rob Schultz / Shutterstock
代理型人工智能已取代生成式人工智能,登上了技術(shù)炒作周期的頂端,但存在一個(gè)重大問題:目前尚無對(duì)人工智能代理的標(biāo)準(zhǔn)定義。
隨著眾多供應(yīng)商宣傳其代理型人工智能產(chǎn)品,定義的缺失可能導(dǎo)致首席信息官和其他IT領(lǐng)導(dǎo)者在購買和部署這一新興技術(shù)時(shí)陷入困惑。
一些人工智能專家將代理型人工智能定義為一種可以在企業(yè)內(nèi)部做出自主決策、從過去的經(jīng)驗(yàn)中學(xué)習(xí)并調(diào)整其響應(yīng)的工具,而另一些專家則認(rèn)為,任何具有某種決策功能的人工智能都可被視為代理型人工智能。
在大多數(shù)情況下,批評(píng)人士指出,供應(yīng)商尚未提供真正具有實(shí)際自主性的代理型人工智能,而是將更簡單的人工智能聊天機(jī)器人、助手或大型語言模型(LLMs)的附加功能作為代理型人工智能進(jìn)行推銷。許多所謂的代理實(shí)際上只是LLM的包裝器或“經(jīng)過美化的LLM工作流程”,Perigon的產(chǎn)品副總裁Zach Bartholomew(扎克·巴瑟洛繆)稱。
一、代理跟風(fēng)現(xiàn)象
目前,IT行業(yè)存在大量“代理跟風(fēng)”現(xiàn)象,銀行軟件供應(yīng)商Backbase的人工智能負(fù)責(zé)人Chris Shayan(克里斯·夏延)表示。
“我參加過幾十場供應(yīng)商的推介會(huì),基礎(chǔ)自動(dòng)化被重新包裝為自主代理,”他說,“許多被宣傳為代理的解決方案實(shí)際上只是具有更好界面的傳統(tǒng)算法,而首席信息官和首席技術(shù)官正在努力應(yīng)對(duì)這一巨大差異?!?/span>
在Shayan(夏延)的定義中,真正的代理能夠通過多個(gè)步驟進(jìn)行推理,并擁有一定的獨(dú)立決策權(quán)。例如,銀行業(yè)已開始實(shí)施能夠檢測異常交易模式并在無需持續(xù)人工監(jiān)督的情況下采取適當(dāng)行動(dòng)的人工智能代理,他說道。
“軟件的真正自主性意味著能夠獨(dú)立處理端到端的流程——從收集信息、分析選項(xiàng)、執(zhí)行行動(dòng)到從結(jié)果中學(xué)習(xí),”Shayan(夏延)補(bǔ)充道,“真正將代理與其他人工智能系統(tǒng)區(qū)分開來的能力在于,它能夠在規(guī)定的范圍內(nèi)運(yùn)作,同時(shí)適應(yīng)遇到的新情況?!?/span>
處于這一趨勢前沿的首席信息官們還發(fā)現(xiàn),鑒于當(dāng)前技術(shù)水平、可用數(shù)據(jù)以及各種流程在業(yè)務(wù)中的交織方式,并非所有業(yè)務(wù)流程都適合代理型人工智能。
二、這種代理并非自主
在缺乏清晰、標(biāo)準(zhǔn)的定義的情況下,批評(píng)人士稱,IT領(lǐng)導(dǎo)者可能會(huì)購買未能按宣傳效果運(yùn)作的產(chǎn)品。
“當(dāng)所有產(chǎn)品都被稱作代理時(shí),首席信息官可能會(huì)浪費(fèi)預(yù)算在無法實(shí)現(xiàn)真正自主性的軟件上——導(dǎo)致團(tuán)隊(duì)沮喪、資源浪費(fèi)以及對(duì)人工智能的信心喪失,”Bartholomew(巴瑟洛繆)說,“我們肯定正朝著真正擁有代理的未來邁進(jìn),但我認(rèn)為我們還未完全到達(dá)那里?!?/span>
Shayan(夏延)補(bǔ)充道,這種混亂可能導(dǎo)致期望值錯(cuò)位和糟糕的采購決策?!爱?dāng)首席信息官實(shí)施他們認(rèn)為是基于代理的解決方案,卻只得到經(jīng)過美化的自動(dòng)化時(shí),他們錯(cuò)過了真正代理的變革潛力,同時(shí)仍需支付高價(jià),”他說,“這會(huì)導(dǎo)致投資回報(bào)率令人失望,并可能破壞更廣泛的人工智能計(jì)劃?!?/span>
三、自主性的連續(xù)性
正如對(duì)人工智能代理的定義存在差異一樣,人工智能專家對(duì)這一問題的看法也存在分歧。Bartholomew(巴瑟洛繆)認(rèn)為真正的代理距離部署大約還有一年的時(shí)間,但人力資源軟件供應(yīng)商Dayforce的首席人工智能官David Lloyd(大衛(wèi)·勞埃德)則認(rèn)為代理型人工智能更像是一個(gè)能力譜系,而不是簡單的二元定義。
許多人工智能工具開始具有某種程度的自主性,包括從用戶過去的動(dòng)作中學(xué)習(xí),然后基于這些知識(shí)采取行動(dòng)或提出建議的人工智能助手,Lloyd(勞埃德)說。
“這是一個(gè)連續(xù)體,”他補(bǔ)充道,“只是其中一端非常具有雄心,而另一端則非常實(shí)際?!?/span>
對(duì)Lloyd(勞埃德)而言,定義代理型人工智能不如找到組織所采用的人工智能的正確用途重要。
“讓我們問自己這個(gè)問題,‘它是否推動(dòng)了業(yè)務(wù)價(jià)值或可量化的價(jià)值?’”他說,“因?yàn)槿绻荒?,那么所有這些都是美妙的猜測?!?/span>
隨著大型語言模型不斷增加看起來越來越像代理的功能,代理與其他人工智能之間的重疊將繼續(xù)模糊,旅游軟件和服務(wù)提供商TrEvolution的數(shù)據(jù)科學(xué)負(fù)責(zé)人Ilia Badeev(伊利亞·巴杰夫)補(bǔ)充道。
目前,“人工智能代理”更像是一個(gè)營銷標(biāo)簽,而非一個(gè)明確定義的術(shù)語,Badeev(巴杰夫)認(rèn)為,許多供應(yīng)商只是將‘代理’一詞貼在人工智能助手和其他工具上,以抓住最近的炒作熱潮。
“人工智能代理和助手之間沒有明確的區(qū)別,”他說,“這只是一種營銷上的差異化?!?/span>
Badeev(巴杰夫)建議,困惑的首席信息官和IT采購領(lǐng)導(dǎo)者不應(yīng)關(guān)注產(chǎn)品是否被標(biāo)記為代理,而應(yīng)尋找他們所需的功能。“唯一重要的是,你得到了什么樣的功能?在這些功能中人工智能的準(zhǔn)確性如何?價(jià)格是多少?”
四、提出恰當(dāng)?shù)膯栴}
Bartholomew(巴瑟洛繆)和Lloyd(勞埃德)都建議首席信息官和IT采購領(lǐng)導(dǎo)者在從供應(yīng)商處購買人工智能代理之前提出一系列問題。Lloyd(勞埃德)建議組織在部署類似代理的技術(shù)時(shí)從小規(guī)模、逐步具備能力的方式開始。
“當(dāng)我與人們交談時(shí),我使用的術(shù)語是他們需要有意識(shí)地行動(dòng),”他說,“從商業(yè)和采購的角度來看,你們是否在組織中構(gòu)建了一個(gè)簡單和可能更復(fù)雜的用例和任務(wù)的組合,希望解決這些問題?”
如果首席信息官想要一個(gè)人工智能代理,他們應(yīng)該提出以下問題,Bartholomew(巴瑟洛繆)說:
它能否自行規(guī)劃和執(zhí)行多步驟流程?
它是否會(huì)隨著時(shí)間的推移學(xué)習(xí)或改進(jìn),還是僅僅在運(yùn)行腳本?
它能自行處理什么樣的決策?
它能否在無需他人點(diǎn)擊“批準(zhǔn)”的情況下采取有意義的行動(dòng)?
它是否會(huì)隨著時(shí)間的推移變得更好?
它與現(xiàn)有的IT架構(gòu)的集成度如何?
雖然代理旨在自行做出決策,但Bartholomew(巴瑟洛繆)補(bǔ)充道,首席信息官還將希望保留審計(jì)代理行動(dòng)的選項(xiàng)。
“在可預(yù)見的未來,我認(rèn)為我們將在流程中保留人的參與,”他說,“我不認(rèn)為每次采取行動(dòng)都需要人在流程中,但最終會(huì)有人監(jiān)督這些代理的運(yùn)作方式。”
作者:Grant Gross(格蘭特·格羅斯)
譯者:穿山甲
【睿觀:當(dāng)前,“代理型人工智能”(Agentic AI)作為技術(shù)熱點(diǎn),因缺乏行業(yè)標(biāo)準(zhǔn)定義而導(dǎo)致市場概念混亂。眾多供應(yīng)商將功能相對(duì)簡單的AI工具(如聊天機(jī)器人、自動(dòng)化工作流)包裝或重新命名為“AI智能體”進(jìn)行營銷,這給期望獲得真正自主決策與行動(dòng)能力的CIO(首席信息官)帶來了巨大風(fēng)險(xiǎn):可能因定義不清而采購錯(cuò)誤的工具、支付過高費(fèi)用、導(dǎo)致期望落空、浪費(fèi)投資,甚至損害對(duì)AI技術(shù)的整體信心。因此,CIO在進(jìn)行相關(guān)技術(shù)選型與采購時(shí),必須超越“代理”這一營銷標(biāo)簽,審慎評(píng)估產(chǎn)品的實(shí)際自主能力與業(yè)務(wù)價(jià)值,并向供應(yīng)商提出一系列具體、深入的關(guān)鍵問題,以確保技術(shù)投資的有效性和符合企業(yè)實(shí)際需求。
主要論據(jù) :
定義模糊引發(fā)市場亂象:
缺乏標(biāo)準(zhǔn):
業(yè)界對(duì)“AI智能體”沒有統(tǒng)一、清晰的定義,導(dǎo)致理解各異。
“代理跟風(fēng)”:
許多供應(yīng)商將現(xiàn)有技術(shù)(如基礎(chǔ)自動(dòng)化、LLM包裝器、優(yōu)化界面后的傳統(tǒng)算法)重新包裝成“自主代理”進(jìn)行宣傳,利用市場熱度。
認(rèn)知差距:
CIO和CTO們正努力辨別宣傳中的“代理”與實(shí)際技術(shù)能力之間的巨大差異。
“真假”自主性之辯與潛在風(fēng)險(xiǎn):
“真正”代理特征:
專家認(rèn)為,真正的代理應(yīng)具備多步推理、一定程度的獨(dú)立決策權(quán)、端到端自主處理流程(信息收集、分析、執(zhí)行、學(xué)習(xí))以及適應(yīng)新情況的能力。
現(xiàn)實(shí)差距:
批評(píng)者指出,當(dāng)前許多被標(biāo)記為“代理”的產(chǎn)品并未達(dá)到真正的自主性水平。
風(fēng)險(xiǎn):
購買名不副實(shí)的“代理”可能導(dǎo)致預(yù)算浪費(fèi)、團(tuán)隊(duì)受挫、對(duì)AI失去信心,并且錯(cuò)失了真正代理技術(shù)可能帶來的變革潛力,投資回報(bào)率令人失望。
自主性視角:連續(xù)譜 vs. 價(jià)值導(dǎo)向:
二元論 vs. 連續(xù)譜:
對(duì)于“是否存在真正的代理”,專家意見不一。有人認(rèn)為真代理尚需時(shí)日,有人則視自主性為一個(gè)程度不同的連續(xù)體(從簡單學(xué)習(xí)到高度自主),許多現(xiàn)有工具已具備部分自主特征。
價(jià)值優(yōu)先:
部分專家強(qiáng)調(diào),與其糾結(jié)于定義,不如關(guān)注所選AI工具是否能帶來可量化的業(yè)務(wù)價(jià)值。功能、準(zhǔn)確性和價(jià)格比標(biāo)簽更重要。
營銷標(biāo)簽:
“AI代理”目前更像是一個(gè)抓住炒作熱潮的營銷術(shù)語,而非精確的技術(shù)分類。
CIO的應(yīng)對(duì)策略:審慎提問與務(wù)實(shí)部署:
忽略標(biāo)簽,聚焦功能:
采購時(shí)不應(yīng)被“代理”標(biāo)簽迷惑,應(yīng)關(guān)注所需功能、AI的準(zhǔn)確性及成本。
提出關(guān)鍵問題:
向供應(yīng)商詢問具體能力,例如:能否自主規(guī)劃并執(zhí)行多步流程?是學(xué)習(xí)改進(jìn)還是僅運(yùn)行腳本?能自主處理何種決策?能否在無人批準(zhǔn)下采取行動(dòng)?能否隨時(shí)間進(jìn)步?與現(xiàn)有IT架構(gòu)的集成度?
保留審計(jì)與監(jiān)督:
即使代理旨在自主決策,也必須保留審計(jì)其行為的能力,并在可預(yù)見的未來保持流程中的人類監(jiān)督。
務(wù)實(shí)部署:
建議從小規(guī)模開始,有意識(shí)地(“有意識(shí)地行動(dòng)”)逐步引入和評(píng)估類代理技術(shù)的能力,明確希望解決的用例和任務(wù)?!?/span>