將AI代理集成到現(xiàn)有系統(tǒng)中是一項(xiàng)復(fù)雜而艱巨的任務(wù),它涉及到技術(shù)、業(yè)務(wù)、組織等多個(gè)方面的挑戰(zhàn)。傳統(tǒng)企業(yè)在進(jìn)行AI轉(zhuǎn)型時(shí),需要仔細(xì)評(píng)估自身的IT基礎(chǔ)設(shè)施、業(yè)務(wù)流程以及組織文化,制定一個(gè)切實(shí)可行的AI戰(zhàn)略。盡管供應(yīng)商表示他們目前基于代理人工智能的產(chǎn)品很容易實(shí)現(xiàn),但分析師表示這遠(yuǎn)非事實(shí)。

來(lái)源:Gorodenkoff / Shutterstock
軟件供應(yīng)商的宣傳正在不斷演變,代理型人工智能(AI agent)開始在營(yíng)銷信息中取代生成型人工智能。他們表示,代理型人工智能不僅僅是生成代碼或內(nèi)容供人類審核,它還會(huì)像人類一樣遵循指令、做出決策并采取行動(dòng),而無(wú)需人工干預(yù)。
一、它不僅僅是一個(gè)更智能的?RPA
Agentic AI不僅僅是機(jī)器人流程自動(dòng)化?(RPA)的更好版本:它有望幫助企業(yè)實(shí)現(xiàn)?RPA?無(wú)法實(shí)現(xiàn)的目標(biāo)。
“將?RPA?想象成軌道上的火車——它只能沿著軌道行駛。Agentic AI?更像是一輛自動(dòng)駕駛汽車——它可以自適應(yīng)地導(dǎo)航不同的路線和情況,”基于?Agentic AI?的軟件提供商初創(chuàng)公司?Doozer AI?的聯(lián)合創(chuàng)始人?Paul Chada?說(shuō)道。
Nucleus研究公司高級(jí)分析師卡梅倫·馬什?(Cameron Marsh)?表示,代理?AI?之所以能夠自主或獨(dú)立采取行動(dòng),是因?yàn)樗軌蚪忉寯?shù)據(jù)、預(yù)測(cè)結(jié)果并做出決策,從新數(shù)據(jù)中學(xué)習(xí),而不像傳統(tǒng)的?RPA,在遇到意外數(shù)據(jù)時(shí)就會(huì)失敗。
Chada表示,代理?AI?的這種自適應(yīng)特性可以幫助企業(yè)提高效率,處理傳統(tǒng)?RPA?無(wú)法管理的復(fù)雜多變的任務(wù),例如理賠員、貸款員或案件工作者的角色,前提是它可以訪問(wèn)完成任務(wù)所需的必要數(shù)據(jù)、工作流程和工具。
軟件供應(yīng)商已經(jīng)在宣傳可以訪問(wèn)這些資源的代理AI?產(chǎn)品,其中包括Salesforce?的?Agentforce、微軟基于?Copilot?的自主代理、ServiceNow?的?AI?代理、谷歌的?Vertex AI Agent Builder、亞馬遜?Bedrock Agents和IBM?的?watsonx Agent Builder,并且可能會(huì)有更多產(chǎn)品效仿。
那么,CIO是否應(yīng)該投資這項(xiàng)技術(shù)呢,還是應(yīng)該等待呢?
二、一名優(yōu)秀經(jīng)紀(jì)人的早期歷程
Agentic AI承諾實(shí)現(xiàn)無(wú)需人工干預(yù)的自動(dòng)化,供應(yīng)商表示,這很容易實(shí)現(xiàn),但行業(yè)分析師和其他專家表示,對(duì)于當(dāng)今新興的?Agentic AI?技術(shù)來(lái)說(shuō),這與事實(shí)相去甚遠(yuǎn)。
Gartner?分析師湯姆·科紹?(Tom Coshow)?在?10?月初的一篇博客文章中寫道:“目前基于法學(xué)碩士學(xué)位的人類助理與成熟的人工智能代理之間存在很大差距。”他指出,為了縮小這一差距,企業(yè)必須學(xué)會(huì)構(gòu)建、管理和信任它們。
Coshow預(yù)測(cè),即使到?2028?年,也只有三分之一的企業(yè)應(yīng)用能夠采用代理人工智能,從而實(shí)現(xiàn)“15%?的日常工作決策自主做出”。
對(duì)于Dev Consult Canada?首席顧問(wèn)?Martin Bechard?來(lái)說(shuō),“Agentic [AI]?處于早期采用階段,初始產(chǎn)品存在缺陷?!?/span>
企業(yè)軟件初創(chuàng)公司投資者Tola Capital?的?Greg Ceccarelli?表示,衡量代理式?AI?何時(shí)能夠得到更廣泛應(yīng)用也是一個(gè)棘手的問(wèn)題?!?span style="font-family: 黑體, SimHei; font-size: 16px; color: rgb(0, 0, 255);">目前行業(yè)面臨的最大障礙之一是缺乏針對(duì)特定工作流的基準(zhǔn)”,用于比較代理和人類在某項(xiàng)任務(wù)上的表現(xiàn),他說(shuō),而現(xiàn)有的少數(shù)基準(zhǔn),如OSWorld,本質(zhì)上非常學(xué)術(shù)?!澳壳?,業(yè)界對(duì)這個(gè)話題的討論還處于起步階段?!?/span>
【睿觀:OSWorld 是一個(gè)用于衡量人工智能代理在執(zhí)行特定任務(wù)時(shí)表現(xiàn)的基準(zhǔn)測(cè)試框架。該框架的基本要求包括:
多樣化任務(wù):OSWorld 提供包括自然語(yǔ)言處理、圖像識(shí)別、決策制定等多個(gè)領(lǐng)域的任務(wù),以便全面評(píng)估代理的能力。
標(biāo)準(zhǔn)化數(shù)據(jù)集:為保證評(píng)估的公平性與一致性,OSWorld 提供統(tǒng)一、經(jīng)過(guò)驗(yàn)證的數(shù)據(jù)集和任務(wù)標(biāo)準(zhǔn)。
可重復(fù)性:測(cè)試框架設(shè)計(jì)確保任何實(shí)驗(yàn)都可以被重復(fù),以驗(yàn)證結(jié)果的可靠性。
開放性:OSWorld 是開放的,這意味著研究者和從業(yè)者可以根據(jù)實(shí)際需求添加新的任務(wù)或修改現(xiàn)有任務(wù)。
學(xué)術(shù)性與實(shí)際應(yīng)用:雖然它具有學(xué)術(shù)性質(zhì),但也強(qiáng)調(diào)其結(jié)果能夠在現(xiàn)實(shí)環(huán)境中應(yīng)用,以驗(yàn)證代理的實(shí)際效用。
OSWorld 的工作原理通常涉及以下幾個(gè)步驟:
任務(wù)設(shè)定:明確需評(píng)估的任務(wù)或能力領(lǐng)域。
數(shù)據(jù)收集與處理:通過(guò)標(biāo)準(zhǔn)化的數(shù)據(jù)集來(lái)訓(xùn)練和測(cè)試人工智能模型。
基準(zhǔn)測(cè)試:運(yùn)行代理模型,并記錄其在各種任務(wù)中的表現(xiàn)。
結(jié)果分析:通過(guò)比較人類和代理的表現(xiàn),分析模型的能力與不足之處。
自然語(yǔ)言處理:評(píng)估AI在翻譯、摘要提取、語(yǔ)義分析等任務(wù)上的表現(xiàn),幫助開發(fā)更智能的對(duì)話系統(tǒng)。
圖像識(shí)別:用于測(cè)試AI在圖像分類、對(duì)象檢測(cè)等任務(wù)中的表現(xiàn),應(yīng)用于自動(dòng)駕駛、安防監(jiān)控等領(lǐng)域。
自動(dòng)化決策系統(tǒng):在金融分析、推薦系統(tǒng)等領(lǐng)域驗(yàn)證AI的決策能力,優(yōu)化商業(yè)決策流程。
在國(guó)際上,AI基準(zhǔn)測(cè)試仍處于快速演變與發(fā)展階段:
多元基準(zhǔn)的增加:越來(lái)越多的新測(cè)試基準(zhǔn)被開發(fā)出來(lái),以涵蓋更多樣化的應(yīng)用場(chǎng)景,如醫(yī)療AI、環(huán)境監(jiān)控AI等。
合作與開源:不少國(guó)際研究機(jī)構(gòu)和企業(yè)正在合作,推動(dòng)更多基準(zhǔn)測(cè)試的開源化,以促進(jìn)AI技術(shù)的普及和透明化。
技術(shù)挑戰(zhàn)與競(jìng)賽:如NLP領(lǐng)域的GLUE、SUPERGLUE,在國(guó)際AI會(huì)議上設(shè)立相關(guān)挑戰(zhàn)賽,推動(dòng)技術(shù)進(jìn)步并分享最新成果。
倫理與公平性:國(guó)際上也有對(duì)基準(zhǔn)測(cè)試中倫理和公平性問(wèn)題的考量,確保AI模型不僅是性能優(yōu)越的,而且在使用時(shí)是公平和負(fù)責(zé)任的。
綜上所述,OSWorld作為一個(gè)基準(zhǔn)測(cè)試框架,為AI的開發(fā)和評(píng)估提供了一個(gè)標(biāo)準(zhǔn),但也需要不斷更新以適應(yīng)快速變化的技術(shù)環(huán)境和更加多樣化的應(yīng)用需求。】
三、Agentic AI的應(yīng)用并不容易
盡管供應(yīng)商將他們的代理AI?工具描述為易于采用,但這并不像在工作流程中用代理取代人類決策者那么簡(jiǎn)單。
研究公司The Futurum Group?首席信息官實(shí)踐副總裁?Dion Hinchcliffe?表示,從最簡(jiǎn)單的層面來(lái)說(shuō),已經(jīng)設(shè)計(jì)為與人類合作的?RPA?工作流程很可能需要進(jìn)行重大重新設(shè)計(jì),才能為代理?AI?做好準(zhǔn)備。他說(shuō),利用代理?AI?處理非結(jié)構(gòu)化數(shù)據(jù)、管理上下文決策和動(dòng)態(tài)交互的能力通常并不像更新現(xiàn)有腳本或工作流程那么簡(jiǎn)單。
Moor Insights and Strategy首席分析師?Jason Andersen?表示,必要的工程工作可能包括評(píng)估并向代理平臺(tái)公開正確的服務(wù)、API、數(shù)據(jù)和控制,以確保代理具有完成給定任務(wù)的背景和工具。 ?
對(duì)于IT?咨詢公司?Eden Digital?的創(chuàng)始人?Anil Clifford?來(lái)說(shuō),企業(yè)需要轉(zhuǎn)變其整體方法向自動(dòng)化方向發(fā)展,因?yàn)榇?AI?的概率性質(zhì)與傳統(tǒng)的確定性自動(dòng)化有著根本的不同。
四、努力讓工作更輕松
分析師表示,一些平臺(tái)供應(yīng)商已經(jīng)提供低代碼和無(wú)代碼代理開發(fā)和管理平臺(tái),但這些平臺(tái)的功能僅限于構(gòu)建簡(jiǎn)單代理或修改供應(yīng)商自己構(gòu)建的代理的模板。
【睿觀:當(dāng)前市場(chǎng)上低代碼/無(wú)代碼代理開發(fā)平臺(tái)的局限性:它們往往只能用于構(gòu)建簡(jiǎn)單的代理,或者是對(duì)供應(yīng)商預(yù)設(shè)的模板進(jìn)行微調(diào)。換句話說(shuō),這些平臺(tái)的靈活性有限,難以滿足復(fù)雜、定制化的需求。
扣子平臺(tái)?作為字節(jié)跳動(dòng)推出的一款A(yù)I Bot開發(fā)平臺(tái),其核心目標(biāo)是降低AI應(yīng)用開發(fā)的門檻,讓用戶能夠快速、低成本地構(gòu)建個(gè)性化的聊天機(jī)器人。
是否屬于類似應(yīng)用?
相似之處:?扣子平臺(tái)確實(shí)提供了一種低代碼/無(wú)代碼的開發(fā)方式,用戶可以通過(guò)可視化界面和預(yù)設(shè)組件來(lái)搭建機(jī)器人,無(wú)需深入了解編程細(xì)節(jié)。這與文中提到的平臺(tái)在降低開發(fā)門檻方面具有一致性。
差異之處:
功能豐富度:?扣子平臺(tái)提供了更多的功能和組件,包括插件、長(zhǎng)短期記憶、工作流等,使得用戶能夠構(gòu)建更加復(fù)雜和智能的機(jī)器人。
開放性:?扣子平臺(tái)似乎在一定程度上提供了更多的定制化空間,用戶可以根據(jù)自己的需求來(lái)調(diào)整和擴(kuò)展機(jī)器人。
應(yīng)用場(chǎng)景:?扣子平臺(tái)的應(yīng)用場(chǎng)景更加廣泛,不僅局限于簡(jiǎn)單的問(wèn)答,還可以用于各種任務(wù)型對(duì)話、信息檢索等。
結(jié)論:?扣子平臺(tái)雖然屬于低代碼/無(wú)代碼開發(fā)平臺(tái)的范疇,但相比于文中提到的平臺(tái),它在功能、靈活性以及應(yīng)用場(chǎng)景上都表現(xiàn)出了更強(qiáng)的擴(kuò)展性。
一般來(lái)說(shuō),低代碼/無(wú)代碼開發(fā)平臺(tái)的國(guó)際化發(fā)展趨勢(shì)主要包括:
功能的不斷完善:?隨著技術(shù)的進(jìn)步和用戶需求的增加,平臺(tái)會(huì)不斷推出新的功能和組件,以滿足更復(fù)雜的開發(fā)需求。
生態(tài)系統(tǒng)的構(gòu)建:?平臺(tái)會(huì)積極構(gòu)建開發(fā)者生態(tài),提供豐富的文檔、教程、社區(qū)支持,吸引更多的開發(fā)者參與。
與其他工具的集成:?平臺(tái)會(huì)加強(qiáng)與其他工具和服務(wù)的集成,提高開發(fā)效率。
全球化拓展:?平臺(tái)會(huì)拓展到更多的國(guó)家和地區(qū),支持多種語(yǔ)言和文化。
總結(jié)
扣子平臺(tái)作為字節(jié)跳動(dòng)在AI領(lǐng)域的一款重要產(chǎn)品,代表了低代碼/無(wú)代碼開發(fā)平臺(tái)的發(fā)展方向。它的出現(xiàn),降低了AI應(yīng)用開發(fā)的門檻,為廣大開發(fā)者和企業(yè)提供了更多的可能性。未來(lái),隨著技術(shù)的不斷進(jìn)步,可以期待扣子平臺(tái)在功能、性能和易用性方面取得更大的突破?!?/span>
Futurum的?Hinchcliffe?表示:“創(chuàng)建更復(fù)雜的代理,特別是需要定制集成和細(xì)致決策能力的代理,仍然需要對(duì)數(shù)據(jù)流、機(jī)器學(xué)習(xí)模型調(diào)整和?API?集成有一定的技術(shù)理解。”他補(bǔ)充說(shuō),這些平臺(tái)有一個(gè)學(xué)習(xí)曲線,遷移過(guò)程可能會(huì)耗費(fèi)大量資源。
馬什表示,Nucleus Research采訪過(guò)的大多數(shù)嘗試代理?AI?的企業(yè)都表示,學(xué)習(xí)曲線比供應(yīng)商聲稱的要陡峭,特別是在大規(guī)模實(shí)施代理?AI?所需的定制深度方面。
Moor的?Andersen?給出了一個(gè)具體的例子:雖然無(wú)代碼平臺(tái)提供了連接器等集成工具來(lái)與其他應(yīng)用程序協(xié)同工作,但經(jīng)驗(yàn)豐富的開發(fā)人員或企業(yè)架構(gòu)師必須首先設(shè)置整個(gè)后端工作流程,然后才能創(chuàng)建代理來(lái)使用此類應(yīng)用程序完成復(fù)雜的任務(wù)。
仍在運(yùn)行舊版應(yīng)用程序的企業(yè)還有其他擔(dān)憂,因?yàn)檫@些應(yīng)用程序的連接器可能不可用或功能有限。
“這些系統(tǒng)通常存在集成挑戰(zhàn),很難對(duì)現(xiàn)有技術(shù)堆棧進(jìn)行重大更改。這就像試圖將一臺(tái)全新的超級(jí)智能計(jì)算機(jī)安裝到仍在舊軟件上運(yùn)行的機(jī)器上的舊工廠中,”谷歌云客戶工程師Shruti Dhumak?表示,并補(bǔ)充說(shuō),在云端誕生的初創(chuàng)公司或公司可能會(huì)更容易采用代理?AI。
【睿觀:將AI代理集成到現(xiàn)有系統(tǒng)中是一項(xiàng)復(fù)雜而艱巨的任務(wù),它涉及到技術(shù)、業(yè)務(wù)、組織等多個(gè)方面的挑戰(zhàn)。傳統(tǒng)企業(yè)在進(jìn)行AI轉(zhuǎn)型時(shí),需要仔細(xì)評(píng)估自身的IT基礎(chǔ)設(shè)施、業(yè)務(wù)流程以及組織文化,制定一個(gè)切實(shí)可行的AI戰(zhàn)略。
技術(shù)堆棧的不兼容性:?傳統(tǒng)的企業(yè)系統(tǒng)往往基于多年積累的、復(fù)雜的技術(shù)棧。這些系統(tǒng)可能使用了過(guò)時(shí)的編程語(yǔ)言、數(shù)據(jù)庫(kù),以及各種各樣的遺留系統(tǒng)。而AI代理,尤其是那些基于最新深度學(xué)習(xí)框架的,對(duì)計(jì)算資源、數(shù)據(jù)格式以及系統(tǒng)架構(gòu)都有著更高的要求。將兩者強(qiáng)行結(jié)合,就像把一臺(tái)超級(jí)計(jì)算機(jī)塞進(jìn)一臺(tái)老舊的機(jī)器里,必然會(huì)遇到各種各樣的兼容性問(wèn)題。
系統(tǒng)改造的巨大成本:?要將AI代理無(wú)縫集成到現(xiàn)有的系統(tǒng)中,往往需要對(duì)整個(gè)系統(tǒng)進(jìn)行大規(guī)模的改造。這不僅涉及到技術(shù)層面的改動(dòng),還包括業(yè)務(wù)流程的調(diào)整、人員的培訓(xùn)等,這對(duì)于企業(yè)來(lái)說(shuō)是一筆巨大的投入。
風(fēng)險(xiǎn)的不可控性:?系統(tǒng)改造過(guò)程中,任何一個(gè)小小的失誤都可能導(dǎo)致整個(gè)系統(tǒng)的崩潰。這對(duì)于企業(yè)來(lái)說(shuō)是不可接受的風(fēng)險(xiǎn)。
技術(shù)棧相對(duì)簡(jiǎn)單:?初創(chuàng)公司通常從零開始構(gòu)建自己的系統(tǒng),技術(shù)棧相對(duì)比較新,更容易與AI代理進(jìn)行集成。
對(duì)新技術(shù)的接受度更高:?初創(chuàng)公司更加靈活,對(duì)新技術(shù)有著更高的接受度,愿意嘗試新的解決方案。
成本壓力相對(duì)較小:?相比于傳統(tǒng)企業(yè),初創(chuàng)公司對(duì)成本的考慮相對(duì)較少,更容易進(jìn)行大規(guī)模的系統(tǒng)改造。
以下是一些建議:
從小規(guī)模開始:?可以先從一些小的、獨(dú)立的業(yè)務(wù)場(chǎng)景開始嘗試,逐步擴(kuò)大AI應(yīng)用的范圍。
選擇合適的AI平臺(tái):?選擇一個(gè)易于集成、功能強(qiáng)大的AI平臺(tái),可以大大降低開發(fā)成本。
建立一支專業(yè)的AI團(tuán)隊(duì):?培養(yǎng)一支具備AI技能的團(tuán)隊(duì),負(fù)責(zé)AI項(xiàng)目的開發(fā)和實(shí)施。
與外部專家合作:?可以與AI咨詢公司或高校合作,獲得專業(yè)的技術(shù)支持。】
五、如果不是現(xiàn)在,那什么時(shí)候?
Dev Consult的?Bechard?認(rèn)為,在現(xiàn)階段,對(duì)代理?AI?的投資是對(duì)該技術(shù)潛力的押注,而不是投資。但隨著代理?AI?變得越來(lái)越強(qiáng)大,這種押注的勝算可能會(huì)發(fā)生變化?!?/span>決策者必須通過(guò)實(shí)驗(yàn)來(lái)學(xué)習(xí)或建立一個(gè)灘頭陣地,如果技術(shù)繼續(xù)改進(jìn),這將成為一種戰(zhàn)略優(yōu)勢(shì),”他說(shuō)。
SanjMo首席分析師?Sanjeev Mohan?建議?CIO?們觀望一下。他認(rèn)為,如果現(xiàn)有的?RPA?可以運(yùn)行,就沒(méi)有必要在代理?AI?上花錢,并建議在決定實(shí)施代理?AI?之前先了解用例的價(jià)值。
其他分析師認(rèn)為,分層或分階段采用該技術(shù)可能是最佳的前進(jìn)道路。
Eden Digital的?Clifford?建議使用代理?AI?作為?RPA?的補(bǔ)充,而不是替代?!斑@種方法允許組織維持其對(duì)結(jié)構(gòu)化、重復(fù)性任務(wù)的?RPA?投資,同時(shí)逐步引入?AI?代理來(lái)處理更復(fù)雜、與上下文相關(guān)的流程,”他說(shuō)。
Hinchcliffe也建議仔細(xì)權(quán)衡成本(金錢和時(shí)間)與企業(yè)敏捷性、可擴(kuò)展性和運(yùn)營(yíng)效率方面的好處,并在等式中添加另一個(gè)變量:RPA?供應(yīng)商可能會(huì)自己提供代理?AI?功能(UiPath?已經(jīng)朝這個(gè)方向發(fā)展),這可能為企業(yè)提供一種更安全、更快捷的替代方案,而不是自己實(shí)施代理?AI。
【睿觀:代理AI在RPA基礎(chǔ)上應(yīng)用的成熟度模型評(píng)價(jià)指標(biāo)體系】
