如果說聊天機器人只是坐著等待被問問題,那么人工智能代理(AI agent)則是主動的,可以自主行動,并適應(yīng)環(huán)境。當多個代理發(fā)展成多代理框架時,其潛在能力將成倍增加。但隨著數(shù)量增加和復(fù)雜性的增加,風險也隨之增加,需要進行更嚴格的檢查。

來源:Roman Samborskyi / Shutterstock
【睿觀:人工智能代理(AI agent)是一種能夠在環(huán)境中自主行動的軟件實體,它具備感知、學習、推理和決策的能力。隨著人工智能技術(shù)的不斷發(fā)展,AI agent在各個領(lǐng)域展現(xiàn)出了巨大的潛力。AI agent?是一個更廣義的概念,代表了人工智能在各個領(lǐng)域中的應(yīng)用。AI智能體(bot) 則是AI agent在對話交互領(lǐng)域的一個具體體現(xiàn)。AI agent作為人工智能發(fā)展的重要方向,具有廣闊的應(yīng)用前景。然而,在享受AI agent帶來的便利的同時,我們也需要關(guān)注其帶來的風險,并采取相應(yīng)的措施加以應(yīng)對。本文主要探討了人工智能代理(AI agent)在各行各業(yè)的應(yīng)用以及所帶來的機遇與挑戰(zhàn)。
(一)核心觀點:
AI agent的廣泛應(yīng)用:AI agent已經(jīng)不再是概念,而是逐漸落地到各個行業(yè),如NASA、金融、醫(yī)療等。它們可以自動化任務(wù)、提高效率、優(yōu)化決策。
AI agent的潛力與風險:AI agent具有巨大的潛力,可以解決復(fù)雜問題,但同時也帶來了新的風險,如數(shù)據(jù)隱私、安全、倫理等問題。
AI agent的發(fā)展趨勢:AI agent的發(fā)展趨勢是朝著更智能、更自主的方向發(fā)展,它們將能夠處理更復(fù)雜的任務(wù),并與人類進行更深入的交互。
行業(yè)應(yīng)用案例:文章介紹了多個行業(yè)中AI agent的應(yīng)用案例,如NASA使用AI agent監(jiān)測潔凈室、金融行業(yè)使用AI agent優(yōu)化投資決策、醫(yī)療行業(yè)使用AI agent輔助診斷等。
技術(shù)實現(xiàn):文章介紹了實現(xiàn)AI agent的一些關(guān)鍵技術(shù),如自然語言處理、機器學習、知識圖譜等。
面臨的挑戰(zhàn):文章也提到了AI agent發(fā)展過程中面臨的挑戰(zhàn),如數(shù)據(jù)隱私、安全、倫理等問題。
(二)主要內(nèi)容概括:
AI agent是什么? 解釋了AI agent的概念、特點以及與AI智能體(bot)的區(qū)別。
AI agent的應(yīng)用場景: 介紹了AI agent在不同行業(yè)中的應(yīng)用案例。
AI agent的技術(shù)實現(xiàn): 概述了實現(xiàn)AI agent所需的關(guān)鍵技術(shù)。
AI agent帶來的機遇與挑戰(zhàn): 分析了AI agent帶來的積極影響和潛在風險。
行業(yè)動態(tài):介紹了各大公司在AI agent領(lǐng)域的布局和進展?!?/span>
根據(jù)Gartner?的說法,代理不一定是?AI?模型。它也可以是一個軟件程序或其他計算實體,或者是一個機器人。當多個獨立但可交互的代理組合在一起時,每個代理都能夠感知環(huán)境并采取行動,你就得到了一個多代理系統(tǒng)。
是的,企業(yè)已經(jīng)在部署它們了。例如,NASA?的噴氣推進實驗室使用多智能體系統(tǒng)來確保其潔凈室保持清潔,這樣前往其他星球的飛行硬件就不會受到任何污染。
從2018?年開始,該機構(gòu)使用代理(運行受生物啟發(fā)的神經(jīng)網(wǎng)絡(luò)和時間序列模型的?Raspberry PI?計算機)作為傳感器協(xié)作網(wǎng)絡(luò)的基礎(chǔ)。
“這不僅僅是對顆粒物的一次測量,”NASA JPL前首席技術(shù)和創(chuàng)新官?Chris Mattmann?說道?!斑@是由許多測量人員共同決定污染物是否過多。”
現(xiàn)任加州大學洛杉磯分校首席數(shù)據(jù)和人工智能官的馬特曼補充說,之前最先進的傳感器要花費數(shù)萬美元。它們還具有極高的測量靈敏度。但新的多智能體系統(tǒng)擁有的傳感器每個只需花費數(shù)百美元就能制造,但它們的靈敏度不如更昂貴的傳感器。
“彌補這種敏感性的方法是他們必須一起工作,并像代理那樣共享數(shù)據(jù)和知識,”他說。這個系統(tǒng)至今仍在使用。但人工智能的發(fā)展意味著代理系統(tǒng)現(xiàn)在可以用于解決更廣泛的問題。“爆發(fā)點在于,這些系統(tǒng)不再基于規(guī)則、統(tǒng)計數(shù)據(jù)和閾值,而是被神經(jīng)網(wǎng)絡(luò)帶來的深度學習和深度強化學習所賦予力量,”馬特曼說?!斑@些系統(tǒng)被輸入數(shù)據(jù),接受訓練,然后隨著時間的推移自行改進。”
當然,增加更智能的人工智能也會增加風險?!爸辽賹τ?span style="font-size: 16px; -webkit-tap-highlight-color: transparent; padding: 0px; outline: 0px; max-width: 100%;">ChatGPT、DALL-E3?和?Midjourney?這樣的產(chǎn)品來說,它們與人類之間會不斷互動,”他表示,并補充道,有了代理人工智能,它們就有自主決策的潛力?!白畲蟮娘L險是,當你讓這些產(chǎn)品進入野外(不依賴人工的自我學習)時,你就把人類排除在外了?!?/span>
與此同時,NASA并不是唯一一家部署此類早期多智能體系統(tǒng)的公司,從事運營和物流的公司多年來一直使用這些技術(shù)。
“代理的概念其實非常古老,”卡內(nèi)基梅隆大學人工智能教授Anand Rao?證實道?!拔以?span style="font-size: 16px; -webkit-tap-highlight-color: transparent; padding: 0px; outline: 0px; max-width: 100%;">20世紀80年代曾研究過多代理系統(tǒng)。我們當時正在為航天飛機構(gòu)建系統(tǒng),而航天飛機對于一個系統(tǒng)來說太復(fù)雜了?!彼f,隨著時間的推移,代理變得更加獨立,根據(jù)目標和目的采取行動。
然后是衛(wèi)星通信和托管服務(wù)提供商休斯網(wǎng)絡(luò)系統(tǒng)公司,該公司多年來一直在使用代理人工智能,該公司高級副總裁兼北美企業(yè)部總經(jīng)理丹·拉斯穆森(Dan Rasmussen)?說,他和他的團隊用它來解決服務(wù)質(zhì)量下降的問題。“我們不斷將網(wǎng)絡(luò)和客戶設(shè)備統(tǒng)計數(shù)據(jù)輸入我們的算法,使它們能夠適應(yīng)不斷變化的條件并識別異常,”他說。
最近,休斯開始構(gòu)建軟件,以自動將應(yīng)用程序部署到Google?云平臺并創(chuàng)建?CI/CD?管道,同時使用代理生成代碼。【福建CIO網(wǎng):持續(xù)集成/持續(xù)部署(Continuous Integration/Continuous Deployment,CI/CD):這是一種軟件開發(fā)的方法論,旨在通過自動化構(gòu)建、測試和部署代碼,加快軟件交付的速度。CI/CD?管道就是實現(xiàn)這一過程的一系列自動化步驟?!?/span>
他說:“我們的目標是分析日志和指標,將它們與源代碼連接起來,以深入了解代碼修復(fù)、漏洞、性能問題和安全問題。”
休斯已經(jīng)成功完成了這些用例的概念驗證(PoC),目前正在將其開發(fā)成產(chǎn)品。
該公司還開發(fā)了自己的內(nèi)部代理AI?工具,并針對不同的項目使用不同的代理框架,包括?Microsoft AutoGen,并且正在探索?crewAI?和?LlamaIndex。
“休斯使用這些工具來支持服務(wù)于超過一百萬個遠程節(jié)點的網(wǎng)絡(luò)的運行,”他說。起初,這些工具只是提出建議供人類審查和采取行動?!霸谟^察了這個系統(tǒng)幾個月后,”他繼續(xù)說,“休斯允許該過程自動運行并報告實施的更改。我們對任何新的增強功能都使用相同的審查流程?!?/span>
但是,如果檢測到的異常數(shù)量或?qū)嵤┑难a救措施超出統(tǒng)計標準,就會啟動警報并停止自動化行為,以免自動化系統(tǒng)失控并影響網(wǎng)絡(luò)。
一、代理人工智能的擴散
根據(jù)Capgemini?對?1,100?名大型企業(yè)高管的調(diào)查,10%?的組織已經(jīng)使用人工智能代理,超過一半的組織計劃在明年使用它們,82%?的組織計劃在未來三年內(nèi)整合它們。此外,71%?的受訪者表示人工智能代理將提高其工作流程的自動化程度,64%?的受訪者表示他們將改善客戶服務(wù)和滿意度,57%?的受訪者表示潛在的生產(chǎn)力改進超過了風險。
此外,在計劃使用人工智能代理的公司中,最大的用例是軟件開發(fā),用于生成、評估和重寫代碼,75%的公司表示他們計劃以這種方式使用人工智能代理。Cognizant?的人工智能首席技術(shù)官?Babak Hodjat?表示,開發(fā)是最重要的人工智能代理用例,這是有道理的。
“人工智能領(lǐng)域的大多數(shù)人都是軟件工程師,”他說?!按送?,軟件工程更容易驗證,因此你可以擁有可以相互檢查工作的半監(jiān)督系統(tǒng)。這是第一個需要解決的問題?!?/span>
二、權(quán)力越大,責任越大
大片電影和電視工作室傳奇娛樂擁有大量知識產(chǎn)權(quán)需要保護,該公司的首席信息安全官Dan Meacham?表示,該公司正在使用人工智能代理?!拔覀冊诎踩媱澋母鱾€垂直領(lǐng)域都利用了代理人工智能,”他說。例如,人工智能代理使用開源情報在社交媒體和暗網(wǎng)上搜尋電影泄露和盜版。他拒絕透露使用哪些特定框架來構(gòu)建系統(tǒng),但表示它利用了類似?OpenAI?的企業(yè)解決方案,可以實現(xiàn)一些業(yè)務(wù)流程自動化。
然而,在安全方面,代理人工智能是一把雙刃劍,風險多得數(shù)不清,他說。“我們確實為此徹夜難眠,”他說。許多風險與一般的通用人工智能相同,因為驅(qū)動代理系統(tǒng)的是通用人工智能。這意味著米查姆(Meacham?)擔心創(chuàng)意內(nèi)容和資產(chǎn)會通過人工智能應(yīng)用程序泄露,以及人工智能會產(chǎn)生侵權(quán)內(nèi)容。
然后存在惡意代碼注入的風險,代碼隱藏在人工智能代理讀取的文檔中,然后人工智能執(zhí)行該代碼。
“這種攻擊媒介并不新鮮,因為這是一種經(jīng)典的SQL?注入或數(shù)據(jù)庫存儲過程攻擊,”Meacham?說?!坝行屡d的緩解技術(shù)利用數(shù)據(jù)丟失預(yù)防類型的模式來限制或排除數(shù)據(jù)類型的學習。此外,一些新興解決方案聲稱可以在模塊學習和增長時檢查指令集,以幫助防止注入、幻覺和惡意代碼。到?2025?年第一季度,我們應(yīng)該在保護?AI?方面有一些真正的競爭者,而不僅僅是現(xiàn)有的?DLP?和?LLM?前面或之上的代碼審查增強功能?!?/span>
安永合伙人辛克萊·舒勒(Sinclair Schuller)?表示,除了已經(jīng)為底層人工智能模型設(shè)置的護欄外,還有幾種主要策略可以確保多智能體人工智能的安全。例如,智能體可以具有特定的個性,他說:“智能體是長壽的還是短壽的?它是否允許與其他智能體合作?”
多智能體系統(tǒng)還可以使用共識,要求同行智能體評估其他人的工作,或者使用對抗智能體來檢查原始響應(yīng),創(chuàng)建一個不同的響應(yīng),并比較兩個結(jié)果。企業(yè)還需要考慮如何測試這些系統(tǒng),以確保它們按預(yù)期運行?!斑@是最困難的事情,”他說。
他說,代理系統(tǒng)還可以這樣設(shè)置,即代理可以做的事情范圍是有限的,而且必須有人參與其中。保險公司?Aflac?就是一家確保這種情況的公司,以保持對人工智能的人類監(jiān)督,而不是讓其完全自主行動。首席信息官?Shelia Anderson?表示,這意味著即使公司采用加速原型設(shè)計計劃來開發(fā)代理人工智能項目,也要讓人類參與其中。這些項目包括簡化客戶服務(wù)和優(yōu)化員工工作流程的項目?!拔覀儗Υ砣斯ぶ悄懿扇〉姆椒ㄅc我們對?gen AI?和其他新興技術(shù)的方法相同,”她說。
這意味著項目將根據(jù)其涉及的風險程度進行評估。低風險用例涉及后臺應(yīng)用程序或流程支持,并影響人們的工作方式。中等風險涉及內(nèi)部數(shù)據(jù)和內(nèi)部使用。高風險計劃涉及外部用戶或受保護數(shù)據(jù)。
她表示,該公司仍處于早期階段,Aflac的創(chuàng)新團隊目前正在評估用例,并將在近期探索?PoC。這涉及評估代理?AI?的多個模型和平臺,包括自主開發(fā)的模型和平臺。
安德森說:“我們的更高級別的人工智能戰(zhàn)略將使我們定位于更多專用人工智能,這可能包括不同的模型和平臺,具體取決于我們打算如何將技術(shù)應(yīng)用于價值鏈。”
代理人工智能的另一個風險是,它可能會對循環(huán)中的人類工作者產(chǎn)生潛在影響,因為它可以處理更復(fù)雜的業(yè)務(wù)流程。
她補充道:“考慮員工影響和提高員工生產(chǎn)力既是機遇也是風險。”該計劃旨在將知識型員工轉(zhuǎn)移到更高價值的任務(wù),或使用人工智能幫助他們做出更好的決策并改善客戶體驗。因此,盡管?Aflac?對人工智能未來可以提供的好處感到興奮,但我們?nèi)詫W⒂跒榭蛻籼峁┧麄兤谕医?jīng)常需要的個性化支持。
三、早期階段的代理人工智能
Aflac并不是唯一一家剛剛開始?AI?代理之旅的公司。例如,Centric Consulting?與一家中型區(qū)域財產(chǎn)和意外傷害保險公司合作,該公司使用兩家不同的供應(yīng)商收集與保險索賠相關(guān)的客戶電子郵件并處理這些文件。
Centric的AI解決方案總監(jiān)Joseph Ours?表示,該公司每年要支付?50?萬美元的許可費,而且還涉及大量手動工作。因此,用代理系統(tǒng)取代該流程每年可以為公司節(jié)省約?100?萬美元,因此值得投資開發(fā)成本,而不是等待任何一家供應(yīng)商改進其產(chǎn)品。
“而且這兩家供應(yīng)商規(guī)模很大,不太可能互相收購,因此不會產(chǎn)生協(xié)同效應(yīng),”O(jiān)urs說。
隨后,Centric?構(gòu)建了一個自定義代理框架,并使用與?LLM?無關(guān)的后端為代理提供支持。如今,該平臺可以支持?OpenAI、Azure?上的?OpenAI、谷歌的?Gemini?或?Anthropic?的?Claude。例如,OpenAI?的多模式?GPT-4o?用于處理掃描文檔或圖像(如損壞照片)。當?gen AI?模型過于復(fù)雜時(例如將電子郵件分解成組成部分或查找保單號),該平臺會使用軟件或函數(shù)調(diào)用來處理任務(wù)。該系統(tǒng)已通過?PoC?階段,目前正在試點。
“概念驗證沒有安全防護欄和客戶體驗細節(jié),”O(jiān)urs說道。“我們正在努力添加這些內(nèi)容。我們的目標是進行分階段試點。我們希望確保一切都如我們預(yù)期的那樣順利?!?/span>
Ours表示,當系統(tǒng)完全理解了收到的信息、需要如何處理以及需要將其發(fā)送到何處時,它就會自主運行?!叭绻谌魏螘r候系統(tǒng)無法理解某些內(nèi)容或無法找到正確的記錄,系統(tǒng)就會被轉(zhuǎn)入人工審核?!?/span>
還將提供工具來捕捉精度和準確度指標,并有助于防止偏差,該系統(tǒng)預(yù)計將于今年第四季度投入生產(chǎn),同時進行工作培訓和其他變更管理。
“人工智能的顛覆性不亞于工業(yè)革命對農(nóng)業(yè)社會的顛覆性,”O(jiān)urs說道?!拔覀儾粦?yīng)該在不引入工具的情況下實施人工智能,否則人們會抵制它,結(jié)果也會不盡如人意?!?/span>
大西洋健康系統(tǒng)(Atlantic Health System)?是新澤西州最大的非營利性醫(yī)療保健網(wǎng)絡(luò)之一,它也已開始構(gòu)建利用代理人工智能的框架作為其自動化戰(zhàn)略的一部分。
該公司執(zhí)行副總裁兼首席信息和數(shù)字轉(zhuǎn)型官Sunil Dadlani?表示:“目前,我們正在使用檢索增強生成(RAG)來構(gòu)建工作流程。”這使得?LLM?查詢能夠通過相關(guān)上下文得到豐富。
他補充道:“我們正在將代理AI?作為擴展可以以更靈活但更注重任務(wù)的方式支持的工作流程類型的一種方式?!?/span>
該公司還在探索在ITSM?中使用代理?AI?的可能性。
他說:“我們看到了巨大的機遇,既可以利用技術(shù)來改善我們的內(nèi)部IT?流程,又可以將其作為試驗場來為我們和企業(yè)建立對技術(shù)的信心。”
為了實現(xiàn)這一目標,Atlantic Health使用其自己的內(nèi)部數(shù)字支持平臺,并正在探索?LangChain?與?Amazon Bedrock?協(xié)同協(xié)調(diào)?LLM?之間的數(shù)據(jù)流。這可以擴展為公司代理?AI?框架的基礎(chǔ)。
他說道:“我們還將利用Dialogflow?和?Google Cloud?平臺,并開始探討如何利用?Microsoft Bot Framework?!?/span>
四、進步的代價
代理型人工智能在醫(yī)療保健領(lǐng)域具有許多潛在優(yōu)勢,但也帶來了必須謹慎管理的重大風險。Atlantic Health已經(jīng)建立了一個框架來確保其新一代人工智能的安全,包括數(shù)據(jù)實踐、強大的安全性、人工監(jiān)督和透明的治理,以及持續(xù)的監(jiān)控、測試、遵守法律框架和問責結(jié)構(gòu)。但他表示,代理型人工智能系統(tǒng)的設(shè)計目的是以一定程度的自主性運行。
他說道:“如果人工智能難以處理復(fù)雜病例,或者延誤關(guān)鍵干預(yù)措施,患者的安全也會面臨風險?!?/span>
即使是大型科技公司,在很大程度上也還遠未實現(xiàn)大規(guī)模采用。Salesforce的?AI?研究和應(yīng)用副總裁?Caiming Xiong?表示:“我們相信多模態(tài)代理?AI?是未來的趨勢?!?/span>
多模態(tài)人工智能意味著為代理提供支持的人工智能可以處理的不僅僅是文本。目前已經(jīng)有了可以處理圖像、音頻甚至視頻的新一代人工智能平臺?!坝泻芏嘈畔⒛悴荒苤挥梦淖謥砻枋?,”他說。
但多智能體AI?系統(tǒng)仍處于實驗階段,或使用方式非常有限。Salesforce?內(nèi)部使用智能體?AI?的一個案例是軟件開發(fā)?!拔覀兪褂米约旱哪P秃妥约簶?gòu)建的智能體框架,”Xiong?說。“不過,我認為我們不會取代我們的開發(fā)人員。你不能完全信任人工智能開發(fā)的代碼,但我們會提高生產(chǎn)力和質(zhì)量,智能體編碼助手可以幫助我們的初級開發(fā)人員變得更加專業(yè)?!?/span>
他說,還有一個代理框架,可以匯集來自不同來源的信息來回答問題、解決客戶問題或建議下一步行動。這里的后端模型是OpenAI的?GPT 4?和?GPT 3.5。為了讓代理?AI?走上正軌,Salesforce?正在利用它已經(jīng)為?gen AI?設(shè)置的所有護欄。
“我們會分析每一個問題和答案,”熊先生說,“我們會分析其危害和偏見,并尋求及時的治療?!?/span>
最重要的是,還有安全和訪問控制,以確保代理不會試圖獲取他們不應(yīng)該獲取的信息。
“我們還設(shè)置了防護措施,以確保其行為是允許執(zhí)行的,”他說。“我們將這些組件內(nèi)置到代理框架中,以確保它不會做錯事?!?/span>
但這并不意味著它是完美的,所以其中內(nèi)置了人工監(jiān)督。例如,可能會要求人類確認是否應(yīng)執(zhí)行某個特定操作。
“在開發(fā)方面,我們有團隊在任何產(chǎn)品投入生產(chǎn)之前進行評估,”他說。
該公司首席信息官Juan Perez?確認,任何新系統(tǒng)都必須符合?Salesforce?建立的防護措施。
“我們在生成式人工智能解決方案中建立了一個完整的信任層,”佩雷斯說?!拔覀冇幸惶卓傮w安全實踐和隱私實踐來指導(dǎo)我們所做的一切?!彼a充說,還有一個人工智能委員會,由來自公司各個部門的人員組成,包括法律、隱私、道德人工智能使用小組、數(shù)據(jù)人員、技術(shù)專家和業(yè)務(wù)用戶。
與此同時,熊先生表示,多智能體系統(tǒng)實際上可能比單一的人工智能模型更安全。
“如果你只有一個系統(tǒng),而它被黑客入侵,那么對公司來說,這將是一場巨大的災(zāi)難,”他說,“但是如果你有一百或一千個代理,而一個代理被黑客入侵,那就沒問題了?!?/span>
此外,每個代理都可以針對其特定任務(wù)進行優(yōu)化。如果LLM?針對特定目的進行優(yōu)化,則其他領(lǐng)域的性能可能會受到影響,但使用多代理,可以隔離并改進一項任務(wù)。
五、交付中的端到端人工智能代理(AI agent)
Forrester分析師?Craig Le Clair?表示,大多數(shù)部署?AI?代理的公司并沒有將其作為完整的端到端代理?AI?流程的一部分。
“我剛剛與30?家銀行和投資公司進行了交流,他們都說了同一句話:‘我們還沒有準備好將整個流程交給人工智能?!?/span>他說,相反,企業(yè)正在將人工智能代理添加到現(xiàn)有的核心流程中,整個流程由傳統(tǒng)流程代理控制。例如,業(yè)務(wù)流程可能需要根據(jù)某些信息生成電子郵件,而人工智能可用于創(chuàng)建更加定制化的消息,其他人工智能代理則負責處理其他小部分。
Le Clair表示,最先進的端到端封閉式自主系統(tǒng)(相當于自動駕駛汽車的商業(yè)版本)尚未實現(xiàn)。但一些公司表示,他們正在接近這一目標。一家已經(jīng)投入生產(chǎn)代理式?AI?系統(tǒng)的公司是?Indicium,這是一家總部位于紐約和巴西的全球數(shù)據(jù)咨詢公司。該公司首席數(shù)據(jù)官?Daniel Avancini?表示,這些?AI?代理既為內(nèi)部用戶服務(wù),也為客戶服務(wù)。
這些代理用于查詢和交叉引用來自各種來源的數(shù)據(jù),包括Moodle、GitHub、Bitbucket、內(nèi)部?Wiki?和公司的?Snowflake?數(shù)據(jù)倉庫。它們使用?gen AI?來解釋復(fù)雜的問題并識別最相關(guān)的數(shù)據(jù)源。
“例如,我們的一個代理可以從我們的內(nèi)部wiki?中提取信息,將其與代碼存儲庫中的數(shù)據(jù)進行交叉引用,然后根據(jù)我們的分析數(shù)據(jù)對其進行驗證,以提供對業(yè)務(wù)查詢的全面答案,”他說。“我們的一些更先進的代理實際上可以根據(jù)現(xiàn)有流程構(gòu)建解決方案?!?/span>
例如,一個代理可以根據(jù)數(shù)據(jù)管道需求的描述在Airflow?中創(chuàng)建有向無環(huán)圖,其中涉及復(fù)雜的多步驟任務(wù)。
【睿觀:這段話描述了一個非常有前景的應(yīng)用場景,即利用人工智能技術(shù)來自動化數(shù)據(jù)管道構(gòu)建。通過代理,我們可以大大減少手動創(chuàng)建和維護DAG的工作量,提高數(shù)據(jù)處理的效率。
(一)核心概念
代理(Agent):在這里,代理可以理解為一個智能的軟件程序,它能夠根據(jù)用戶的需求,自主地完成一些任務(wù)。在這個例子中,代理可以理解為一個自動化工具,能夠根據(jù)用戶對數(shù)據(jù)管道的描述,自動生成相應(yīng)的Airflow DAG。
Airflow:是一個開源的平臺,用來創(chuàng)建、調(diào)度和監(jiān)控工作流。它使用有向無環(huán)圖(DAG)來表示工作流中的任務(wù)和它們之間的依賴關(guān)系。
有向無環(huán)圖(DAG):是一種圖數(shù)據(jù)結(jié)構(gòu),圖中的節(jié)點表示任務(wù),邊表示任務(wù)之間的依賴關(guān)系。有向表示任務(wù)是有先后順序的,無環(huán)表示不存在循環(huán)依賴。在數(shù)據(jù)管道中,DAG可以清晰地表示數(shù)據(jù)處理的流程。
數(shù)據(jù)管道:是一系列處理數(shù)據(jù)的步驟,從數(shù)據(jù)獲取到數(shù)據(jù)分析,再到數(shù)據(jù)可視化等。數(shù)據(jù)管道通常涉及到多個步驟,比如數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)加載等。
(二)術(shù)語解釋
創(chuàng)建有向無環(huán)圖:就是使用Airflow創(chuàng)建一個DAG,這個DAG會描述數(shù)據(jù)管道中的所有任務(wù)以及它們之間的依賴關(guān)系。
復(fù)雜的多步驟任務(wù):表示數(shù)據(jù)管道中的任務(wù)可能有很多,而且任務(wù)之間存在復(fù)雜的依賴關(guān)系。例如,一個數(shù)據(jù)管道可能需要先清洗數(shù)據(jù),然后進行特征工程,再訓練模型,最后進行預(yù)測。
根據(jù)數(shù)據(jù)管道需求的描述:表示代理會根據(jù)用戶對數(shù)據(jù)管道的需求,比如輸入數(shù)據(jù)、輸出結(jié)果、處理邏輯等,來生成相應(yīng)的DAG。
(三)工作原理示例
假設(shè)用戶想要創(chuàng)建一個數(shù)據(jù)管道,用于處理電商平臺的銷售數(shù)據(jù),生成銷售報表。代理可以根據(jù)用戶的描述,自動生成以下DAG:
1.提取數(shù)據(jù): 從數(shù)據(jù)庫中提取銷售數(shù)據(jù)。
2.清洗數(shù)據(jù): 處理缺失值、異常值等。
3.特征工程: 將原始數(shù)據(jù)轉(zhuǎn)換為模型可用的特征。
4.訓練模型: 使用訓練數(shù)據(jù)訓練一個機器學習模型。
5.預(yù)測: 使用訓練好的模型對新數(shù)據(jù)進行預(yù)測。
6.生成報表: 將預(yù)測結(jié)果生成可視化報表。
(四)代理是如何實現(xiàn)的呢?
1.自然語言處理: 代理需要能夠理解用戶對數(shù)據(jù)管道的描述,這涉及到自然語言處理技術(shù)。
2.模板引擎: 代理可以使用模板引擎來生成Airflow的DAG代碼。
3.領(lǐng)域知識: 代理需要具備一定的領(lǐng)域知識,才能理解數(shù)據(jù)處理的流程和常見操作。
4.機器學習: 代理可以通過機器學習的方法,學習大量的示例數(shù)據(jù),從而提高生成DAG的準確性?!?/span>
其他代理仍處于試驗階段,其中包括可以分析代碼存儲庫并根據(jù)最佳實踐和歷史性能數(shù)據(jù)提出優(yōu)化建議的代理。
Avancini表示,構(gòu)建這些代理的主要框架是?LangChain,
他說,Indicium使用其?LangGraph?組件,該組件可對其代理的決策過程進行精細控制。
“我們可能會創(chuàng)建一個圖表,其中代理首先分析用戶的查詢,然后決定要咨詢哪些數(shù)據(jù)源,執(zhí)行必要的查詢,最后將信息綜合成連貫的響應(yīng),”他說?!霸诿總€步驟中,我們都可以實現(xiàn)決策點和后備選項?!?/span>
Avancini表示,為了支持這些代理,OpenAI?和?Anthropic?模型是首選,但部署策略與云無關(guān)?!拔覀兛梢愿鶕?jù)具體項目要求在?AWS、Azure?或?GCP?上部署我們的代理,”他說?!拔覀兛梢酝ㄟ^它們的?API?直接訪問這些模型,也可以通過?AWS Bedrock?或?Azure OpenAI?等云服務(wù)訪問這些模型。”
為了實現(xiàn)監(jiān)控和可觀察性,該公司使用LangChain?的?LangSmith,這使得?Indicium?能夠跟蹤性能、識別瓶頸并快速迭代。
“在某些情況下,尤其是快速原型設(shè)計或與技術(shù)含量較低的利益相關(guān)者合作時,我們會使用可視化開發(fā)工具,”Avancini說?!袄?,Azure AI Studio?允許我們以可視化方式組裝代理,然后將結(jié)果導(dǎo)出為代碼。當我們探索新的代理架構(gòu)或向客戶展示概念時,這尤其有用?!?/span>
為了滿足代理系統(tǒng)的內(nèi)存需求,Indicium使用矢量數(shù)據(jù)庫,例如?Pinecone。
“這些數(shù)據(jù)庫使我們能夠高效地存儲和查詢大量非結(jié)構(gòu)化數(shù)據(jù),這對于我們的許多AI?應(yīng)用程序來說至關(guān)重要,”他說?!盀榱颂幚矸墙Y(jié)構(gòu)化文檔,我們使用?LlamaParse?等工具來幫助我們從各種文檔格式中提取有意義的信息。”
Indicium還為流行的消息平臺構(gòu)建了定制連接器,以便代理可以更好地與用戶互動。
【睿觀:人工智能代理和多代理系統(tǒng)是人工智能領(lǐng)域的研究熱點,具有廣闊的發(fā)展前景。隨著技術(shù)的不斷進步,AI agent將在我們的生活中扮演越來越重要的角色。以下是人工智能代理(AI agent)的現(xiàn)狀與多代理的趨勢分析:
(一)人工智能代理(AI agent)的現(xiàn)狀
1、當前AI agent的主要應(yīng)用領(lǐng)域包括:
客服行業(yè):AI客服機器人能夠24小時在線,為用戶提供高效、個性化的服務(wù)。
金融行業(yè):AI agent可以用于風險評估、投資顧問、欺詐檢測等方面。
醫(yī)療行業(yè):AI agent可以輔助醫(yī)生進行診斷、治療,并提供個性化的健康管理方案。
游戲行業(yè):游戲中的NPC(非玩家角色)常常被設(shè)計為AI agent,以提供更逼真的游戲體驗。
2.AI agent的發(fā)展現(xiàn)狀主要體現(xiàn)在以下幾個方面:
技術(shù)進步:機器學習、深度學習等技術(shù)的突破,使得AI agent在感知、學習、推理等方面取得了顯著進展。
應(yīng)用場景擴大:AI agent的應(yīng)用范圍不斷擴大,從簡單的任務(wù)執(zhí)行向更復(fù)雜、更智能的方向發(fā)展。
交互能力增強:AI agent與人類的交互方式更加自然、流暢,能夠更好地理解人類的意圖。
(二)多代理系統(tǒng)的趨勢分析
多代理系統(tǒng)(multi-agent system)是由多個AI agent組成的系統(tǒng),這些agent之間可以相互協(xié)作或競爭,以實現(xiàn)共同的目標。多代理系統(tǒng)在解決復(fù)雜問題、模擬復(fù)雜系統(tǒng)等方面具有獨特的優(yōu)勢。
1、多代理系統(tǒng)的趨勢主要體現(xiàn)在以下幾個方面:
協(xié)同智能:多個AI agent通過協(xié)作,能夠解決單個agent無法解決的復(fù)雜問題,實現(xiàn)“1+1>2”的效果。
分布式?jīng)Q策:多代理系統(tǒng)中的每個agent都具有自主決策的能力,可以根據(jù)自身的狀態(tài)和環(huán)境信息做出決策,從而提高系統(tǒng)的靈活性和魯棒性。
自組織能力:多代理系統(tǒng)能夠自適應(yīng)環(huán)境的變化,通過自組織的方式實現(xiàn)系統(tǒng)的演化和優(yōu)化。
應(yīng)用場景拓展:多代理系統(tǒng)在智能交通、智能電網(wǎng)、機器人協(xié)作等領(lǐng)域具有廣闊的應(yīng)用前景。
2、多代理系統(tǒng)面臨的挑戰(zhàn):
復(fù)雜性:多個agent之間的交互關(guān)系復(fù)雜,難以建模和分析。
協(xié)調(diào)性:如何保證多個agent之間的協(xié)調(diào)一致,是多代理系統(tǒng)研究的難點。
可解釋性:多代理系統(tǒng)的決策過程往往難以解釋,這限制了其在一些對安全性要求較高的領(lǐng)域的應(yīng)用。
(三)未來發(fā)展趨勢
更強的自主性:AI agent將具備更強的自主學習、適應(yīng)和進化能力,能夠在復(fù)雜多變的環(huán)境中獨立完成任務(wù)。
更深入的協(xié)作:多個AI agent之間的協(xié)作將更加深入,能夠?qū)崿F(xiàn)更復(fù)雜、更智能的任務(wù)。
更廣泛的應(yīng)用:AI agent將在更多的領(lǐng)域得到應(yīng)用,如醫(yī)療、教育、金融等。
更注重倫理:隨著AI agent的智能水平不斷提高,人們對AI agent的倫理問題也越來越關(guān)注,未來AI agent的發(fā)展將更加注重倫理規(guī)范。
(四)人工智能代理(AI agent)與AI智能體(bot)的區(qū)別與聯(lián)系
人工智能代理(AI agent) 和AI智能體(bot) 這兩個概念經(jīng)常被混用,但它們之間存在一些細微的差別。
1、共同點
(1)本質(zhì):都是能夠在環(huán)境中感知、學習、決策并執(zhí)行動作的軟件實體。
(2)目標: 都是為了實現(xiàn)特定的目標,比如完成任務(wù)、提供服務(wù)等。
(3)組成: 通常包含感知模塊、決策模塊和執(zhí)行模塊。
2、區(qū)別
(1)廣義與狹義:
AI agent:概念更廣,可以指任何能夠自主行動的智能體,包括虛擬的和物理的。
AI智能體(bot):概念相對狹義,通常指通過對話方式與用戶交互的程序,如聊天機器人。
(2)功能范圍:
AI agent:功能范圍更廣,可以完成各種各樣的任務(wù),如規(guī)劃、學習、推理等。
AI智能體(bot):功能相對集中在對話交互方面,擅長處理自然語言。
(3)復(fù)雜程度:
AI agent:結(jié)構(gòu)和功能可能更加復(fù)雜,需要處理更復(fù)雜的環(huán)境和任務(wù)。
AI智能體(bot):相對來說結(jié)構(gòu)更簡單,專注于對話交互。
3、聯(lián)系
(1)包含關(guān)系:AI智能體可以看作是AI agent的一種特殊類型,是專注于對話交互的AI agent。
(2)技術(shù)基礎(chǔ): 兩種智能體都基于相似的技術(shù),如機器學習、自然語言處理等。
(3)發(fā)展趨勢: 隨著技術(shù)的進步,兩者之間的界限會越來越模糊,AI智能體可能會具備更強大的功能,而AI agent也可能會更加注重與用戶的交互。
總之,AI agent是一個更廣義的概念,代表了人工智能在各個領(lǐng)域中的應(yīng)用。AI智能體(bot) 則是AI agent在對話交互領(lǐng)域的一個具體體現(xiàn)。雖然兩者之間存在一些區(qū)別,但它們都是人工智能發(fā)展的產(chǎn)物,都旨在讓機器能夠更好地理解和適應(yīng)環(huán)境,為人類服務(wù)?!?/span>