從未有一項技術(shù)能夠落實地如此糟糕,卻又能如此自如地假裝自己做得沒問題。
圖源:Robbie Goodall/Getty Images
雖然高管和經(jīng)理們可能會對將generative artificial intelligence(生成式人工智能,是利用復(fù)雜的算法、模型和規(guī)則,從大規(guī)模數(shù)據(jù)集中學(xué)習(xí),以創(chuàng)造新的原創(chuàng)內(nèi)容的人工智能技術(shù)。這項技術(shù)能夠創(chuàng)造文本、圖片、聲音、視頻和代碼等多種類型的內(nèi)容,全面超越了傳統(tǒng)軟件的數(shù)據(jù)處理和分析能力。)和LLM(large language models)(LLM大型語言模型。是使用深度學(xué)習(xí)算法處理和理解自然語言的基礎(chǔ)機器學(xué)習(xí)模型。這些模型在大量文本數(shù)據(jù)上進行訓(xùn)練,以學(xué)習(xí)語言中的模式和實體關(guān)系。LLM可以執(zhí)行多種類型的語言任務(wù),例如翻譯語言、分析情緒、聊天機器人對話等。)應(yīng)用于手頭的工作中感到興奮,但現(xiàn)在是時候退一步,考慮在哪里以及如何實現(xiàn)業(yè)務(wù)回報了。這仍然是一個混亂和被誤解的領(lǐng)域,需要與過去的技術(shù)浪潮幾乎毫無相似之處的方法和技能。
挑戰(zhàn)在于:雖然人工智能通常會提供非常令人驚嘆的概念證明,但很難利用其盈利。Capgemini(一般指凱捷咨詢公司。凱捷管理顧問公司總部設(shè)于法國巴黎,由法國企業(yè)家Serge Kampf?于1967年創(chuàng)立,是一間全球性的資訊科技服務(wù)管理領(lǐng)導(dǎo)廠商。它列名在巴黎CAC40指數(shù)中,是法國前四十大企業(yè)。企業(yè)總部位于巴黎蒂爾西特路,仍然由Serge Kampf擔(dān)任執(zhí)行長,在全球39個國家擁有分公司,合并了安永咨詢。)執(zhí)行副總裁Steve Jones(史蒂夫·瓊斯)在今日于舊金山舉行的Databricks conference(2024年6月10-13日,超級獨角獸公司Databricks在舊金山舉辦了一年一度的Databricks Data+AI峰會。)上發(fā)表演講時表示:“證明ROI(投資回報率,是指通過投資而應(yīng)返回的價值,即企業(yè)從一項投資活動中得到的經(jīng)濟回報。它涵蓋了企業(yè)的獲利目標(biāo)。利潤和投入經(jīng)營所必備的財產(chǎn)相關(guān),因為管理人員必須通過投資和現(xiàn)有財產(chǎn)獲得利潤。)是將20、30、40個生成式人工智能解決方案投入生產(chǎn)的最大挑戰(zhàn)。”
需要進行的投資包括測試和監(jiān)控投入生產(chǎn)的LLM。測試對于保持LLM的準(zhǔn)確和步入正軌尤為重要。Jones(瓊斯)建議說:“測試這些模型時,您要表現(xiàn)得有點‘壞’?!?/span>例如,在測試階段,開發(fā)人員、設(shè)計人員或QA(Quality Assurance,質(zhì)量保證。是質(zhì)量管理的一部分,它致力于提供質(zhì)量要求會得到滿足的信任。質(zhì)量保證是指為使人們確信產(chǎn)品或服務(wù)能滿足質(zhì)量要求而在質(zhì)量管理體系中實施并根據(jù)需要進行證實的全部有計劃和有系統(tǒng)的活動。)專家應(yīng)該有意地“帶偏”他們的LLM,看看它們?nèi)绾翁幚礤e誤信息。
為了檢驗負產(chǎn)出,Jones(瓊斯)舉了一個例子,說他提出一種假設(shè)的商業(yè)模式,即一家公司“使用龍來進行長途運輸”。該模型做出了肯定的回應(yīng)。然后,他提示模型提供有關(guān)該長途運輸商業(yè)模式的信息。
“它給出的答案是,‘這是您從事長途運輸工作所需要做的,因為正如您已經(jīng)告訴我的那樣,您將廣泛地與龍合作,然后您需要接受廣泛的消防和安全培訓(xùn),’”Jones(瓊斯)說,“您還需要對公主進行禮儀培訓(xùn),因為龍的工作需要與公主一起工作。然后是一堆標(biāo)準(zhǔn)的東西,包括運輸和倉儲,被從解決方案的其余部分中刪除?!?/span>
Jones(瓊斯)繼續(xù)說,關(guān)鍵是生成式人工智能“是一種將技術(shù)糟糕地添加到現(xiàn)有應(yīng)用程序中并假裝自己做得很好的技術(shù)。生成式人工智能是一種非凡的技術(shù),只會為應(yīng)用程序添加一些鈴聲和口哨聲,但從生產(chǎn)的安全和風(fēng)險角度來看,它確實很可怕。”
生成式人工智能還需要兩到五年的時間才能成為主流采用的一部分,與其他技術(shù)相比,這速度很快。Jones(瓊斯)說:“您面臨的挑戰(zhàn)將是如何跟上進度。”目前有兩種情況:“第一個情況是,這將是一個偉大的大模型,它將知道一切,而且不會有任何問題。這就是所謂的瘋狂樂觀和不可能發(fā)生的理論。”
正在發(fā)展的是“每一個供應(yīng)商、每一個軟件平臺、每一個云計算,都將希望進行積極的競爭,以成為這個市場的一部分。”Jones(瓊斯)說,“這意味著您將面臨越來越多的競爭和變化。您不必擔(dān)心多云基礎(chǔ)設(shè)施,也不必支持它,但您必須考慮護欄等問題。”
Jones(瓊斯)說,另一個風(fēng)險是將LLM應(yīng)用于所需的功率和分析要少得多的任務(wù)上,比如地址匹配。“如果您什么都用一個大模型,那本質(zhì)上就是燒錢。這相當(dāng)于去找律師說,‘我想讓您為我寫一張生日賀卡。’他們會從善如流地做,然后向您收取高額代理費。”
他敦促說,關(guān)鍵是要警惕利用LLM的更便宜、更有效的方法。“如果出現(xiàn)問題,您需要能夠盡快停用解決方案。您需要確保它周圍的所有相關(guān)工件都與模型同步調(diào)試。”
不存在部署單個模型這回事——人工智能用戶應(yīng)該將他們的查詢應(yīng)用于多個模型來衡量響應(yīng)的性能和質(zhì)量。“您應(yīng)該有一種通用的方法來捕獲所有的指標(biāo),并針對不同的模型回放查詢,”Jones(瓊斯)繼續(xù)說道,“如果有人在查詢GPT-4 Turbo(是OpenAI發(fā)布的最新語言模型,相比之前的GPT-3.5和GPT-4.0模型,它更為強大。GPT-4 Turbo不僅在技術(shù)上有所突破,還在功能上進行了顯著的增強,為用戶提供了更多的便利和靈活性。),您想看看同樣的查詢對Llama(Meta AI推出的大語言模型。之后源代碼公開到了?4chan?論壇上,使得任何一個普通工程師,都有機會開發(fā)自己的聊天機器人產(chǎn)品。只需要一臺筆記本電腦就能部署,不必像?OpenAI?那樣動輒上萬塊?GPU,對中小開發(fā)者極其友好,且性能也沒差到哪去。泄漏后的幾個月內(nèi),一位斯坦福大學(xué)的研究人員,只花了不到?600?美元就做出了一個性能尚可的?AI?聊天機器人;大洋彼岸的哈工大,數(shù)位研究人員用Llama和專業(yè)數(shù)據(jù)做出了一個醫(yī)學(xué)知識?AI,取名叫“華駝”。圍繞?LLaMA,一個生態(tài)開始涌現(xiàn)。)的執(zhí)行情況。您應(yīng)該能夠有一種機制來回放這些查詢和響應(yīng),并比較性能指標(biāo),這樣您就可以了解是否可以用更便宜的方式進行查詢。因為這些模型正在不斷更新。”
生成式人工智能“正常情況下不會出錯”,但他補充說,“生成式人工智能是您輸入一個發(fā)票它會回復(fù),‘棒極了,這是一篇關(guān)于安德魯·杰克遜總統(tǒng)的4000字的文章。因為我認為這就是您發(fā)送的內(nèi)容的含義。’所以,您需要有AI應(yīng)用的護欄來防止這種情況的發(fā)生。”
作者:Joe McKendrick(喬·麥克肯德里克)
譯者:寶藍 @lex