從未有一項(xiàng)技術(shù)能夠落實(shí)地如此糟糕,卻又能如此自如地假裝自己做得沒問題。
圖源:Robbie Goodall/Getty Images
雖然高管和經(jīng)理們可能會對將generative artificial intelligence(生成式人工智能,是利用復(fù)雜的算法、模型和規(guī)則,從大規(guī)模數(shù)據(jù)集中學(xué)習(xí),以創(chuàng)造新的原創(chuàng)內(nèi)容的人工智能技術(shù)。這項(xiàng)技術(shù)能夠創(chuàng)造文本、圖片、聲音、視頻和代碼等多種類型的內(nèi)容,全面超越了傳統(tǒng)軟件的數(shù)據(jù)處理和分析能力。)和LLM(large language models)(LLM大型語言模型。是使用深度學(xué)習(xí)算法處理和理解自然語言的基礎(chǔ)機(jī)器學(xué)習(xí)模型。這些模型在大量文本數(shù)據(jù)上進(jìn)行訓(xùn)練,以學(xué)習(xí)語言中的模式和實(shí)體關(guān)系。LLM可以執(zhí)行多種類型的語言任務(wù),例如翻譯語言、分析情緒、聊天機(jī)器人對話等。)應(yīng)用于手頭的工作中感到興奮,但現(xiàn)在是時(shí)候退一步,考慮在哪里以及如何實(shí)現(xiàn)業(yè)務(wù)回報(bào)了。這仍然是一個(gè)混亂和被誤解的領(lǐng)域,需要與過去的技術(shù)浪潮幾乎毫無相似之處的方法和技能。
挑戰(zhàn)在于:雖然人工智能通常會提供非常令人驚嘆的概念證明,但很難利用其盈利。Capgemini(一般指凱捷咨詢公司。凱捷管理顧問公司總部設(shè)于法國巴黎,由法國企業(yè)家Serge Kampf?于1967年創(chuàng)立,是一間全球性的資訊科技服務(wù)管理領(lǐng)導(dǎo)廠商。它列名在巴黎CAC40指數(shù)中,是法國前四十大企業(yè)。企業(yè)總部位于巴黎蒂爾西特路,仍然由Serge Kampf擔(dān)任執(zhí)行長,在全球39個(gè)國家擁有分公司,合并了安永咨詢。)執(zhí)行副總裁Steve Jones(史蒂夫·瓊斯)在今日于舊金山舉行的Databricks conference(2024年6月10-13日,超級獨(dú)角獸公司Databricks在舊金山舉辦了一年一度的Databricks Data+AI峰會。)上發(fā)表演講時(shí)表示:“證明ROI(投資回報(bào)率,是指通過投資而應(yīng)返回的價(jià)值,即企業(yè)從一項(xiàng)投資活動(dòng)中得到的經(jīng)濟(jì)回報(bào)。它涵蓋了企業(yè)的獲利目標(biāo)。利潤和投入經(jīng)營所必備的財(cái)產(chǎn)相關(guān),因?yàn)楣芾砣藛T必須通過投資和現(xiàn)有財(cái)產(chǎn)獲得利潤。)是將20、30、40個(gè)生成式人工智能解決方案投入生產(chǎn)的最大挑戰(zhàn)。”
需要進(jìn)行的投資包括測試和監(jiān)控投入生產(chǎn)的LLM。測試對于保持LLM的準(zhǔn)確和步入正軌尤為重要。Jones(瓊斯)建議說:“測試這些模型時(shí),您要表現(xiàn)得有點(diǎn)‘壞’。”例如,在測試階段,開發(fā)人員、設(shè)計(jì)人員或QA(Quality Assurance,質(zhì)量保證。是質(zhì)量管理的一部分,它致力于提供質(zhì)量要求會得到滿足的信任。質(zhì)量保證是指為使人們確信產(chǎn)品或服務(wù)能滿足質(zhì)量要求而在質(zhì)量管理體系中實(shí)施并根據(jù)需要進(jìn)行證實(shí)的全部有計(jì)劃和有系統(tǒng)的活動(dòng)。)專家應(yīng)該有意地“帶偏”他們的LLM,看看它們?nèi)绾翁幚礤e(cuò)誤信息。
為了檢驗(yàn)負(fù)產(chǎn)出,Jones(瓊斯)舉了一個(gè)例子,說他提出一種假設(shè)的商業(yè)模式,即一家公司“使用龍來進(jìn)行長途運(yùn)輸”。該模型做出了肯定的回應(yīng)。然后,他提示模型提供有關(guān)該長途運(yùn)輸商業(yè)模式的信息。
“它給出的答案是,‘這是您從事長途運(yùn)輸工作所需要做的,因?yàn)檎?/span>您已經(jīng)告訴我的那樣,您將廣泛地與龍合作,然后您需要接受廣泛的消防和安全培訓(xùn),’”Jones(瓊斯)說,“您還需要對公主進(jìn)行禮儀培訓(xùn),因?yàn)辇埖墓ぷ餍枰c公主一起工作。然后是一堆標(biāo)準(zhǔn)的東西,包括運(yùn)輸和倉儲,被從解決方案的其余部分中刪除?!?/span>
Jones(瓊斯)繼續(xù)說,關(guān)鍵是生成式人工智能“是一種將技術(shù)糟糕地添加到現(xiàn)有應(yīng)用程序中并假裝自己做得很好的技術(shù)。生成式人工智能是一種非凡的技術(shù),只會為應(yīng)用程序添加一些鈴聲和口哨聲,但從生產(chǎn)的安全和風(fēng)險(xiǎn)角度來看,它確實(shí)很可怕。”
生成式人工智能還需要兩到五年的時(shí)間才能成為主流采用的一部分,與其他技術(shù)相比,這速度很快。Jones(瓊斯)說:“您面臨的挑戰(zhàn)將是如何跟上進(jìn)度。”目前有兩種情況:“第一個(gè)情況是,這將是一個(gè)偉大的大模型,它將知道一切,而且不會有任何問題。這就是所謂的瘋狂樂觀和不可能發(fā)生的理論。”
正在發(fā)展的是“每一個(gè)供應(yīng)商、每一個(gè)軟件平臺、每一個(gè)云計(jì)算,都將希望進(jìn)行積極的競爭,以成為這個(gè)市場的一部分。”Jones(瓊斯)說,“這意味著您將面臨越來越多的競爭和變化。您不必?fù)?dān)心多云基礎(chǔ)設(shè)施,也不必支持它,但您必須考慮護(hù)欄等問題。”
Jones(瓊斯)說,另一個(gè)風(fēng)險(xiǎn)是將LLM應(yīng)用于所需的功率和分析要少得多的任務(wù)上,比如地址匹配。“如果您什么都用一個(gè)大模型,那本質(zhì)上就是燒錢。這相當(dāng)于去找律師說,‘我想讓您為我寫一張生日賀卡。’他們會從善如流地做,然后向您收取高額代理費(fèi)。”
他敦促說,關(guān)鍵是要警惕利用LLM的更便宜、更有效的方法。“如果出現(xiàn)問題,您需要能夠盡快停用解決方案。您需要確保它周圍的所有相關(guān)工件都與模型同步調(diào)試。”
不存在部署單個(gè)模型這回事——人工智能用戶應(yīng)該將他們的查詢應(yīng)用于多個(gè)模型來衡量響應(yīng)的性能和質(zhì)量。“您應(yīng)該有一種通用的方法來捕獲所有的指標(biāo),并針對不同的模型回放查詢,”Jones(瓊斯)繼續(xù)說道,“如果有人在查詢GPT-4 Turbo(是OpenAI發(fā)布的最新語言模型,相比之前的GPT-3.5和GPT-4.0模型,它更為強(qiáng)大。GPT-4 Turbo不僅在技術(shù)上有所突破,還在功能上進(jìn)行了顯著的增強(qiáng),為用戶提供了更多的便利和靈活性。),您想看看同樣的查詢對Llama(Meta AI推出的大語言模型。之后源代碼公開到了?4chan?論壇上,使得任何一個(gè)普通工程師,都有機(jī)會開發(fā)自己的聊天機(jī)器人產(chǎn)品。只需要一臺筆記本電腦就能部署,不必像?OpenAI?那樣動(dòng)輒上萬塊?GPU,對中小開發(fā)者極其友好,且性能也沒差到哪去。泄漏后的幾個(gè)月內(nèi),一位斯坦福大學(xué)的研究人員,只花了不到?600?美元就做出了一個(gè)性能尚可的?AI?聊天機(jī)器人;大洋彼岸的哈工大,數(shù)位研究人員用Llama和專業(yè)數(shù)據(jù)做出了一個(gè)醫(yī)學(xué)知識?AI,取名叫“華駝”。圍繞?LLaMA,一個(gè)生態(tài)開始涌現(xiàn)。)的執(zhí)行情況。您應(yīng)該能夠有一種機(jī)制來回放這些查詢和響應(yīng),并比較性能指標(biāo),這樣您就可以了解是否可以用更便宜的方式進(jìn)行查詢。因?yàn)檫@些模型正在不斷更新?!?/span>
生成式人工智能“正常情況下不會出錯(cuò)”,但他補(bǔ)充說,“生成式人工智能是您輸入一個(gè)發(fā)票它會回復(fù),‘棒極了,這是一篇關(guān)于安德魯·杰克遜總統(tǒng)的4000字的文章。因?yàn)槲?/span>認(rèn)為這就是您發(fā)送的內(nèi)容的含義。’所以,您需要有AI應(yīng)用的護(hù)欄來防止這種情況的發(fā)生。”
作者:Joe McKendrick(喬·麥克肯德里克)
譯者:寶藍(lán) @lex