企業(yè)LLM(大型語言模型。是使用深度學(xué)習(xí)算法處理和理解自然語言的基礎(chǔ)機(jī)器學(xué)習(xí)模型。這些模型在大量文本數(shù)據(jù)上進(jìn)行訓(xùn)練,以學(xué)習(xí)語言中的模式和實(shí)體關(guān)系。LLM可以執(zhí)行多種類型的語言任務(wù),例如翻譯語言、分析情緒、聊天機(jī)器人對(duì)話等。)可以建立在公開可用的基礎(chǔ)模型上。這是一個(gè)良好的開端。
圖源:BentlyChang/Getty Images
企業(yè)是否準(zhǔn)備好構(gòu)建和維護(hù)自己的內(nèi)部LLM?
人工智能——尤其是生成式智能——吸引了科技專業(yè)人士和高管們的無限興趣。想想看:盡管最近關(guān)于削減云服務(wù)和基礎(chǔ)設(shè)施預(yù)算的討論層出不窮,但人工智能資金的源頭已經(jīng)打開。只是它是流向外部服務(wù),還是流向內(nèi)部人才和資源呢?
許多外部實(shí)體,如OpenAI(在美國成立的人工智能研究公司,核心宗旨在于“實(shí)現(xiàn)安全的通用人工智能,AGI”,使其有益于人類。OpenAI于2015年由一群科技領(lǐng)袖,包括山姆·阿爾特曼、彼得·泰爾、里德·霍夫曼和埃隆·馬斯克等人創(chuàng)辦。)、微軟和谷歌,被視為LLM、基礎(chǔ)設(shè)施支持和專業(yè)知識(shí)的主要提供者。然而,對(duì)內(nèi)部LLM項(xiàng)目的興趣也在上升。TCS(塔塔咨詢服務(wù)公司,是印度著名的企業(yè)集團(tuán)—塔塔集團(tuán)的控股子公司,投資重點(diǎn)為軟件工程實(shí)踐和標(biāo)準(zhǔn)、軟件質(zhì)量保證、軟件項(xiàng)目管理、軟件處理、軟件工程技術(shù)研發(fā)等。)對(duì)1300名首席執(zhí)行官進(jìn)行的一項(xiàng)新調(diào)查發(fā)現(xiàn),大約一半的受訪者(51%)表示,他們計(jì)劃構(gòu)建自己的生成式人工智能實(shí)現(xiàn)。這意味著未來還有很多工作要做,但幸運(yùn)的是,公開可用的LLM已經(jīng)奠定了基礎(chǔ)。
“基礎(chǔ)LLMs——比如GPT、Claude(是人工智能初創(chuàng)公司Anthropic 發(fā)布的一款類似ChatGPT的產(chǎn)品。升級(jí)后的Claude 2 模型在編碼、數(shù)學(xué)和推理方面的性能都有所提高。2023年7月,Anthropic 宣布,已發(fā)布最新大語言模型Claude 2。升級(jí)之后,Claude 2的處理能力已經(jīng)提升到了100K個(gè)Token,這意味著它可以處理數(shù)百頁的技術(shù)文檔,甚至是整本書。此外,Claude 2 也開始面向更廣泛的用戶群體免費(fèi)開放,并支持中文使用。)、Llama(Meta AI推出的大語言模型。之后源代碼公開到了 4chan 論壇上,使得任何一個(gè)普通工程師,都有機(jī)會(huì)開發(fā)自己的聊天機(jī)器人產(chǎn)品。只需要一臺(tái)筆記本電腦就能部署,不必像 OpenAI 那樣動(dòng)輒上萬塊 GPU,對(duì)中小開發(fā)者極其友好,且性能也沒差到哪去。泄漏后的幾個(gè)月內(nèi),一位斯坦福大學(xué)的研究人員,只花了不到 600 美元就做出了一個(gè)性能尚可的 AI 聊天機(jī)器人;大洋彼岸的哈工大,數(shù)位研究人員用 Llama 和專業(yè)數(shù)據(jù)做出了一個(gè)醫(yī)學(xué)知識(shí) AI,取名叫“華佗”。圍繞 LLaMA,一個(gè)生態(tài)開始涌現(xiàn)。)——可以最好地被描述為具有世界智慧;可以被視為重新包裝互聯(lián)網(wǎng)知識(shí),”?TCS的首席技術(shù)官兼研究的共同作者Dr. Harrick Vin(哈里克·文博士)告訴筆者,“他們還具有高水平的多模態(tài)理解和生成能力,以及推理能力。”
Vin(文博士)說,構(gòu)建這些基礎(chǔ)模型“既復(fù)雜又昂貴”,他指出,內(nèi)部企業(yè)模型將建立在這些模型的能力之上。“這些模型將利用基礎(chǔ)模型的基本技能,如語言理解和生成、推理和一般知識(shí)。但他們需要將它們擴(kuò)展并專門用于行業(yè)、企業(yè)和活動(dòng)環(huán)境。”
幸運(yùn)的是,“與基礎(chǔ)模型的開發(fā)相比,構(gòu)建這種專門的模型要容易得多,成本也低得多,”Vin(文博士)說,“事實(shí)上,專門化基礎(chǔ)LLM(廣泛的AI模型)以創(chuàng)建特定目的的AI模型和解決方案的相對(duì)容易是AI民主化的主要原因。”
他繼續(xù)說道,這些特定于企業(yè)的LLM,“指的是行業(yè)、企業(yè)和活動(dòng)方面的模型,無論是開源的還是商業(yè)的,”他繼續(xù)說,“我們相信,在未來,一個(gè)成熟的人工智能企業(yè),將有數(shù)百或數(shù)千個(gè)有目的的人工智能模型,所有這些模型都是通過將基礎(chǔ)模型的能力與特定企業(yè)的能力相結(jié)合而構(gòu)建的。”
除了構(gòu)建和實(shí)現(xiàn)模型之外,該業(yè)務(wù)還需要為生成式人工智能做好準(zhǔn)備。超過一半(55%)的人表示,他們正在積極改變業(yè)務(wù)或運(yùn)營模式,或他們的產(chǎn)品和服務(wù),以適應(yīng)人工智能。TCS的調(diào)查顯示,十分之四的高管表示,在他們能夠充分利用人工智能之前,未來他們“需要對(duì)業(yè)務(wù)進(jìn)行很多改變”。
這表明生成式和操作性人工智能的發(fā)展緩慢但勢(shì)頭強(qiáng)勁。在過去的一年里,“每個(gè)企業(yè)都嘗試過生成式人工智能用例——2024年及以后將是關(guān)于價(jià)值擴(kuò)展的,”Vin(文博士)說,“然而,在實(shí)驗(yàn)階段,每個(gè)企業(yè)都意識(shí)到,拓展價(jià)值是具有挑戰(zhàn)性的。”
TCS的調(diào)查顯示,目前只有17%的人正在討論人工智能并為其制定全企業(yè)范圍的計(jì)劃。此外,只有28%的人準(zhǔn)備制定企業(yè)范圍的人工智能戰(zhàn)略,以最大限度地為公司帶來利益。盡管如此,Vin(文博士)還是看到了這項(xiàng)技術(shù)的快速發(fā)展。“在個(gè)別案例或臨時(shí)項(xiàng)目基礎(chǔ)上實(shí)施人工智能解決方案,與構(gòu)建全公司范圍計(jì)劃以建立成熟的人工智能企業(yè)之間存在差異,”Vin(文博士)說,“調(diào)查中相對(duì)較低的數(shù)字是指制定了這種AI企業(yè)級(jí)應(yīng)用戰(zhàn)略。這是意料之中的。”
至于人工智能解決方案的采用,Vin(文博士)繼續(xù)說,“這一數(shù)字相當(dāng)高;59%的企業(yè)職能部門正在進(jìn)行或已完成人工智能實(shí)施,另有34%正在計(jì)劃人工智能實(shí)施。我們正處于技術(shù)成熟度和企業(yè)大規(guī)模采用成熟度的早期階段。大多數(shù)企業(yè)開始將人工智能和生成式人工智能用于特定用例,同時(shí)開始進(jìn)行長期量化收益以及管理相應(yīng)成本和風(fēng)險(xiǎn)的旅程。”
在過去的一年里,“每個(gè)企業(yè)都嘗試了生成式人工智能用例——2024年及以后將涉及擴(kuò)展價(jià)值,”Vin(文博士)說,“然而,在實(shí)驗(yàn)階段,每個(gè)企業(yè)都意識(shí)到,拓展價(jià)值是具有挑戰(zhàn)性的。”
首先,“構(gòu)建有效的人工智能解決方案需要高質(zhì)量的數(shù)據(jù),”他說,“盡管企業(yè)確實(shí)擁有大量數(shù)據(jù),但這些數(shù)據(jù)通常分布在許多相互不一致的孤島上。盡管在過去幾年中,大多數(shù)企業(yè)已經(jīng)開始了整合和數(shù)據(jù)產(chǎn)業(yè)現(xiàn)代化之旅,但這些旅程還遠(yuǎn)未完成。此外,大多數(shù)企業(yè)的數(shù)據(jù)資產(chǎn)遷移到云環(huán)境的工作仍在進(jìn)行中。這使得企業(yè)難以利用云托管的基礎(chǔ)大語言模型(LLM )及其企業(yè)數(shù)據(jù)。”
此外,企業(yè)“需要提高成熟度,主動(dòng)管理數(shù)據(jù)采集、使用、安全和隱私,”Vin(文博士)說,“他們需要掌握確定哪些數(shù)據(jù)可以用于什么目的,即使是無意中,以防止偏見和不公平的做法。這不僅僅是設(shè)計(jì)時(shí)的挑戰(zhàn),也是運(yùn)行時(shí)的挑戰(zhàn)。”需要的是“實(shí)時(shí)檢測(cè)人工智能模型開始偏離預(yù)期行為的緊急情況的系統(tǒng)。”
最后,角色和技能要求的變化速度比公司所能跟上的要快。他說:“隨著人工智能的注入,企業(yè)知識(shí)工作者的角色將從實(shí)干家轉(zhuǎn)變?yōu)闄C(jī)器的培訓(xùn)師和詢問者、機(jī)器工作的審查者,以及批判性思維和創(chuàng)造力的擁有者。”
作者:Joe McKendrick(喬·麥克肯德里克)
譯者:寶藍(lán)