av婷婷久久网,91视频这里只有精品,91午夜福利一区二区,啊啊啊一区二区久久久,啪啪亚洲视频,www.插插,亚洲婷婷精品二区,开心五月激情射,久青草在在线

你好,歡迎您來到福建信息主管(CIO)網(wǎng)! 設(shè)為首頁|加入收藏|會員中心
您現(xiàn)在的位置:>> 新聞資訊 >>
IT領(lǐng)導(dǎo)者看到小型AI模型的巨大商業(yè)潛力
作者:CIO&睿觀 來源:CIOCDO 發(fā)布時間:2025年05月09日 點(diǎn)擊數(shù):

小型語言模型(SLM)更適合交付特定于業(yè)務(wù)的AI應(yīng)用,憑借其敏捷、成本效益高、任務(wù)針對性強(qiáng)的特點(diǎn),可能很快在企業(yè)應(yīng)用方面超過大型語言模型(LLM)。

圖片來源: Rob Schultz / Shutterstock / Unsplash

小型語言模型(SLM)為首席信息官(CIO)提供了更多機(jī)會來開發(fā)專門的、針對特定業(yè)務(wù)的AI應(yīng)用程序,這些應(yīng)用程序比依賴通用大型語言模型(LLM)的應(yīng)用程序運(yùn)行成本更低。

根據(jù)Gartner最近的一份報告,到2027年,更小、特定于上下文的模型將在使用量上超過其對應(yīng)模型,至少是LLM的三倍。該報告還聲稱,對于需要特定業(yè)務(wù)上下文的任務(wù),LLM的響應(yīng)準(zhǔn)確性會下降。

Gartner分析師、該報告的作者之一Sumit Agarwal表示:“業(yè)務(wù)工作流程中任務(wù)的多樣性以及對更高準(zhǔn)確性的需求,正在推動向針對特定功能或領(lǐng)域數(shù)據(jù)進(jìn)行微調(diào)的專業(yè)模型的轉(zhuǎn)變。這些更小、任務(wù)特定的模型提供更快的響應(yīng),使用更少的計算能力,從而降低了運(yùn)營和維護(hù)成本。

印度Wipro的技術(shù)人員Magesh Kasthuri博士表示,他不認(rèn)為LLM比SLM更容易出錯,但同意LLM的幻覺可能是一個問題?!?span style="font-size: 18px; font-family: 微軟雅黑, "Microsoft YaHei"; outline: 0px; font-weight: bold;">對于以領(lǐng)域?yàn)橹行牡慕鉀Q方案,例如在銀行或能源領(lǐng)域,SLM因其敏捷性、成本效益、快速原型設(shè)計和開發(fā)、安全性以及組織數(shù)據(jù)的隱私性而成為首選,” Kasthuri說。

盡管人們的注意力集中在執(zhí)行廣泛功能的通用LLM上,如OpenAI、Gemini、Claude和Grok,但一批小型、專門的模型正作為任務(wù)特定應(yīng)用的成本效益替代方案而興起,包括Meta的Llama 3.1、微軟的Phi和谷歌的Gemma SLM。

例如,谷歌聲稱其最近推出的Gemma 3 SLM僅需一個Nvidia GPU即可運(yùn)行。

一、SLM吸引企業(yè)關(guān)注

Avery Dennison的首席信息官Nicholas Colisto認(rèn)為,代理式AI(agentic AI)的興起是如今CIO對SLM興趣增加的原因之一。

為生成式AI和代理式AI應(yīng)用選擇合適的基礎(chǔ)模型是CIO和首席AI官(CAIO)如今面臨的更復(fù)雜的決策之一。這不僅僅是關(guān)于性能基準(zhǔn)——而是關(guān)于平衡成本、安全性、可解釋性、可擴(kuò)展性和價值實(shí)現(xiàn)時間,” Colisto說。“格局正在從大型通用模型轉(zhuǎn)向更小、特定領(lǐng)域的模型,這些模型能更好地滿足行業(yè)需求,同時降低風(fēng)險和成本。”

Gartner認(rèn)為,SLM可以增強(qiáng)對敏感業(yè)務(wù)數(shù)據(jù)的控制,同時降低運(yùn)營成本并提高特定領(lǐng)域的性能。Gartner聲稱,這種更具針對性的AI方法——用于客戶服務(wù)自動化、市場趨勢分析、產(chǎn)品創(chuàng)新和情感分析——還提供了隱私和版權(quán)保護(hù)方面的好處。

“這100%準(zhǔn)確,” IBM旗下公司Hakkoda的首席創(chuàng)新官Patrick Buell說?!霸诜阑饓筮\(yùn)行的經(jīng)過調(diào)整的開源小型語言模型解決了許多安全、治理和成本問題?!?/span>

前CIO、Intelagen創(chuàng)始人Tom Richer表示,Gartner的報告與他在實(shí)踐中看到的情況一致。Intelagen是一家開發(fā)和部署專業(yè)垂直AI解決方案的谷歌合作伙伴。

“通用LLM有其用武之地,但對于特定的業(yè)務(wù)問題,更小、經(jīng)過微調(diào)的模型能以更高的效率提供更好的結(jié)果,尤其是在受監(jiān)管的行業(yè),” Richer說。“推動向SLM轉(zhuǎn)變的主要驅(qū)動力是LLM的幻覺風(fēng)險。通用LLM產(chǎn)生不準(zhǔn)確或無意義信息的傾向,尤其是在處理特定或細(xì)微的業(yè)務(wù)上下文時,是一個重大障礙。

Richer補(bǔ)充道:“對于準(zhǔn)確性和可靠性至關(guān)重要的企業(yè)應(yīng)用程序來說,這種固有風(fēng)險使得在許多情況下完全依賴通用LLM是行不通的。這是一個根本原因,說明為什么更具針對性、專業(yè)化的方法通常是更審慎、更可靠的解決方案。在醫(yī)療保健用例中不能冒出現(xiàn)幻覺的風(fēng)險?!?/span>

二、流動的未來

去年秋天,微軟宣布利用其Phi SLM產(chǎn)品組合調(diào)整AI模型,以擴(kuò)展其行業(yè)能力,并使企業(yè)能夠更準(zhǔn)確、更有效地滿足定制需求。該公司宣布正在與拜耳、羅克韋爾自動化、西門子數(shù)字工業(yè)軟件等企業(yè)合作伙伴開發(fā)經(jīng)過微調(diào)的模型,這些模型使用特定行業(yè)的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,以適應(yīng)常見的業(yè)務(wù)用例。

微軟首席執(zhí)行官薩提亞·納德拉最近在東京的一次演示中稱贊了一家大型航空公司開發(fā)的SLM?!敖柚覀兊腟LM Phi,日本航空的空乘人員在文書工作上花費(fèi)的時間更少,而有更多時間陪伴乘客,” 納德拉在LinkedIn上發(fā)帖稱。

微軟還聲稱,其Orca和Orca 2展示了使用合成數(shù)據(jù)對小型語言模型進(jìn)行后訓(xùn)練,使其能夠在專門任務(wù)上表現(xiàn)更好。

谷歌的Gemma 3基于Gemini 2.0,是一系列輕量級、最先進(jìn)的開放模型,旨在快速運(yùn)行,直接在設(shè)備上——從手機(jī)、筆記本電腦到工作站?!癎emma SLM模型利用業(yè)務(wù)領(lǐng)域特定的智能而非廣泛的泛化能力,并針對醫(yī)療保健、法律和金融等行業(yè)量身定制,在各自領(lǐng)域表現(xiàn)優(yōu)于LLM,” 公司向CIO發(fā)布的一份聲明中提到。

Gartner表示,企業(yè)可以通過使用檢索增強(qiáng)生成(RAG)或其他微調(diào)技術(shù)來自定義LLM以完成特定任務(wù),從而創(chuàng)建專門的模型。但Gartner關(guān)于SLM將在兩年內(nèi)超過LLM的預(yù)測,說明了整個行業(yè)正在加速向使AI更具任務(wù)特定性并遵守治理和監(jiān)管合規(guī)性的趨勢發(fā)展,Cognizant副總裁兼AI與分析全球主管Naveen Sharma說。

“隨著組織尋求更有效地擴(kuò)展AI,更小、任務(wù)特定的模型被證明更快、更高效,并且更容易集成到實(shí)際的業(yè)務(wù)工作流程中,” Sharma說。“在AI模型方面,更小可能更智能,但未來不是非此即彼:而是協(xié)同編排,大型模型提供基礎(chǔ),更小、有針對性的模型滿足精確的業(yè)務(wù)需求。”

Sharma還表示,SLM開發(fā)的增加并不意味著大型基礎(chǔ)模型會消失。

“如果說有什么不同的話,那就是它們的作用變得更具戰(zhàn)略性。它們不再是最終產(chǎn)品,而是成為起點(diǎn)——提供核心能力,團(tuán)隊可以在此基礎(chǔ)上構(gòu)建、調(diào)整和微調(diào)以適應(yīng)特定的用例,” Sharma補(bǔ)充道?!拔覀冋趶膶⑺鼈冇米魍ㄓ霉ぞ咿D(zhuǎn)變?yōu)閷⑺鼈冇米鞲可矶ㄖ?、更高效、能更好地服?wù)于業(yè)務(wù)的AI系統(tǒng)的核心基礎(chǔ)設(shè)施?!?/span>

作者:Paula Rooney CIO.com的高級撰稿人,專注于CIO如何部署AI、云和數(shù)字技術(shù)來轉(zhuǎn)變其組織。作為一名資深的IT記者,她擁有哥倫比亞大學(xué)新聞學(xué)碩士學(xué)位,最近憑借其企業(yè)新聞報道《AI走向核能?數(shù)據(jù)中心交易表明這不可避免》和案例研究《洛杉磯公設(shè)辯護(hù)人CIO通過數(shù)字化將人們引導(dǎo)至項目而非監(jiān)獄》獲得了ASBPE地區(qū)銀獎和地區(qū)銅獎。


睿觀:小型語言模型 (SLM) 因其在特定業(yè)務(wù)應(yīng)用中的高效、低成本和高準(zhǔn)確性,正迅速獲得企業(yè)青睞,預(yù)計其使用量將很快超過通用的大型語言模型 (LLM)。

(一)論據(jù) (Supporting Arguments):

  1. 針對性與準(zhǔn)確性:

    SLM 針對特定任務(wù)或領(lǐng)域進(jìn)行訓(xùn)練/微調(diào),能夠提供比通用 LLM 更準(zhǔn)確、更可靠的結(jié)果,尤其是在需要具體業(yè)務(wù)上下文或處理敏感信息的場景(如醫(yī)療、金融),顯著降低了“幻覺”風(fēng)險。

  2. 成本效益與效率:

    SLM 的計算需求遠(yuǎn)低于 LLM,運(yùn)行和維護(hù)成本更低,響應(yīng)速度更快,部署更靈活(甚至可以在設(shè)備端運(yùn)行,如 Google Gemma)。

  3. 安全性與隱私性:

    SLM 可以部署在企業(yè)防火墻內(nèi),更好地控制敏感業(yè)務(wù)數(shù)據(jù),滿足隱私保護(hù)和合規(guī)性要求,解決了使用外部通用 LLM 可能帶來的數(shù)據(jù)安全和治理擔(dān)憂。

  4. 敏捷性與易用性:

    SLM 更小、更專注,使得企業(yè)能夠更快地進(jìn)行原型設(shè)計、開發(fā)和部署針對特定需求的 AI 應(yīng)用,更容易集成到現(xiàn)有工作流程中。

(二)支撐細(xì)節(jié)與例證 (Evidence & Examples):

  • 市場預(yù)測:

    Gartner 預(yù)測到 2027 年,SLM 的使用量將至少是 LLM 的三倍。

  • 行業(yè)專家觀點(diǎn):

    • CIO (Colisto, Richer) 認(rèn)為 SLM 更適合特定行業(yè)需求,平衡了性能、成本、安全和價值實(shí)現(xiàn)時間,并強(qiáng)調(diào)了 LLM 的幻覺風(fēng)險是轉(zhuǎn)向 SLM 的主要驅(qū)動力。

    • 技術(shù)專家 (Kasthuri, Buell) 指出 SLM 在特定領(lǐng)域(銀行、能源)的優(yōu)勢,以及開源 SLM 在安全、治理和成本方面的益處。

    • 分析師 (Agarwal) 指出業(yè)務(wù)任務(wù)多樣性和準(zhǔn)確性需求推動了專業(yè)化模型的發(fā)展。

  • 技術(shù)發(fā)展與應(yīng)用:

    • 各大科技公司 (Meta, Microsoft, Google) 紛紛推出 SLM (Llama 3.1, Phi, Gemma, Orca)。

    • 微軟利用 Phi 為特定行業(yè)(如航空業(yè) JAL)定制解決方案,并探索用合成數(shù)據(jù)訓(xùn)練 Orca。

    • 谷歌的 Gemma 強(qiáng)調(diào)可在單個 GPU 或設(shè)備上運(yùn)行,并針對特定行業(yè)進(jìn)行優(yōu)化。

  • 未來趨勢:

    未來并非 SLM 與 LLM 的二選一,而是兩者的協(xié)同編排 (Orchestration)。LLM 可能作為基礎(chǔ)架構(gòu)提供通用能力,而 SLM 則在此基礎(chǔ)上針對具體業(yè)務(wù)需求進(jìn)行構(gòu)建和微調(diào) (Sharma觀點(diǎn))。

敦化市| 黑水县| 越西县| 平果县| 宁武县| 绵阳市| 邳州市| 万宁市| 寿光市| 林周县| 静乐县| 永顺县| 宜君县| 瓦房店市| 海丰县| 苗栗县| 迁安市| 夏邑县| 武宣县| 栖霞市| 安新县| 雷山县| 黑山县| 南岸区| 平陆县| 江西省| 南投县| 英山县| 留坝县| 永新县| 武夷山市| 博白县| 大埔区| 河津市| 贡嘎县| 洛南县| 襄樊市| 民丰县| 宜宾县| 射阳县| 三穗县|