九九爱精品网,亚洲AV 狠狠干

IT領(lǐng)導(dǎo)者看到小型AI模型的巨大商業(yè)潛力

作者：CIO&睿觀來源：CIOCDO 發(fā)布時間：2025年05月09日點(diǎn)擊數(shù)：

小型語言模型（SLM）更適合交付特定于業(yè)務(wù)的AI應(yīng)用，憑借其敏捷、成本效益高、任務(wù)針對性強(qiáng)的特點(diǎn)，可能很快在企業(yè)應(yīng)用方面超過大型語言模型（LLM）。

圖片來源: Rob Schultz / Shutterstock / Unsplash

小型語言模型（SLM）為首席信息官（CIO）提供了更多機(jī)會來開發(fā)專門的、針對特定業(yè)務(wù)的AI應(yīng)用程序，這些應(yīng)用程序比依賴通用大型語言模型（LLM）的應(yīng)用程序運(yùn)行成本更低。

根據(jù)Gartner最近的一份報告，到2027年，更小、特定于上下文的模型將在使用量上超過其對應(yīng)模型，至少是LLM的三倍。該報告還聲稱，對于需要特定業(yè)務(wù)上下文的任務(wù)，LLM的響應(yīng)準(zhǔn)確性會下降。

Gartner分析師、該報告的作者之一Sumit Agarwal表示：“業(yè)務(wù)工作流程中任務(wù)的多樣性以及對更高準(zhǔn)確性的需求，正在推動向針對特定功能或領(lǐng)域數(shù)據(jù)進(jìn)行微調(diào)的專業(yè)模型的轉(zhuǎn)變。這些更小、任務(wù)特定的模型提供更快的響應(yīng)，使用更少的計算能力，從而降低了運(yùn)營和維護(hù)成本。”

印度Wipro的技術(shù)人員Magesh Kasthuri博士表示，他不認(rèn)為LLM比SLM更容易出錯，但同意LLM的幻覺可能是一個問題?！?span style="font-size: 18px; font-family: 微軟雅黑, "Microsoft YaHei"; outline: 0px; font-weight: bold;">對于以領(lǐng)域?yàn)橹行牡慕鉀Q方案，例如在銀行或能源領(lǐng)域，SLM因其敏捷性、成本效益、快速原型設(shè)計和開發(fā)、安全性以及組織數(shù)據(jù)的隱私性而成為首選，” Kasthuri說。

盡管人們的注意力集中在執(zhí)行廣泛功能的通用LLM上，如OpenAI、Gemini、Claude和Grok，但一批小型、專門的模型正作為任務(wù)特定應(yīng)用的成本效益替代方案而興起，包括Meta的Llama 3.1、微軟的Phi和谷歌的Gemma SLM。

例如，谷歌聲稱其最近推出的Gemma 3 SLM僅需一個Nvidia GPU即可運(yùn)行。

一、SLM吸引企業(yè)關(guān)注

Avery Dennison的首席信息官Nicholas Colisto認(rèn)為，代理式AI（agentic AI）的興起是如今CIO對SLM興趣增加的原因之一。

“為生成式AI和代理式AI應(yīng)用選擇合適的基礎(chǔ)模型是CIO和首席AI官（CAIO）如今面臨的更復(fù)雜的決策之一。這不僅僅是關(guān)于性能基準(zhǔn)——而是關(guān)于平衡成本、安全性、可解釋性、可擴(kuò)展性和價值實(shí)現(xiàn)時間，” Colisto說。“格局正在從大型通用模型轉(zhuǎn)向更小、特定領(lǐng)域的模型，這些模型能更好地滿足行業(yè)需求，同時降低風(fēng)險和成本。”

Gartner認(rèn)為，SLM可以增強(qiáng)對敏感業(yè)務(wù)數(shù)據(jù)的控制，同時降低運(yùn)營成本并提高特定領(lǐng)域的性能。Gartner聲稱，這種更具針對性的AI方法——用于客戶服務(wù)自動化、市場趨勢分析、產(chǎn)品創(chuàng)新和情感分析——還提供了隱私和版權(quán)保護(hù)方面的好處。

“這100%準(zhǔn)確，” IBM旗下公司Hakkoda的首席創(chuàng)新官Patrick Buell說?！霸诜阑饓筮\(yùn)行的經(jīng)過調(diào)整的開源小型語言模型解決了許多安全、治理和成本問題?！?/span>

前CIO、Intelagen創(chuàng)始人Tom Richer表示，Gartner的報告與他在實(shí)踐中看到的情況一致。Intelagen是一家開發(fā)和部署專業(yè)垂直AI解決方案的谷歌合作伙伴。

“通用LLM有其用武之地，但對于特定的業(yè)務(wù)問題，更小、經(jīng)過微調(diào)的模型能以更高的效率提供更好的結(jié)果，尤其是在受監(jiān)管的行業(yè)，” Richer說。“推動向SLM轉(zhuǎn)變的主要驅(qū)動力是LLM的幻覺風(fēng)險。通用LLM產(chǎn)生不準(zhǔn)確或無意義信息的傾向，尤其是在處理特定或細(xì)微的業(yè)務(wù)上下文時，是一個重大障礙。”

Richer補(bǔ)充道：“對于準(zhǔn)確性和可靠性至關(guān)重要的企業(yè)應(yīng)用程序來說，這種固有風(fēng)險使得在許多情況下完全依賴通用LLM是行不通的。這是一個根本原因，說明為什么更具針對性、專業(yè)化的方法通常是更審慎、更可靠的解決方案。在醫(yī)療保健用例中不能冒出現(xiàn)幻覺的風(fēng)險?！?/span>

二、流動的未來

去年秋天，微軟宣布利用其Phi SLM產(chǎn)品組合調(diào)整AI模型，以擴(kuò)展其行業(yè)能力，并使企業(yè)能夠更準(zhǔn)確、更有效地滿足定制需求。該公司宣布正在與拜耳、羅克韋爾自動化、西門子數(shù)字工業(yè)軟件等企業(yè)合作伙伴開發(fā)經(jīng)過微調(diào)的模型，這些模型使用特定行業(yè)的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練，以適應(yīng)常見的業(yè)務(wù)用例。

微軟首席執(zhí)行官薩提亞·納德拉最近在東京的一次演示中稱贊了一家大型航空公司開發(fā)的SLM?！敖柚覀兊腟LM Phi，日本航空的空乘人員在文書工作上花費(fèi)的時間更少，而有更多時間陪伴乘客，” 納德拉在LinkedIn上發(fā)帖稱。

微軟還聲稱，其Orca和Orca 2展示了使用合成數(shù)據(jù)對小型語言模型進(jìn)行后訓(xùn)練，使其能夠在專門任務(wù)上表現(xiàn)更好。

谷歌的Gemma 3基于Gemini 2.0，是一系列輕量級、最先進(jìn)的開放模型，旨在快速運(yùn)行，直接在設(shè)備上——從手機(jī)、筆記本電腦到工作站?！癎emma SLM模型利用業(yè)務(wù)領(lǐng)域特定的智能而非廣泛的泛化能力，并針對醫(yī)療保健、法律和金融等行業(yè)量身定制，在各自領(lǐng)域表現(xiàn)優(yōu)于LLM，” 公司向CIO發(fā)布的一份聲明中提到。

Gartner表示，企業(yè)可以通過使用檢索增強(qiáng)生成（RAG）或其他微調(diào)技術(shù)來自定義LLM以完成特定任務(wù)，從而創(chuàng)建專門的模型。但Gartner關(guān)于SLM將在兩年內(nèi)超過LLM的預(yù)測，說明了整個行業(yè)正在加速向使AI更具任務(wù)特定性并遵守治理和監(jiān)管合規(guī)性的趨勢發(fā)展，Cognizant副總裁兼AI與分析全球主管Naveen Sharma說。

“隨著組織尋求更有效地擴(kuò)展AI，更小、任務(wù)特定的模型被證明更快、更高效，并且更容易集成到實(shí)際的業(yè)務(wù)工作流程中，” Sharma說。“在AI模型方面，更小可能更智能，但未來不是非此即彼：而是協(xié)同編排，大型模型提供基礎(chǔ)，更小、有針對性的模型滿足精確的業(yè)務(wù)需求。”

Sharma還表示，SLM開發(fā)的增加并不意味著大型基礎(chǔ)模型會消失。

“如果說有什么不同的話，那就是它們的作用變得更具戰(zhàn)略性。它們不再是最終產(chǎn)品，而是成為起點(diǎn)——提供核心能力，團(tuán)隊可以在此基礎(chǔ)上構(gòu)建、調(diào)整和微調(diào)以適應(yīng)特定的用例，” Sharma補(bǔ)充道?！拔覀冋趶膶⑺鼈冇米魍ㄓ霉ぞ咿D(zhuǎn)變?yōu)閷⑺鼈冇米鞲可矶ㄖ?、更高效、能更好地服?wù)于業(yè)務(wù)的AI系統(tǒng)的核心基礎(chǔ)設(shè)施?！?/span>

作者：Paula Rooney CIO.com的高級撰稿人，專注于CIO如何部署AI、云和數(shù)字技術(shù)來轉(zhuǎn)變其組織。作為一名資深的IT記者，她擁有哥倫比亞大學(xué)新聞學(xué)碩士學(xué)位，最近憑借其企業(yè)新聞報道《AI走向核能？數(shù)據(jù)中心交易表明這不可避免》和案例研究《洛杉磯公設(shè)辯護(hù)人CIO通過數(shù)字化將人們引導(dǎo)至項目而非監(jiān)獄》獲得了ASBPE地區(qū)銀獎和地區(qū)銅獎。

睿觀:小型語言模型 (SLM) 因其在特定業(yè)務(wù)應(yīng)用中的高效、低成本和高準(zhǔn)確性，正迅速獲得企業(yè)青睞，預(yù)計其使用量將很快超過通用的大型語言模型 (LLM)。

（一）論據(jù) (Supporting Arguments):

針對性與準(zhǔn)確性:
SLM 針對特定任務(wù)或領(lǐng)域進(jìn)行訓(xùn)練/微調(diào)，能夠提供比通用 LLM 更準(zhǔn)確、更可靠的結(jié)果，尤其是在需要具體業(yè)務(wù)上下文或處理敏感信息的場景（如醫(yī)療、金融），顯著降低了“幻覺”風(fēng)險。
成本效益與效率:
SLM 的計算需求遠(yuǎn)低于 LLM，運(yùn)行和維護(hù)成本更低，響應(yīng)速度更快，部署更靈活（甚至可以在設(shè)備端運(yùn)行，如 Google Gemma）。
安全性與隱私性:
SLM 可以部署在企業(yè)防火墻內(nèi)，更好地控制敏感業(yè)務(wù)數(shù)據(jù)，滿足隱私保護(hù)和合規(guī)性要求，解決了使用外部通用 LLM 可能帶來的數(shù)據(jù)安全和治理擔(dān)憂。
敏捷性與易用性:
SLM 更小、更專注，使得企業(yè)能夠更快地進(jìn)行原型設(shè)計、開發(fā)和部署針對特定需求的 AI 應(yīng)用，更容易集成到現(xiàn)有工作流程中。

（二）支撐細(xì)節(jié)與例證 (Evidence & Examples):

市場預(yù)測:
Gartner 預(yù)測到 2027 年，SLM 的使用量將至少是 LLM 的三倍。
行業(yè)專家觀點(diǎn):

CIO (Colisto, Richer) 認(rèn)為 SLM 更適合特定行業(yè)需求，平衡了性能、成本、安全和價值實(shí)現(xiàn)時間，并強(qiáng)調(diào)了 LLM 的幻覺風(fēng)險是轉(zhuǎn)向 SLM 的主要驅(qū)動力。
技術(shù)專家 (Kasthuri, Buell) 指出 SLM 在特定領(lǐng)域（銀行、能源）的優(yōu)勢，以及開源 SLM 在安全、治理和成本方面的益處。
分析師 (Agarwal) 指出業(yè)務(wù)任務(wù)多樣性和準(zhǔn)確性需求推動了專業(yè)化模型的發(fā)展。

技術(shù)發(fā)展與應(yīng)用:

各大科技公司 (Meta, Microsoft, Google) 紛紛推出 SLM (Llama 3.1, Phi, Gemma, Orca)。
微軟利用 Phi 為特定行業(yè)（如航空業(yè) JAL）定制解決方案，并探索用合成數(shù)據(jù)訓(xùn)練 Orca。
谷歌的 Gemma 強(qiáng)調(diào)可在單個 GPU 或設(shè)備上運(yùn)行，并針對特定行業(yè)進(jìn)行優(yōu)化。

未來趨勢:
未來并非 SLM 與 LLM 的二選一，而是兩者的協(xié)同編排 (Orchestration)。LLM 可能作為基礎(chǔ)架構(gòu)提供通用能力，而 SLM 則在此基礎(chǔ)上針對具體業(yè)務(wù)需求進(jìn)行構(gòu)建和微調(diào) (Sharma觀點(diǎn))。

上一篇：特朗普著手維持GPU出口限制，試圖保持美…

下一篇：首席信息官（CIO）如何將AI熱潮轉(zhuǎn)化為切…

av婷婷久久网,91视频这里只有精品,91午夜福利一区二区,啊啊啊一区二区久久久,啪啪亚洲视频,www.插插,亚洲婷婷精品二区,开心五月激情射,久青草在在线