玖玖爱伊人99狠狠操,不卡二三区视频

GenAI價格令人震驚，迫使 CIO 尋找解決方案

作者：CIOCDO 來源：福建CIO網(wǎng) 發(fā)布時間：2024年07月19日點擊數(shù)：

“瘋狂”的支出、計算密集型的工作量以及由一家硬件制造商主導(dǎo)的市場，使得IT?領(lǐng)導(dǎo)者開始尋求新技術(shù)和方法來控制生成式人工智能的高成本。利用較小的、特定領(lǐng)域的模型來完成較小范圍的任務(wù)是CIO?控制生成式?AI?成本的另一種方法。

來源：PRESSMASTER / SHUTTERSTOCK

【睿觀：CIO們面臨的GenAI高成本挑戰(zhàn),并探討了多種可能的解決方案和策略,以期在享受新技術(shù)帶來的好處的同時控制成本支出。主要內(nèi)容包括：

1.GenAI實驗的早期賬單遠(yuǎn)高于預(yù)期,一些CIO對此感到震驚。行業(yè)正經(jīng)歷類似于云計算早期"瘋狂消費"的情況。

2.Nvidia在GPU市場占據(jù)主導(dǎo)地位,導(dǎo)致GenAI工作負(fù)載的高額成本。一些CIO正在尋求GPU即服務(wù)等替代方案來控制成本。

3.CIO們可以考慮選擇性部署GenAI、與供應(yīng)商協(xié)商基于輸出質(zhì)量的價格模式、利用開源模型等方式來降低成本。

4.使用較小的領(lǐng)域特定模型,而非大型語言模型,也有助于控制成本。

5.GenAI的高能耗也是一個需要考慮的成本因素。云服務(wù)可能是更節(jié)能的選擇。

6.一些CIO依賴現(xiàn)有的云供應(yīng)商企業(yè)許可協(xié)議來獲得GenAI產(chǎn)品的優(yōu)惠價格?！?/span>

生成式人工智能實驗的早期賬單即將出爐，許多首席信息官發(fā)現(xiàn)這些賬單比他們預(yù)想的要高得多——有些人只能怪自己。

AWS商務(wù)平臺副總裁詹姆斯·格林菲爾德?(James Greenfield)?在?6?月份圣地亞哥舉行的?FinOps X?會議上表示：“我們正在重新回到云計算早期的瘋狂消費模式。”

FinOps基金會執(zhí)行董事?JR Storment?也表達(dá)了同樣的擔(dān)憂。

他說：“這很讓人回想起云計算發(fā)展的早期，當(dāng)時云計算在支出方面是‘免費武器’，每個人都試圖在各地實施云計算——現(xiàn)在是genAI——但幾乎沒有成本控制或治理。”

為了解決這個問題，并期待進(jìn)一步應(yīng)用該技術(shù)，一些首席信息官正在探索一系列技術(shù)和方法來降低生成式人工智能實驗和應(yīng)用的成本。

根據(jù)IDC?的《生成式?AI?定價模型：戰(zhàn)略購買指南》，生成式?AI?的定價格局因“技術(shù)堆棧之間的相互依賴性”而變得復(fù)雜。但是，由于訓(xùn)練和調(diào)整生成式?AI?模型所需的核心基礎(chǔ)設(shè)施“主要由一家公司提供：Nvidia?” ，因此無法避免對生成式?AI?工作負(fù)載征收高額溢價，IDC?指出。

根據(jù)《IDC市場概覽：生成式?AI?基礎(chǔ)模型》，隨著客戶等待更充足的?GPU?供應(yīng)，許多客戶都在尋求?AI?專用服務(wù)提供商以及用于托管?genAI?工作負(fù)載的公有云和私有云產(chǎn)品，包括?Nvidia?的云、AWS Trainium?和?Infertia?以及?Google Tensor?處理器單元。IDC?指出，首席信息官也在向戴爾?Project Helix?或?HPE GreenLake?等?OEM?尋求?AI?支持。

AI服務(wù)提供商有時也被稱為?AI?超大規(guī)模提供商，他們提供?GPU?即服務(wù)，使企業(yè)能夠按需購買?GPU?能力以限制支出。這些?AI?服務(wù)提供商包括?CoreWeave、Equinix、Digital Realty?和?Paperspace，以及?GPU?領(lǐng)導(dǎo)者?Nvidia，以及某種程度上的云超大規(guī)模提供商?Microsoft、Google?和?AWS。

IBM、Oracle、戴爾和惠普企業(yè)也提供GPU?即服務(wù)。

鑒于Nvidia?在?GPU?市場占據(jù)壓倒性主導(dǎo)地位，CIO?們現(xiàn)在正在尋找?GPUaaS?替代方案，而不是等待其他頂級芯片公司趕上來。谷歌合作伙伴和?CIO?咨詢公司?CloudBench?的前任?CIO?兼現(xiàn)任首席執(zhí)行官?Tom Richer?指出，這種按需方法還大大降低了購買處理器的前期成本，并可以根據(jù)工作量進(jìn)行擴(kuò)展或縮減。

Richer表示：“為了滿足?CIO?的需求，供應(yīng)商將提供各種選項，例如具有不同?GPU?配置的虛擬機(jī)實例和折扣計算能力的現(xiàn)貨實例?！彼a(bǔ)充說，容器化的?AI?框架還可以幫助?IT?領(lǐng)導(dǎo)者確保高效的資源利用率?！巴ㄟ^了解他們的選擇并利用?GPU?即服務(wù)，CIO?可以優(yōu)化?genAI?硬件成本并保持創(chuàng)新的處理能力?！?/span>

Richer還認(rèn)為，基于云的?GPU?訪問將幫助企業(yè)釋放?IT?資源以用于其他關(guān)鍵任務(wù)，并“有可能簡化?genAI?項目的開發(fā)流程”。

一、成本方程

但FinOps的?Storment?認(rèn)為，專注于?GPUaaS?和其他基于云的生成式?AI?解決方案的?CIO在成本控制方面可能會面臨類似的問題。

“我們已經(jīng)看到人工智能的成本確實開始對云預(yù)算產(chǎn)生負(fù)面影響，”他說。“最終，許多CIO?仍不清楚他們從人工智能實驗中獲得的價值，因此我們看到人工智能的成本對許多人來說呈螺旋式上升，并引發(fā)了人們對如何通過將?FinOps?中已經(jīng)普遍存在的成本可見性原則應(yīng)用于其他云成本來實現(xiàn)‘人工智能的?FinOps’ 的興趣。”?

波士頓紅襪隊和芬威體育管理公司的首席技術(shù)官布萊恩·希爾德表示，為了控制成本，首席信息官應(yīng)該有選擇地將genAI?解決方案部署到業(yè)務(wù)的關(guān)鍵領(lǐng)域，并實施周到的?genAI?評估流程，以防止重疊和擴(kuò)散。

Shield還希望根據(jù)輸出質(zhì)量協(xié)商成本。“我提議根據(jù)用例向?genAI?供應(yīng)商付費。換句話說，如果工具表現(xiàn)良好，也就是說值得投入生產(chǎn)，我會付給你?X。對于準(zhǔn)確率低于?90%?的解決方案，如果仍有可行的用例，我會付給你?Y，”Shield?說?！叭绻隳芨倪M(jìn)你的工具，我會把你轉(zhuǎn)到收入更高的組。所有供應(yīng)商都猶豫不決，但我仍在與其他供應(yīng)商交談?！?/span>

德勤美國常駐首席信息官、前先鋒集團(tuán)全球首席信息官John Marcante?認(rèn)為，市場創(chuàng)新也將為首席信息官提供幫助。

“生成式AI?的核心在于?GPU。這些芯片正在快速發(fā)展，以滿足實時推理和訓(xùn)練的需求。隨著我們深入研究這一創(chuàng)新周期，預(yù)計?GPU?將變得更加高效、強(qiáng)大和專業(yè)化，以應(yīng)對?AI?工作負(fù)載，”他說。

Marcante表示，GPU?即服務(wù)提供商和平臺也開始為營銷、財務(wù)、法律和客戶流程提供交鑰匙解決方案，以使企業(yè)能夠?qū)Ｗ⒂谄浜诵母偁幜Α?/span>

他指出，一些組織將構(gòu)建自己的生成式AI?平臺，并根據(jù)其獨特需求進(jìn)行量身定制。“這種方法確保了所有權(quán)和定制化，”他說，并指出，以當(dāng)今企業(yè)與云提供商合作的方式與AI?提供商合作是另一種方式。“這些模型將包括從租用?GPU?到全面的全棧?AI?服務(wù)?！?/span>

二、模型發(fā)揮重要作用

大型語言模型（LLM）的快速加速、實驗和發(fā)展也為定制結(jié)果和降低成本提供了見解。

例如，Gartner杰出分析師?Bern Elliott?表示，預(yù)算有限的?CIO?可以通過使用開源模型（如?OpenAI?和?LLaMA）來降低生成式?AI?成本，這些模型可從各種市場訪問并提供多種優(yōu)勢。

“開源是CIO?絕對可以降低成本的一種方式，”他指出，開源模式也是透明的，可以定制?！皩υS多企業(yè)來說，這就是成本所在。如果運營成本低，利潤就會更高?！?/span>

利用較小的、特定領(lǐng)域的模型來完成較小范圍的任務(wù)是CIO?控制生成式?AI?成本的另一種方法。

ServiceNow首席數(shù)字信息官?Chris Bedi?表示：“如果你看看?GPU，就會發(fā)現(xiàn)它們非常昂貴，尤其是當(dāng)你使用大型語言模型時。每個人都在尋找適合自己的正確答案，因為不使用?genAI?的答案并不在考慮范圍內(nèi)。擁有特定領(lǐng)域的模型有助于控制我們的成本，然后我們就可以把這種好處傳遞給我們的客戶。”

RunPod是面向開發(fā)者的?GPU?即服務(wù)，對于大學(xué)和初創(chuàng)公司來說非常劃算。

OpenCV.org?首席執(zhí)行官兼博士?Satya Mallick?表示，OpenCV University?和一家?AI?咨詢公司的學(xué)生使用?RunPod?來訓(xùn)練?AI?模型。

“對于像我們這樣的小型企業(yè)來說，每次只需要使用多個高端GPU?幾天到幾周的時間，RunPod?的解決方案非常劃算，因為我們不需要花費巨額的前期成本來購買?GPU，”Mallick?說道，并指出他的團(tuán)隊也在評估?RunPod?的無服務(wù)器產(chǎn)品。

三、能源消耗：另一個成本考慮因素

首席信息官們還注意到生成式人工智能應(yīng)用的巨大能源消耗，這是另一項需要考慮的巨額成本。

“人工智能是計算密集型的，它正在影響全球的數(shù)據(jù)中心，”Vuori前首席信息官、現(xiàn)任?Schumacher Homes?首席技術(shù)官?Bryan Muehlberger?表示?！俺俏覀冊谌珖秶鷥?nèi)解決能源問題，否則這最終將成為一個更大的問題，成本將轉(zhuǎn)嫁給使用這些服務(wù)的公司?！?span style="font-size: 16px; padding: 0px; outline: 0px; max-width: 100%; font-family: Calibri;">Cloudbench?的?Richer

表示，隨著人工智能的不斷發(fā)展，管理硬件成本和最大化處理能力的創(chuàng)新解決方案可能會出現(xiàn)，并補(bǔ)充說，運行強(qiáng)大的GPU?對環(huán)境的影響將成為一些組織關(guān)注的問題。

Richers表示：“云提供商越來越注重可持續(xù)實踐，與內(nèi)部部署硬件相比，利用基于云的?GPU?可以成為更節(jié)能的解決方案。然而，對于?CIO?來說，在選擇?GPUaaS?解決方案時，仔細(xì)評估成本、性能和數(shù)據(jù)安全之間的權(quán)衡至關(guān)重要?！?/span>

其他CIO?則享受著與微軟、谷歌和?AWS?等主要云和?AI?提供商簽訂的企業(yè)許可協(xié)議所帶來的成本節(jié)約優(yōu)勢。

“我們選擇MS Copilot?是因為它適用范圍廣，我們相信它將滿足我們大約?80%?的使用情況，”美國本田首席信息官?Bob Brizendine?表示?！斑@是我們與微軟現(xiàn)有許可協(xié)議的一部分，使我們能夠有效精簡成本。其他人可能沒有同樣的情況。”

上一篇：當(dāng)今CIO 的新角色——數(shù)字化變革推動者！

下一篇：CIO的工作壓力比以往任何時候都大，但這…

av婷婷久久网,91视频这里只有精品,91午夜福利一区二区,啊啊啊一区二区久久久,啪啪亚洲视频,www.插插,亚洲婷婷精品二区,开心五月激情射,久青草在在线