你不能用過(guò)時(shí)的設(shè)施來(lái)推動(dòng)人工智能。如果沒(méi)有正確的數(shù)據(jù)基礎(chǔ)設(shè)施,即使是最聰明的人工智能也只是猜測(cè)。

圖源:Getty Images
你一定聽(tīng)說(shuō)過(guò)那句老話(huà):你可以把馬領(lǐng)到水邊,但不能強(qiáng)迫它喝水。
同樣的邏輯也可以應(yīng)用于現(xiàn)代企業(yè)對(duì)人工智能的采用:你可以部署人工智能系統(tǒng),但不能強(qiáng)迫它們使用它們需要的有效運(yùn)行的數(shù)據(jù)。
事實(shí)上,如果沒(méi)有現(xiàn)代化的數(shù)據(jù)基礎(chǔ)設(shè)施,你根本無(wú)法很好地將相關(guān)數(shù)據(jù)輸入人工智能系統(tǒng)——這也是為什么數(shù)據(jù)基礎(chǔ)設(shè)施現(xiàn)代化的挑戰(zhàn)是各行業(yè)公司在成功采用人工智能方面面臨的最大障礙之一,根據(jù)數(shù)據(jù)基礎(chǔ)設(shè)施和人工智能采用公司Indicium的一項(xiàng)調(diào)查顯示。
一、人工智能、數(shù)據(jù)和數(shù)據(jù)基礎(chǔ)設(shè)施之間不可分割的聯(lián)系
數(shù)據(jù)長(zhǎng)期以來(lái)對(duì)企業(yè)一直很重要。但在人工智能時(shí)代,它已經(jīng)變得必不可少。
原因很簡(jiǎn)單:沒(méi)有數(shù)據(jù),人工智能工具和服務(wù)幾乎無(wú)法做任何事情。如果無(wú)法解析大量信息,人工智能就無(wú)法識(shí)別相關(guān)趨勢(shì)和模式、總結(jié)信息或生成新內(nèi)容。
需要明確的是,我們這里主要討論的不是用于構(gòu)建人工智能模型的通用數(shù)據(jù),這些模型通常是基于大量公開(kāi)可用的信息預(yù)先訓(xùn)練的。在企業(yè)人工智能采用的背景下,最重要的數(shù)據(jù)類(lèi)型是特定于各個(gè)企業(yè)的信息。將這種數(shù)據(jù)輸入人工智能解決方案的能力,使這些工具能夠提供獨(dú)特的商業(yè)洞察力、加速商業(yè)流程等。如果沒(méi)有訪問(wèn)專(zhuān)有業(yè)務(wù)數(shù)據(jù)的權(quán)限,人工智能工具只能回答一些通用問(wèn)題,而無(wú)法應(yīng)對(duì)特定組織面臨的獨(dú)特挑戰(zhàn)。
確保企業(yè)能夠?qū)?zhuān)有數(shù)據(jù)連接到人工智能系統(tǒng),這就是數(shù)據(jù)基礎(chǔ)設(shè)施的作用所在。數(shù)據(jù)基礎(chǔ)設(shè)施包括組織用于存儲(chǔ)、處理和管理數(shù)據(jù)的工具和技術(shù)。維護(hù)一個(gè)高效、可擴(kuò)展的數(shù)據(jù)基礎(chǔ)設(shè)施——并且能夠容納所有類(lèi)型的數(shù)據(jù),包括結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)源——對(duì)于確保人工智能工具和應(yīng)用程序能夠連接到它們需要運(yùn)行的數(shù)據(jù)至關(guān)重要。
二、過(guò)時(shí)的數(shù)據(jù)基礎(chǔ)設(shè)施如何阻礙人工智能的采用
不幸的是,許多企業(yè)在過(guò)去一二十年間構(gòu)建的數(shù)據(jù)基礎(chǔ)設(shè)施是為人工智能時(shí)代之前設(shè)計(jì)的,它們?cè)跒槿斯ぶ悄芄ぞ吆头?wù)提供動(dòng)力方面存在不足。
傳統(tǒng)的數(shù)據(jù)平臺(tái)通常開(kāi)發(fā)速度較慢,并且缺乏強(qiáng)大的內(nèi)置數(shù)據(jù)治理和質(zhì)量功能。此外,傳統(tǒng)解決方案通常僅設(shè)計(jì)用于支持結(jié)構(gòu)化數(shù)據(jù),這使得將其他類(lèi)型的信息(如文檔和圖像)輸入人工智能系統(tǒng)變得具有挑戰(zhàn)性。而且它們可能涉及多個(gè)不同的部分,阻礙了將數(shù)據(jù)快速且高效地從存儲(chǔ)位置移動(dòng)到需要它的AI工具中的努力。
Indicium的調(diào)查結(jié)果反映了傳統(tǒng)數(shù)據(jù)平臺(tái)在人工智能時(shí)代是不足夠的。當(dāng)被問(wèn)及他們對(duì)使用數(shù)據(jù)與人工智能應(yīng)用程序和系統(tǒng)相結(jié)合的準(zhǔn)備程度時(shí),近一半的受訪者報(bào)告了中等至低水平的信心。
此外,調(diào)查發(fā)現(xiàn),為人工智能工具和應(yīng)用程序準(zhǔn)備數(shù)據(jù)是企業(yè)追求數(shù)據(jù)現(xiàn)代化項(xiàng)目的主要原因——這突顯了組織對(duì)能夠使用一種方法論來(lái)轉(zhuǎn)換數(shù)據(jù)的重視,這種方法論可以提供可擴(kuò)展性,并縮小企業(yè)與其技術(shù)之間的差距。其他目標(biāo),如降低存儲(chǔ)成本、提高數(shù)據(jù)安全性和加快流程速度,與人工智能相比,推動(dòng)數(shù)據(jù)現(xiàn)代化的可能性要小得多。
三、使數(shù)據(jù)基礎(chǔ)設(shè)施與人工智能同步發(fā)展
那么,具體來(lái)說(shuō),企業(yè)實(shí)際上是如何應(yīng)對(duì)數(shù)據(jù)基礎(chǔ)設(shè)施挑戰(zhàn)的呢?調(diào)查提供了一些明確的見(jiàn)解。
常見(jiàn)的策略包括從本地部署遷移到基于云的數(shù)據(jù)平臺(tái),這是80.9%?追求數(shù)據(jù)現(xiàn)代化項(xiàng)目的公司所采取的步驟。部署現(xiàn)代數(shù)據(jù)倉(cāng)庫(kù),如云原生的數(shù)據(jù)倉(cāng)庫(kù)解決方案Snowflake、基于云的大數(shù)據(jù)處理和機(jī)器學(xué)習(xí)平臺(tái)Databricks、亞馬遜云數(shù)據(jù)倉(cāng)庫(kù)服務(wù)Redshift和谷歌云平臺(tái)BigQuery,也是一種廣泛的數(shù)據(jù)現(xiàn)代化策略,得到了53.9%?的調(diào)查受訪者的青睞。
然而,需要注意的是,僅僅部署現(xiàn)代數(shù)據(jù)平臺(tái)只是數(shù)據(jù)現(xiàn)代化的一個(gè)步驟。同樣重要的是建立一個(gè)堅(jiān)實(shí)的數(shù)據(jù)管理方法論和相應(yīng)的組織文化,明確如何借助現(xiàn)代工具滿(mǎn)足數(shù)據(jù)治理、質(zhì)量和可擴(kuò)展性需求。僅僅轉(zhuǎn)向更新的解決方案并不能自動(dòng)實(shí)現(xiàn)數(shù)據(jù)管理流程的現(xiàn)代化。
值得注意的是,實(shí)施專(zhuān)門(mén)針對(duì)人工智能數(shù)據(jù)管理的數(shù)據(jù)平臺(tái),如谷歌云一站式AI平臺(tái)Vertex和亞馬遜云托管服務(wù)平臺(tái)SageMaker,是一種不太常見(jiàn)的做法,只有29.1%?的公司報(bào)告使用了這類(lèi)解決方案。這可能是因?yàn)?,與其單獨(dú)投資人工智能平臺(tái),企業(yè)更傾向于采用全面的數(shù)據(jù)現(xiàn)代化戰(zhàn)略,這不僅可以幫助將數(shù)據(jù)整合到人工智能驅(qū)動(dòng)的應(yīng)用程序和工具中,還可以在整體上增強(qiáng)數(shù)據(jù)治理、安全性和可擴(kuò)展性,而不僅僅是人工智能的背景下。
對(duì)于大多數(shù)企業(yè)來(lái)說(shuō),這些投資都得到了回報(bào)。當(dāng)被問(wèn)及數(shù)據(jù)現(xiàn)代化項(xiàng)目是否讓他們處于更好的位置,使用數(shù)據(jù)與人工智能工具和應(yīng)用程序相結(jié)合時(shí),95.1%?的組織表示確實(shí)如此。
四、數(shù)據(jù)現(xiàn)代化是人工智能成功的關(guān)鍵
核心要點(diǎn)非常明確:構(gòu)建更好的數(shù)據(jù)基礎(chǔ)設(shè)施是充分利用人工智能技術(shù)的一個(gè)重要步驟。企業(yè)可以部署它想要的所有人工智能工具和服務(wù)。但如果沒(méi)有一個(gè)現(xiàn)代化的數(shù)據(jù)平臺(tái)和管理方法論,能夠確保治理、質(zhì)量和速度,它就不太可能獲得太多價(jià)值。
好消息是,對(duì)于那些目前數(shù)據(jù)基礎(chǔ)設(shè)施過(guò)時(shí)的組織來(lái)說(shuō),趕上人工智能時(shí)代遠(yuǎn)非不可能。這只需要在現(xiàn)代化的數(shù)據(jù)平臺(tái)和方法論以及集中化和規(guī)?;髽I(yè)處理信息方式的管理文化上進(jìn)行投資。
作者:Matheus Dellagnelo(馬修斯·德拉涅洛) 譯者:穿山甲
睿觀: 人工智能的成功應(yīng)用極度依賴(lài)高質(zhì)量的專(zhuān)有業(yè)務(wù)數(shù)據(jù),但許多企業(yè)過(guò)時(shí)的數(shù)據(jù)基礎(chǔ)設(shè)施(專(zhuān)為前AI時(shí)代設(shè)計(jì))在處理非結(jié)構(gòu)化數(shù)據(jù)、數(shù)據(jù)治理和敏捷性方面存在嚴(yán)重不足,已成為釋放AI價(jià)值的最大障礙。為此,企業(yè)正積極進(jìn)行數(shù)據(jù)基礎(chǔ)設(shè)施現(xiàn)代化,核心策略包括從本地遷移至云端(80.9%的企業(yè)采取此策略)和部署現(xiàn)代化的云原生數(shù)據(jù)倉(cāng)庫(kù)/平臺(tái)(如Snowflake、Databricks),并輔以相應(yīng)的數(shù)據(jù)管理方法論與文化。這一系列現(xiàn)代化舉措已取得顯著成效(95.1%的企業(yè)表示因此獲益),證明了構(gòu)建一個(gè)高效、可擴(kuò)展、治理良好的現(xiàn)代化數(shù)據(jù)平臺(tái),是確保AI能夠獲取所需“養(yǎng)料”并充分發(fā)揮其潛能的、不可或缺的戰(zhàn)略基石。 你可以把AI領(lǐng)到數(shù)據(jù)旁,但過(guò)時(shí)的數(shù)據(jù)基礎(chǔ)設(shè)施,卻連“水邊”都到不了。金句: