在應用人工智能及其生成子集時,CIO必須預見并處理整合到現(xiàn)有企業(yè)系統(tǒng)的問題。錯誤的數(shù)據(jù)比缺失的數(shù)據(jù)更有害,因為它會導致錯誤的決策。即使在人工智能模型的訓練中,數(shù)據(jù)的正確性和質(zhì)量也是可靠的訓練和結(jié)果的基礎(chǔ)。歐洲AI法案也是如此。首席信息官(CIO)正致力于引導他們的企業(yè)實現(xiàn)成熟的數(shù)據(jù)管理,這可能被證明能夠開啟新的成長機會。人工智能突顯了需要一種策略,該策略包括數(shù)據(jù)質(zhì)量、數(shù)據(jù)所有權(quán)、共享和互操作性等概念:只有這樣,數(shù)據(jù)才能成為為商業(yè)創(chuàng)造價值的資產(chǎn)。
圖片來源:GETTY IMAGES
根據(jù)米蘭理工大學管理學院大數(shù)據(jù)與商業(yè)分析觀察所的數(shù)據(jù),意大利公司在數(shù)據(jù)管理和分析的基礎(chǔ)設(shè)施、軟件和服務方面的投資增長了18%(2023年達到28.5億歐元),但有多少公司達到了數(shù)據(jù)成熟度?
報告中包含的數(shù)據(jù)戰(zhàn)略指數(shù)顯示,只有20%的大型意大利公司擁有先進的數(shù)據(jù)戰(zhàn)略。然而,與2022年的15%相比,這一比例正在增長。此外,考慮到中小型企業(yè),"不成熟"企業(yè)的比例縮小到了32%。這也得益于生成式人工智能的推動:ChatGPT前所未有地突顯了擁有高質(zhì)量數(shù)據(jù)以訓練算法的重要性。換句話說:當CIO努力構(gòu)建堅實的企業(yè)數(shù)據(jù)戰(zhàn)略時,人工智能和生成式AI將挑戰(zhàn)提升到了新的水平。
“通過定義涉及所有企業(yè)參與者和專門的測量工具的過程,來獲得數(shù)據(jù)質(zhì)量,”意大利國家工傷保險機構(gòu)(INAIL)的數(shù)據(jù)與分析辦公室經(jīng)理Francesco Saverio Colasuonno強調(diào)。 “為改善數(shù)據(jù)質(zhì)量采取的后續(xù)行動可以是過程上的,也可以是應用上的,并包括圍繞數(shù)據(jù)治理定義一個組織模型,為各種涉及人員(數(shù)據(jù)科學家、數(shù)據(jù)工程師、數(shù)據(jù)所有者、數(shù)據(jù)管理員等)分配明確的角色和任務。”
這使得有一個責任制度(誰負責數(shù)據(jù)的準確性?)并能正確地指導那些將在數(shù)據(jù)價值鏈中擔任特定角色的人的培訓路徑。
“數(shù)據(jù)是企業(yè)的重要資產(chǎn),其管理和分析是尋找和量化該資產(chǎn)價值的過程。將這些數(shù)據(jù)分析的輸出實施到業(yè)務戰(zhàn)略中,就是激活那個價值。IT是使整個過程成為可能的工具,”擁有包括醫(yī)療和制造業(yè)在內(nèi)的企業(yè)資深經(jīng)理經(jīng)驗的企業(yè)數(shù)據(jù)架構(gòu)師Gianpaolo Vitulano表示。
從這個角度看,根據(jù)Vitulano的說法,ChatGPT的出現(xiàn)引入了一個巨大的機遇:“生成式AI在數(shù)據(jù)治理中有所幫助,并因此激活數(shù)據(jù)的商業(yè)價值?!?/span>
如何衡量數(shù)據(jù)戰(zhàn)略的成熟度 米蘭理工大學的數(shù)據(jù)戰(zhàn)略指數(shù)通過衡量三個領(lǐng)域來評估公司的成熟度:數(shù)據(jù)管理與架構(gòu)(技術(shù)管理、數(shù)據(jù)整合和信息資產(chǎn)治理的手段、技能和過程)、商業(yè)智能與描述性分析(基礎(chǔ)BI工具和技能)以及數(shù)據(jù)科學(基于數(shù)據(jù)分析的預測性和優(yōu)化分析)。
在公共管理領(lǐng)域,有一個額外的參數(shù)進入了數(shù)據(jù)治理:關(guān)于開放數(shù)據(jù)的成熟度。2023年,意大利在歐盟國家排名中位列第7位,成熟度水平為92%(較上一版提高了一個百分點)。這個指數(shù)衡量的是各國推動數(shù)據(jù)公開和重復使用的能力,符合2019/1024 EU關(guān)于開放數(shù)據(jù)的指令。它基于自我評估測試,但可以指示對公共管理機構(gòu)來說,擁有明確的數(shù)據(jù)策略、影響度量和確保質(zhì)量的能力有多么關(guān)鍵。
意大利國家工傷保險機構(gòu)(INAIL)擁有大量的數(shù)據(jù)資產(chǎn),是積極實施數(shù)據(jù)治理的公共機構(gòu)之一,包括互操作性要求、人工智能項目和生成式人工智能實驗。數(shù)據(jù)戰(zhàn)略和數(shù)據(jù)治理不僅基于技術(shù),還涉及文化和組織方面:因此,自2015年以來,國家工傷保險機構(gòu)已將其IT功能轉(zhuǎn)變?yōu)橐粋€真正的數(shù)字部門。
Colasuonno強調(diào),“這證明了技術(shù)創(chuàng)新和組織創(chuàng)新必須并行進行:沒有可以脫離技術(shù)的組織創(chuàng)新項目,同樣,數(shù)字化帶來了對組織和流程的創(chuàng)新?!?/span>
一、數(shù)據(jù)策略的工作組和數(shù)據(jù)生態(tài)系統(tǒng)
意大利國家工傷保險機構(gòu)(INAIL)的數(shù)據(jù)策略在操作上轉(zhuǎn)化為一個由10個“模塊”組成的項目架構(gòu),每個模塊都專注于數(shù)據(jù)策略的一個具體焦點(例如架構(gòu)、數(shù)據(jù)織物(data fabric)、數(shù)據(jù)網(wǎng)格、人工智能、商業(yè)智能、與國家平臺的整合、數(shù)據(jù)質(zhì)量、語義模型等),工作組包括IT和更廣泛的商業(yè)代表。
【睿觀:數(shù)據(jù)策略每個焦點領(lǐng)域都是數(shù)據(jù)策略的關(guān)鍵組成部分,為企業(yè)提供了一套完整的視角和方法來處理和利用數(shù)據(jù)。通過專注于這些領(lǐng)域,企業(yè)能夠更有效地管理其數(shù)據(jù)資產(chǎn),激發(fā)數(shù)據(jù)的潛力,并實現(xiàn)數(shù)據(jù)驅(qū)動的轉(zhuǎn)型。
架構(gòu)關(guān)注于如何構(gòu)建和維護數(shù)據(jù)流通的基礎(chǔ)設(shè)施,包括數(shù)據(jù)的收集、存儲、處理和分發(fā)。理想的架構(gòu)應該支持高效的數(shù)據(jù)訪問和分析,同時確保數(shù)據(jù)的安全性和合規(guī)性。
在數(shù)據(jù)管理領(lǐng)域,“數(shù)據(jù)織物”是一個較新的概念,其核心目的是創(chuàng)建一個靈活、可擴展且高度整合的數(shù)據(jù)管理環(huán)境,支持數(shù)據(jù)的實時訪問和分析。數(shù)據(jù)織物設(shè)計是為了使得數(shù)據(jù)的存儲、管理、分析和使用可以在跨越不同數(shù)據(jù)中心、云服務和邊緣位置的廣泛分布式環(huán)境中無縫進行。數(shù)據(jù)織物的特點包括:
(1)集成性-?它能夠整合來自多個源,包括傳統(tǒng)數(shù)據(jù)庫、現(xiàn)代數(shù)據(jù)湖、實時數(shù)據(jù)流和無結(jié)構(gòu)數(shù)據(jù)的數(shù)據(jù)。
(2)抽象化-?數(shù)據(jù)織物通過提供統(tǒng)一和抽象的數(shù)據(jù)訪問層來隱藏底層的復雜性,使得最終用戶和應用程序不需要關(guān)心數(shù)據(jù)實際存儲的具體技術(shù)細節(jié)。
(3)自服務數(shù)據(jù)訪問-?數(shù)據(jù)織物通常支持數(shù)據(jù)自服務能力,允許業(yè)務用戶直接訪問和分析數(shù)據(jù),而無需經(jīng)過IT部門的復雜查詢和數(shù)據(jù)提取過程。
(4)數(shù)據(jù)治理和安全性-?數(shù)據(jù)織物內(nèi)建了數(shù)據(jù)治理的工具和策略,確保數(shù)據(jù)的質(zhì)量、合規(guī)性和安全性不會因為其高度分散和開放的特性而受到威脅。
(5)支持多種數(shù)據(jù)處理和分析-?數(shù)據(jù)織物支持包括機器學習、流處理和批處理在內(nèi)的多種數(shù)據(jù)處理和分析技術(shù)。
總之,數(shù)據(jù)織物不是一種具體的技術(shù)或產(chǎn)品,而是一個全面的架構(gòu)和方法論,旨在解決現(xiàn)代復雜的數(shù)據(jù)環(huán)境中的挑戰(zhàn)。通過構(gòu)建數(shù)據(jù)織物,組織可以加速數(shù)據(jù)驅(qū)動決策的過程,并更好地實現(xiàn)數(shù)據(jù)資產(chǎn)的價值最大化。
數(shù)據(jù)網(wǎng)格是一種組織模型,旨在結(jié)合分布式的數(shù)據(jù)資源、技術(shù)、應用和人員,支持數(shù)據(jù)的共享和協(xié)作。數(shù)據(jù)網(wǎng)格的目的是去中心化數(shù)據(jù)管理,使數(shù)據(jù)的消費變得更接近數(shù)據(jù)的生產(chǎn)地點,從而提高靈活性和響應速度。
人工智能(AI)關(guān)注于使用算法來模擬人類智能的各個方面,包括學習、推理和自我修正。在數(shù)據(jù)策略中,AI可以用來提高數(shù)據(jù)分析的深度和廣度,自動化決策過程,并通過預測分析來提升業(yè)務的績效。
商業(yè)智能(BI)是用于分析和報告業(yè)務信息的技術(shù)和實踐。它利用數(shù)據(jù)集、軟件和服務來轉(zhuǎn)換數(shù)據(jù)成有價值的洞察,幫助企業(yè)做出更加明智的決策。
與其它平臺的整合涉及將企業(yè)數(shù)據(jù)戰(zhàn)略與外部數(shù)據(jù)平臺和政策框架相對接,以確保合規(guī)性、數(shù)據(jù)共享和互操作性。這種整合可以幫助企業(yè)更有效地參與到外部項目、標準和規(guī)則中去,提高數(shù)據(jù)的社會經(jīng)濟價值。
數(shù)據(jù)質(zhì)量管理是確保企業(yè)數(shù)據(jù)準確、完整、可信和適時的持續(xù)過程。高質(zhì)量的數(shù)據(jù)是進行有效數(shù)據(jù)分析、實現(xiàn)數(shù)據(jù)治理和滿足業(yè)務目標的基礎(chǔ)。
語義模型試圖以一種更貼近人的理解方式來表達數(shù)據(jù)之間的關(guān)系和含義。通過使用諸如本體(ontology)、分類和語義網(wǎng)絡(luò)等工具,語義模型能夠增強數(shù)據(jù)的互操作性和可發(fā)現(xiàn)性,幫助機器和人更好地理解和使用數(shù)據(jù)。】
Colasuonno聲明,“IT認為可以單獨進行數(shù)據(jù)治理項目是一個嚴重的錯誤,沒有業(yè)務部門的寶貴貢獻是不行的。”他說,“今天我們不能再按照孤立的方式前進:IT必須在數(shù)據(jù)管理中讓業(yè)務部門參與進來,讓這些功能在閱讀和分析信息時擁有信任和自主權(quán)。為此,采用一個共同的詞匯是關(guān)鍵,它能夠消除兩個功能之間的距離。”
INAIL在2023年定義的數(shù)據(jù)策略密切關(guān)聯(lián)于開放數(shù)據(jù)的范式。目標是發(fā)展與數(shù)據(jù)管理和使用相關(guān)的技術(shù)和執(zhí)行能力,不僅在機構(gòu)內(nèi)部,也在整個生態(tài)系統(tǒng)內(nèi),因為INAIL必然需要與公共行政的其他部分進行對話。因此,數(shù)據(jù)策略與負責公共行政數(shù)據(jù)治理的實體共享,特別是數(shù)字化轉(zhuǎn)型部、AgID和意大利國家統(tǒng)計局(Istat)。為確?;ゲ僮餍?,采用了公共數(shù)據(jù)平臺,如PDND(國家數(shù)字數(shù)據(jù)平臺)。
Colasuonno解釋說,“在數(shù)字化過程中,‘數(shù)據(jù)利他主義’的概念正在成形:信息不屬于實體,而是屬于公民和企業(yè),它們必須有可能在尊重隱私和安全的前提下使用這些信息。”他說,“另一方面,開放數(shù)據(jù)為公共和私人運營商提供了基于數(shù)據(jù)創(chuàng)造特定服務和產(chǎn)品的可能性,例如,用于預防事故和健康安全的護理管理。”
二、數(shù)據(jù)平臺在關(guān)鍵任務流程中的作用
正確實施數(shù)據(jù)策略使公司能夠訪問對經(jīng)濟結(jié)果有用的知識庫,Enterprise Data Architect Vitulano強調(diào)?!?/span>可以識別減少成本和時間的過程,通過引入更多的自動化,以及最有前景的市場,對于我們想要提供的產(chǎn)品類型,或者那些因為流失風險而需要采取行動的客戶,以及提供最高質(zhì)量原材料的供應商,等等”,Vitulano強調(diào)。
Colasuonno確認數(shù)據(jù)策略“與數(shù)字戰(zhàn)略緊密連接并起功能作用”:它應服務于超越IT實現(xiàn)的目標。這個過程從識別“關(guān)鍵數(shù)據(jù)”開始,即追求數(shù)字化目標的基礎(chǔ)數(shù)據(jù),并繼續(xù)確定要發(fā)展的技術(shù)、文化和組織能力。方法的定義導致了技術(shù)選擇,對于INAIL來說意味著能夠?qū)崿F(xiàn)數(shù)據(jù)虛擬化的可擴展架構(gòu)。事實上,在數(shù)據(jù)策略中,CIO經(jīng)常需要在數(shù)據(jù)的物理映射(復制)和虛擬化數(shù)據(jù)的邏輯架構(gòu)之間做出選擇。
“對我們來說,虛擬化數(shù)據(jù)是有區(qū)別的。我們選擇的數(shù)據(jù)平臺,由Denodo提供,對我們來說是一個重要的技術(shù)使能者,因為它滿足了INAIL快速創(chuàng)建使用來自不同來源數(shù)據(jù)的BI解決方案的需求,并具有動態(tài)特性”,經(jīng)理觀察到。“目前我們正在為一些選定的關(guān)鍵任務應用測試新的數(shù)據(jù)平臺,如自我清算過程。但我們期望將其擴展到其他用例?!?/span>
三、數(shù)據(jù)湖和BI的數(shù)據(jù)增值
許多公共行政部門致力于在它們的數(shù)字化轉(zhuǎn)型中對數(shù)據(jù)進行增值。例如,托斯卡納大區(qū)正在基于一個公共數(shù)據(jù)存儲策略向前推進,該策略由區(qū)域創(chuàng)新、開放政府和開放數(shù)據(jù)增值的規(guī)范路徑所規(guī)定。在2023年,該政府機構(gòu)啟動了一個廣泛的項目,在POR FESR(由歐洲區(qū)域發(fā)展基金支持的區(qū)域操作計劃)21-27的范圍內(nèi),該項目預計整合區(qū)域數(shù)據(jù)湖并在托斯卡納市推廣數(shù)據(jù)驅(qū)動的倡議(預計在2024年6月之前發(fā)出一個價值140萬歐元的通知,隨后托斯卡納大區(qū)將進行其他投資)。整個項目是通過涉及公共服務公司、市鎮(zhèn)和省份,即整個生態(tài)系統(tǒng)的參與設(shè)計的,因為創(chuàng)新之旅的成功與各種參與者一起前進的能力有關(guān)。
“對我們來說,適當?shù)闹卫碇陵P(guān)重要,它具有中長期的視角和短期的操作行動,通過涉及利益相關(guān)者,展示數(shù)據(jù)驅(qū)動方法的用處,并促進數(shù)據(jù)的正確使用以改善過程和領(lǐng)土治理以及支持決策”,斯蒂法諾·丘奧弗(Stefano Ciuoffo)——托斯卡納大區(qū)數(shù)字基礎(chǔ)設(shè)施和創(chuàng)新、合作企業(yè)、簡化政策、制度政策、與地方機構(gòu)的關(guān)系、合法性、安全和移民的區(qū)域評議員強調(diào)。斯蒂法諾·丘奧弗(Stefano Ciuoffo)還強調(diào)開放數(shù)據(jù)在促進透明度和基于開放信息資產(chǎn)的參與過程中的價值:這是另一種方式來吸引生態(tài)系統(tǒng)。
“當然,治理設(shè)計中自帶的是個人數(shù)據(jù)保護和網(wǎng)絡(luò)安全的考慮,”丘奧弗繼續(xù)說。
當前,托斯卡納大區(qū)擁有一個區(qū)域數(shù)據(jù)湖和多個支持主要利益相關(guān)者的商業(yè)智能系統(tǒng)(衛(wèi)生、與地區(qū)農(nóng)業(yè)、內(nèi)部ERP流程、地區(qū)流動性和旅游等相關(guān)的流程)。此外,該區(qū)域正在逐步引入其他數(shù)據(jù)導向技術(shù),如無人機和衛(wèi)星技術(shù)用于測量并豐富區(qū)域信息資產(chǎn),以及作為機器學習形式的人工智能,用于區(qū)域內(nèi)各個區(qū)域的大數(shù)據(jù)上的預測性分析。
“2024年,”丘奧弗宣布,“將是托斯卡納大區(qū)更新其區(qū)域數(shù)據(jù)策略的一年,以進一步推動在所有層面上對數(shù)據(jù)的增值:在地方機構(gòu)、對公民和企業(yè)以及面向區(qū)域管理部門、機構(gòu)和機構(gòu)的方面,也考慮到人工智能所帶來的推動力。”
四、人工智能治理和通用人工智能(AI)
在INAIL,Colasuonno實施的數(shù)據(jù)策略也奠定了技術(shù)和組織基礎(chǔ),使該機構(gòu)能夠通過商業(yè)智能、預測性分析和人工智能增值數(shù)據(jù)。
人工智能治理和通用AI Colasuonno實施的數(shù)據(jù)策略為INAIL奠定了技術(shù)和組織基礎(chǔ),使該機構(gòu)能夠通過商業(yè)智能、預測分析和人工智能來增值數(shù)據(jù)。
INAIL已經(jīng)使用人工智能數(shù)年。例如,它已經(jīng)開發(fā)了基于機器學習的多個項目,旨在提高機構(gòu)流程的效率,包括人事、技術(shù)精算預算、反欺詐和監(jiān)察、法律事務、企業(yè)激勵和醫(yī)療法律領(lǐng)域。特別是在最后一個領(lǐng)域中,機構(gòu)的數(shù)據(jù)財富,包含了數(shù)十年關(guān)于事故、殘疾等級、必要治療等的評估,可以訓練模型來幫助醫(yī)生決定特定事故屬于哪種情況。
目前,該機構(gòu)正在探索將通用AI應用于研究和使用(不僅是INAIL的用戶,還包括企業(yè)和公民)其廣泛的內(nèi)部知識庫,并使用自然語言。
Colasuonno表示:“INAIL意在把握人工智能為公共行政和國家內(nèi)部提供的機會,但始終尊重人的基本權(quán)利。”“人工智能的使用必須是道德的、非歧視性的、符合隱私規(guī)則的,并且要減輕它帶來的風險?!?/span>
他強調(diào)的風險包括:濫用人工智能技術(shù)——因此在預期價值面前花費過多——或相反,最小限度的使用阻礙了從中獲益。通過治理達到兩者之間的平衡——再次——:“人工智能治理”,Colasuonno清楚地表示,“與數(shù)據(jù)治理緊密相連?!?/span>
五、CIO的任務:確保數(shù)據(jù)的質(zhì)量和可用性
Vitulano確認:CIO承擔著確立確保數(shù)據(jù)質(zhì)量的精確治理的戰(zhàn)略角色。
“在許多情況下,除非是技術(shù)用戶,否則不能提供原始數(shù)據(jù)給業(yè)務部門,因為它可能是無法識別的,而且,最重要的是,它會因經(jīng)過不同處理以供使用而被修改。因此,需要對其進行篩選和認證,以便最終用戶有信心使用的數(shù)據(jù)是正確的、可靠的和可識別的。這是工業(yè)數(shù)字化進程中非常重要的一個方面,作為IT經(jīng)理,我總是依靠自動化工具來處理輸入——否則,這是一個容易出錯、成本高昂且沒有附加值的任務——并使用清晰的命名,以便從詞匯表到商業(yè)智能再到分析產(chǎn)品上的可視化?!?/span>
這些最后的工具是商業(yè)部門人員進行交互的設(shè)備:最終產(chǎn)品的質(zhì)量和可接近性對決策過程至關(guān)重要,技術(shù)團隊有責任實施適當?shù)慕鉀Q方案以確保數(shù)據(jù)的可靠性。
在擔任CIO的經(jīng)歷中,Vitulano一直致力于數(shù)據(jù)命名,例如他在國際醫(yī)療行業(yè)公司擔任經(jīng)理時期。在這里,精確地管理數(shù)據(jù)過程對于一方面確保數(shù)據(jù)安全(由于分類為個人和敏感數(shù)據(jù))和另一方面確保IT解決方案在業(yè)務價值交付過程中正常工作至關(guān)重要,即能夠與各種內(nèi)外部使用者中心共享數(shù)據(jù)。
六、GPT:讓數(shù)據(jù)治理更高效??
然而,今天,隨著GPT模型的出現(xiàn),數(shù)據(jù)治理可能達到新的效率水平。Vitulano解釋:“生成式人工智能可以提供一個框架來管理和組織數(shù)據(jù),并確保它們是準確的、一致的和安全的。” “GPT模型可以作為數(shù)據(jù)目錄解決方案的有價值補充,用于映射和分類數(shù)據(jù)資產(chǎn),激活和監(jiān)控數(shù)據(jù)治理,提高基于數(shù)據(jù)的決策質(zhì)量,并確保更好的合規(guī)性?!?/span>
對于數(shù)據(jù)治理的另一個GPT用途可能是以支持用戶在數(shù)據(jù)查找和與授權(quán)方共享數(shù)據(jù)方面的形式。Vitulano舉了一個例子:CIO可能已經(jīng)構(gòu)建了一個分析產(chǎn)品,而通用AI將有能力通過迅速獲取信息和分析來增加它的價值,或者甚至提供關(guān)于如何將某些信息,如KPI,為另一個項目重復使用的建議。
Vitulano聲明:“GPT有潛力在使用數(shù)據(jù)資產(chǎn)方面提高效率,避免重復,并加快獲取信息和決策的速度?!?“這樣,間接地,GPT可能促進以數(shù)據(jù)為驅(qū)動的文化,其中每個人都有助于公司的成功?!?/span>
但是,永遠不要缺少治理:在應用人工智能及其生成子集時,CIO必須預見并處理整合到現(xiàn)有企業(yè)系統(tǒng)的問題,以及使用的數(shù)據(jù)的正確性問題,這些數(shù)據(jù)用于訓練人工智能系統(tǒng),取決于業(yè)務對提供信息的信任。
意大利國家工傷保險機構(gòu)(INAIL)的數(shù)據(jù)與分析辦公室經(jīng)理Colasuonno總結(jié)說:“錯誤的數(shù)據(jù)比缺失的數(shù)據(jù)更有害,因為它會導致錯誤的決策。即使在人工智能模型的訓練中,數(shù)據(jù)的正確性和質(zhì)量也是可靠的訓練和結(jié)果的基礎(chǔ)。歐洲AI法案也是如此。”