從數(shù)據(jù)分類錯誤到在缺乏充分質(zhì)量保證的情況下使用人工智能,那些希望充分利用數(shù)據(jù)驅(qū)動決策的IT領(lǐng)導(dǎo)者有諸多擔(dān)憂。

圖源:Rob Schultz / Shutterstock
CIO們面臨著提供預(yù)測分析以及利用人工智能代理對員工隊伍進行轉(zhuǎn)型的壓力。然而,數(shù)據(jù)治理、數(shù)據(jù)運營和數(shù)據(jù)安全方面的投資——這些一直都很重要——卻常常讓位于業(yè)務(wù)驅(qū)動的舉措,導(dǎo)致如今人工智能的成功仍懸而未決。
為了彌合這一差距,并確保數(shù)據(jù)供應(yīng)鏈得到足夠的高層關(guān)注,CIO們聘請或與首席數(shù)據(jù)官展開合作,委托他們處理數(shù)據(jù)債務(wù)、實現(xiàn)數(shù)據(jù)管道自動化,并轉(zhuǎn)變?yōu)橐环N主動的數(shù)據(jù)治理模式,重點關(guān)注健康指標(biāo)、數(shù)據(jù)質(zhì)量和數(shù)據(jù)模型的互操作性。
但CIO們在過多地委托數(shù)據(jù)治理職責(zé)或只是旁觀數(shù)據(jù)運營改進時必須謹慎。那些正在重新思考其數(shù)字轉(zhuǎn)型戰(zhàn)略,并希望從人工智能投資中實現(xiàn)商業(yè)價值的首席信息官們,需要更多地關(guān)注那些可能破壞這些目標(biāo)的數(shù)據(jù)風(fēng)險。一種可行的辦法是向IT主管詢問有關(guān)數(shù)據(jù)管理實踐的問題,以此來判斷哪些方面需要更多的領(lǐng)導(dǎo)關(guān)注。
筆者之前曾撰文探討過CIO們應(yīng)高度警惕的IT風(fēng)險以及錯過的生成式人工智能機會。以下是CIO們應(yīng)該審視的六大數(shù)據(jù)風(fēng)險,并確保他們的團隊制定了補救策略,理想情況下將這些風(fēng)險轉(zhuǎn)化為戰(zhàn)略機遇。
一、錯誤分類的數(shù)據(jù)和不參與的數(shù)據(jù)所有者
隨便問一位數(shù)據(jù)治理負責(zé)人,他們在提高數(shù)據(jù)質(zhì)量和遵守法規(guī)方面面臨的最大難題是什么。排在前列的問題中必然會有確定數(shù)據(jù)所有者,并讓他們參與制定和遵守數(shù)據(jù)政策。如果數(shù)據(jù)所有者不積極參與,數(shù)據(jù)可能得不到分類就被用于人工智能,這可能會違反數(shù)據(jù)隱私規(guī)則和其他法規(guī)。
在人工智能時代,未分類的數(shù)據(jù)還帶來了第二個挑戰(zhàn):數(shù)據(jù)科學(xué)家是應(yīng)該在不符合要求的情況下將這些未分類的數(shù)據(jù)集用于人工智能模型,還是數(shù)據(jù)治理部門應(yīng)該禁止任何人使用這些數(shù)據(jù)?
Netwoven的首席執(zhí)行官Niraj Tenany(尼拉杰·特南尼)表示:“企業(yè)必須對其內(nèi)容進行分類,以便安全基礎(chǔ)設(shè)施的各個組件能夠采取適當(dāng)措施。手動分類費力,自動分類又存在大量誤判,因此找到恰當(dāng)?shù)钠胶鈱Τ晒χ陵P(guān)重要?!?/span>
參與數(shù)據(jù)治理舉措的CIO往往更能有效地說服部門主管指定數(shù)據(jù)所有者。如今對公民數(shù)據(jù)科學(xué)能力的需求巨大,而且領(lǐng)導(dǎo)者們渴望獲得人工智能帶來的商業(yè)優(yōu)勢,因此他們不會拒絕承擔(dān)責(zé)任。此外,一旦這些數(shù)據(jù)所有者參與進來,就有更多機會讓他們參與人工智能治理,并合作試點人工智能智能體。
二、人工智能暴露的知識產(chǎn)權(quán)問題
許多CIO擔(dān)心員工使用未經(jīng)批準(zhǔn)的公共LLMs(大語言模型)和試用其他生成式人工智能工具時出現(xiàn)的影子人工智能問題。CIO們應(yīng)該高度警惕因使用人工智能工具而導(dǎo)致的數(shù)據(jù)分類錯誤和知識產(chǎn)權(quán)泄露風(fēng)險。
一個擔(dān)憂是員工在人工智能提示中使用數(shù)據(jù)、代碼、品牌指南、合同以及敏感文件的部分內(nèi)容。另一個擔(dān)憂是數(shù)據(jù)科學(xué)家在未經(jīng)必要批準(zhǔn)和保護措施的情況下,將知識產(chǎn)權(quán)納入人工智能模型,包括用于大語言模型的RAG(檢索增強生成)以及人工智能智能體的數(shù)據(jù)。
Rimini Street全球首席信息官Joe Locandro(喬·洛坎德羅)表示:“數(shù)據(jù)是公司最有價值的資產(chǎn)之一,必須加以保護。CIO們應(yīng)該警惕員工對數(shù)據(jù)的不當(dāng)處理、人工智能工具的濫用以及不良的網(wǎng)絡(luò)安全習(xí)慣。優(yōu)先開展員工教育、在核心系統(tǒng)中實施數(shù)據(jù)掩碼處理,以及定期進行數(shù)據(jù)安全審計,這些都是保護敏感信息的關(guān)鍵步驟?!?/span>
The Modern Data Company的首席執(zhí)行官Srujan Akula(斯魯詹·阿庫拉)補充道:“營銷團隊在不告知任何人的情況下使用ChatGPT,數(shù)據(jù)科學(xué)家利用他們能獲取的任何信息構(gòu)建模型,突然間敏感的客戶數(shù)據(jù)可能就被輸入到了公共人工智能工具中。這給CIO們帶來了風(fēng)險,包括數(shù)據(jù)泄露和合規(guī)問題,而這些問題可以通過明確、實用的政策和安全的內(nèi)部替代方案來解決?!?/span>
為了降低風(fēng)險,Akula(阿庫拉)建議CIO們從經(jīng)過精心整理、可靠的數(shù)據(jù)集創(chuàng)建數(shù)據(jù)產(chǎn)品,并明確其所有權(quán)和治理規(guī)則。
CIO還可以通過發(fā)起數(shù)據(jù)素養(yǎng)項目和促進開放式創(chuàng)新(任何員工都能提交想法),將這種風(fēng)險轉(zhuǎn)化為優(yōu)勢。這些項目相結(jié)合,既鼓勵了學(xué)習(xí)和解決問題,又能讓組織更多地了解一線員工的創(chuàng)新舉措。
三、第三方數(shù)據(jù)源
預(yù)計2025年美國企業(yè)在營銷數(shù)據(jù)方面的支出將達到261億美元。這些數(shù)據(jù)通常用于客戶細分、個性化營銷活動以及優(yōu)化歸因分析。
盡管要確保內(nèi)部數(shù)據(jù)管理符合監(jiān)管要求和數(shù)據(jù)治理政策并非易事,但追蹤第三方數(shù)據(jù)來源的合規(guī)性同樣具有挑戰(zhàn)性。
SOAX產(chǎn)品負責(zé)人Luis Lacambra(路易斯·拉坎布拉)表示:“最容易被忽視的風(fēng)險之一,就是在未核實數(shù)據(jù)來源方式的情況下,依賴第三方數(shù)據(jù)渠道或數(shù)據(jù)增強服務(wù)。如果這些數(shù)據(jù)是通過不可靠或不合規(guī)的方法從公共來源抓取或匯總而來,那么你的組織可能會面臨監(jiān)管審查,或出現(xiàn)運營盲點?!?/span>
審查第三方數(shù)據(jù)合規(guī)性應(yīng)該是由首席數(shù)據(jù)官負責(zé)、明確傳達且不容商量的數(shù)據(jù)治理事項。
CIO可以采用另一種方法來應(yīng)對第三方數(shù)據(jù)風(fēng)險。公司采購并整合了許多數(shù)據(jù)來源,但有些未被使用,有些與其他數(shù)據(jù)來源提供重復(fù)信息,或者只能帶來微不足道的商業(yè)價值。希望削減成本的CIO們應(yīng)該對第三方數(shù)據(jù)來源進行成本效益審計,評估其利用率,并量化風(fēng)險。這樣就有機會通過剔除低價值、高風(fēng)險的數(shù)據(jù)來源來降低成本。
四、數(shù)據(jù)管道可觀測性差
大多數(shù)組織在投資強大的數(shù)據(jù)集成和數(shù)據(jù)渠道之前,會先投資終端用戶分析工具,如數(shù)據(jù)分析平臺和文檔處理工具。由于各部門在決策時越來越依賴實時數(shù)據(jù),數(shù)據(jù)渠道的可靠性和性能可能會成為運營上的噩夢,尤其是當(dāng)數(shù)據(jù)管理員必須經(jīng)常處理數(shù)據(jù)問題,或者滯后的數(shù)據(jù)導(dǎo)致錯誤決策時。
RecordPoint首席技術(shù)官Josh Mason(喬?!っ飞┍硎荆骸癈IO們必須時刻敏銳地意識到那些威脅組織完整性、安全性和決策有效性的數(shù)據(jù)相關(guān)風(fēng)險。其中一個關(guān)鍵領(lǐng)域是對數(shù)據(jù)管道和使用模式的可見性有限,可觀測性不足可能會掩蓋諸如延遲、數(shù)據(jù)漂移、管道故障以及敏感數(shù)據(jù)的存在和位置等潛在問題?!?/span>
數(shù)據(jù)運營中的可觀測性包括監(jiān)控數(shù)據(jù)管道、自動響應(yīng)以及跟蹤性能。數(shù)據(jù)運營指標(biāo)包括管道可靠性、自動化率、異常率和處理吞吐量。
對于整合了眾多數(shù)據(jù)來源并使用數(shù)據(jù)架構(gòu)實現(xiàn)集中訪問的CIO們來說,減少數(shù)據(jù)運營事件可以節(jié)省成本。但更重要的是,不可靠的數(shù)據(jù)集成會削弱信任,這可能會使部門領(lǐng)導(dǎo)減緩對更多人工智能和數(shù)據(jù)驅(qū)動實踐的投資步伐。
五、數(shù)據(jù)質(zhì)量差距
長期以來,CIO們一直在努力提高數(shù)據(jù)質(zhì)量,他們指定數(shù)據(jù)管理員、實現(xiàn)數(shù)據(jù)清理流程自動化,并衡量數(shù)據(jù)健康狀況。但這些工作大多集中在ERP(企業(yè)資源規(guī)劃)系統(tǒng)、CRM(客戶關(guān)系管理)系統(tǒng)和數(shù)據(jù)倉庫中的結(jié)構(gòu)化數(shù)據(jù)來源上。隨著RAG(檢索增強生成)技術(shù)和人工智能智能體利用非結(jié)構(gòu)化數(shù)據(jù)來源和文檔庫來訓(xùn)練模型并提供上下文相關(guān)的響應(yīng),人工智能擴大了這項工作的范圍。
Pryon首席執(zhí)行官Chris Mahl(克里斯·馬爾)表示:“檢索增強生成技術(shù)使企業(yè)能夠獲取組織內(nèi)的知識,但它并非沒有風(fēng)險,包括數(shù)據(jù)隱私漏洞、幻覺現(xiàn)象以及集成挑戰(zhàn)。在推廣之前,實施過程需要在數(shù)據(jù)質(zhì)量方面進行投資、建立治理框架并創(chuàng)建評估系統(tǒng)。真正從檢索增強生成技術(shù)中獲得價值的公司,不僅僅是能夠更快地獲取信息,還能通過在創(chuàng)新和保障措施之間找到恰當(dāng)?shù)钠胶?,做出更好的決策?!?/span>
為了彌補數(shù)據(jù)質(zhì)量差距,CIO們應(yīng)該考慮將原始數(shù)據(jù)集中存儲在數(shù)據(jù)湖中,將數(shù)據(jù)清理作為一項共享服務(wù)提供,并通過數(shù)據(jù)架構(gòu)和客戶數(shù)據(jù)平臺實現(xiàn)數(shù)據(jù)訪問。由于有許多數(shù)據(jù)質(zhì)量和管理工具,開發(fā)一項專注于數(shù)據(jù)質(zhì)量的共享服務(wù),是滿足企業(yè)對干凈的人工智能數(shù)據(jù)來源的更大需求以及擴大非結(jié)構(gòu)化數(shù)據(jù)來源清理范圍的有效方法。
六、未經(jīng)嚴格質(zhì)量保證就過度依賴人工智能輸出
定義人工智能治理的七個問題包括商業(yè)價值、工具選擇、合規(guī)性和數(shù)據(jù)治理等方面。但其中最重要的一個也是今天的挑戰(zhàn):員工應(yīng)該如何驗證和質(zhì)疑大語言模型的回答或人工智能智能體的建議?
對于希望開發(fā)人工智能代理的CIO來說,這個問題更為重要,因為測試大語言模型的質(zhì)量保證實踐仍在發(fā)展中,而且通常依賴手動測試。
Pendo首席產(chǎn)品官Trisha Price(特里莎·普賴斯)表示:“CIO必須持續(xù)監(jiān)控人工智能生成輸出的準(zhǔn)確性和可靠性。由于人工智能系統(tǒng)不是確定性的,定義質(zhì)量變得更加復(fù)雜,工程、質(zhì)量保證和產(chǎn)品之間的界限開始變得模糊。這種轉(zhuǎn)變要求各團隊之間更緊密地合作,以確保人工智能驅(qū)動的體驗值得信賴、符合用戶需求,并能夠推動實現(xiàn)真正的業(yè)務(wù)成果。”
從歷史上看,CIO們一直難以證明質(zhì)量保證投資的合理性,因為向企業(yè)推銷增加開發(fā)人員或增強運營和安全彈性更容易。但隨著越來越多的軟件開發(fā)人員使用人工智能代碼生成器,并且IT運營變得更加自動化,CIO們可能會發(fā)現(xiàn)更有必要、也有更多預(yù)算機會投資于質(zhì)量保證和人工智能測試能力。
對于CIO們來說,對風(fēng)險保持一定程度的警惕是有益且重要的,尤其是在知識產(chǎn)權(quán)和新興人工智能能力方面。最優(yōu)秀的CIO所做的不僅僅是制定緩解計劃,還會尋求將風(fēng)險轉(zhuǎn)化為戰(zhàn)略機遇的方法。
作者:Isaac Sacolick(艾薩克·薩科利克)
Isaac Sacolick(艾薩克·薩科利克),數(shù)字化轉(zhuǎn)型學(xué)習(xí)公司StarCIO的總裁,指導(dǎo)領(lǐng)導(dǎo)者采用所需的實踐,以領(lǐng)導(dǎo)其組織的轉(zhuǎn)型變革。他是《Digital Trailblazer(數(shù)字開拓者)》和亞馬遜暢銷書《Driving Digital(驅(qū)動數(shù)字)》的作者,講述了敏捷規(guī)劃、開發(fā)、數(shù)據(jù)科學(xué)、產(chǎn)品管理和其他數(shù)字化轉(zhuǎn)型最佳實踐。Sacolik是公認的頂級社交首席信息官,也是數(shù)字轉(zhuǎn)型的影響者,在InfoWorld、CIO.com、他的博客social、Agile和transformation以及其他網(wǎng)站上發(fā)表了900多篇文章。本文中表達的觀點是Isaac Sacolick(艾薩克·薩科利克)的觀點,不一定代表IDG通信公司,其母公司,子公司或附屬的公司的觀點。
譯者:寶藍
睿觀:
隨著企業(yè)加速擁抱AI以驅(qū)動業(yè)務(wù)轉(zhuǎn)型,數(shù)據(jù)風(fēng)險正成為決定其成敗的關(guān)鍵。CIO們必須高度警惕六大潛在“雷區(qū)”:錯誤分類的數(shù)據(jù)與缺位的數(shù)據(jù)所有者、AI暴露的知識產(chǎn)權(quán)風(fēng)險、合規(guī)性存疑的第三方數(shù)據(jù)源、數(shù)據(jù)管道的可觀測性差、結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的質(zhì)量差距,以及在缺乏嚴格質(zhì)量保證下對AI輸出的過度依賴。這些風(fēng)險不僅會破壞AI項目的根基,導(dǎo)致財務(wù)與聲譽損失,更會削弱組織對數(shù)據(jù)驅(qū)動決策的信任。因此,CIO不能再將數(shù)據(jù)治理視為二線任務(wù),而應(yīng)主動介入,將風(fēng)險管理融入戰(zhàn)略核心,通過建立清晰的所有權(quán)、強化數(shù)據(jù)素價值、提升可觀測性、并投資于QA能力,將潛在的數(shù)據(jù)風(fēng)險轉(zhuǎn)化為鞏固競爭優(yōu)勢的戰(zhàn)略機遇。
在AI的淘金熱中,數(shù)據(jù)是礦脈,但也可能暗藏陷阱;卓越的CIO不僅是挖掘者,更是精明的風(fēng)險勘探者,能將最危險的礦坑,轉(zhuǎn)化為最寶貴的資產(chǎn)。