面對數(shù)據(jù)集不足和使用受版權(quán)保護(hù)的數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)系統(tǒng)的風(fēng)險,當(dāng)今首席信息官面臨的挑戰(zhàn)包括隱私和安全、合規(guī)性和匿名化。那么,除了警惕監(jiān)管和與其他管理人員合作以幫助建立對人工智能的信任之外,首席信息官還能做些什么呢?

來源:shapecharge
根據(jù)Gartner 5?月份發(fā)布的一項(xiàng)調(diào)查,隨著人工智能被大肆宣傳,它成為企業(yè)的主要人工智能解決方案也就不足為奇了 。在美國、德國和英國的?644?名公司高管中,有?29%?表示他們已經(jīng)在使用人工智能,而且它比其他人工智能相關(guān)技術(shù)(如優(yōu)化算法、基于規(guī)則的系統(tǒng)、自然語言處理和其他類型的機(jī)器學(xué)習(xí))更為廣泛。
然而,真正的挑戰(zhàn)是“論證和評估”項(xiàng)目的價值,這不僅與TCO?和可以獲得的廣泛利益有關(guān),而且還要面對諸如對?AI?技術(shù)方面缺乏信心以及缺乏足夠數(shù)據(jù)量等障礙。但這些并不是無法克服的挑戰(zhàn)。
一、隱私保護(hù)
人工智能和新一代人工智能項(xiàng)目的第一步始終是獲取正確的數(shù)據(jù)。佛羅倫薩大學(xué)技術(shù)專家Vincenzo Laveglia?表示:“在隱私至關(guān)重要的情況下,我們會嘗試盡可能匿名化,然后再開始訓(xùn)練模型。隱私和實(shí)用性之間需要取得平衡。如果匿名化后數(shù)據(jù)中的信息級別相同,則數(shù)據(jù)仍然有用。但是一旦刪除個人或敏感信息,數(shù)據(jù)就不再有效,就會出現(xiàn)問題。合成數(shù)據(jù)避免了這些困難,但它們也不能免除權(quán)衡的需要。我們必須確保各種信息類別之間的平衡,否則模型會成為某個主題的專家,而對其他主題卻非常不確定?!?/span>
合成數(shù)據(jù)的范圍包括使用數(shù)據(jù)增強(qiáng)方法生成的數(shù)據(jù),或從現(xiàn)有數(shù)據(jù)中人工生成新數(shù)據(jù)的過程,用于訓(xùn)練機(jī)器學(xué)習(xí)模型。
Laveglia說:“在適用的情況下,數(shù)據(jù)增強(qiáng)可以解決數(shù)據(jù)不足或不符合隱私和知識產(chǎn)權(quán)法規(guī)的問題?!?/span>
Gartner認(rèn)為,合成數(shù)據(jù)有助于解決?AI?產(chǎn)品的數(shù)據(jù)可用性問題,以及隱私、合規(guī)性和匿名化挑戰(zhàn)。合成數(shù)據(jù)可以反映與真實(shí)數(shù)據(jù)相同的統(tǒng)計特征,但不會泄露個人身份信息,從而符合隱私設(shè)計法規(guī)和其他敏感細(xì)節(jié)。合成數(shù)據(jù)的替代方案是手動對數(shù)據(jù)集進(jìn)行匿名化和去身份化,但這需要更多時間和精力,錯誤率也更高。
《歐洲人工智能法案》也談到了合成數(shù)據(jù),稱其是減輕使用個人數(shù)據(jù)訓(xùn)練人工智能系統(tǒng)所帶來的風(fēng)險的一種可能的措施。
“近幾個月來,人們對人工智能個人數(shù)據(jù)保護(hù)的關(guān)注度顯著提高,”Dentons的?TMT、商業(yè)和數(shù)據(jù)保護(hù)律師兼法律顧問?Chiara Bocchi?表示?!皬耐ㄓ玫娜斯ぶ悄苣P蛠砜?,目前人們關(guān)注的焦點(diǎn)是數(shù)據(jù)抓取,無論是執(zhí)行者還是受其影響的人。意大利當(dāng)局已經(jīng)采取了一些措施來防止這種活動?!?/span>
二、合規(guī)的復(fù)雜性
今年5?月,意大利數(shù)據(jù)保護(hù)局強(qiáng)調(diào),新一代人工智能系統(tǒng)所基于的訓(xùn)練模型始終需要大量數(shù)據(jù),這些數(shù)據(jù)通常通過網(wǎng)絡(luò)抓取或在網(wǎng)上進(jìn)行大規(guī)模、無差別的收集獲得。網(wǎng)絡(luò)抓取活動可以是直接的,由開發(fā)模型的同一主體進(jìn)行,也可以是間接的,從第三方數(shù)據(jù)湖進(jìn)行。因此,對于首席信息官來說,確保數(shù)據(jù)以合規(guī)的方式收集,以及最重要的是確保他們能夠使用這些數(shù)據(jù)變得很復(fù)雜。
“從保護(hù)個人數(shù)據(jù)和版權(quán)的立法角度來看,了解某段數(shù)據(jù)是否受到保護(hù)并不復(fù)雜,”Bocchi說道。“隱私方面的復(fù)雜性在于保證將公開或可公開訪問的數(shù)據(jù)用于除決定其傳播的目的之外的其他目的。僅從處理的法律基礎(chǔ)來看,獲得所有可以使用抓取技術(shù)收集個人數(shù)據(jù)的主體的同意基本上是不可能的。”
這就是隱私當(dāng)局試圖尋找指導(dǎo)方針的原因。
“具體來說,問題和評估在于,合法利益的法律基礎(chǔ)是否適用于處理通過抓取收集的個人數(shù)據(jù),以訓(xùn)練人工智能系統(tǒng),”Bocchi補(bǔ)充道。“意大利數(shù)據(jù)保護(hù)機(jī)構(gòu)宣布,它將很快對基于合法利益的網(wǎng)絡(luò)個人數(shù)據(jù)抓取的合法性作出裁決?!?/span>
?
荷蘭數(shù)據(jù)保護(hù)局和法國數(shù)據(jù)保護(hù)局(CNIL)已經(jīng)就此問題進(jìn)行了干預(yù)。CNIL表示,合成數(shù)據(jù)以及匿名化和假名化技術(shù)是限制處理個人數(shù)據(jù)以訓(xùn)練人工智能系統(tǒng)相關(guān)風(fēng)險的有效措施。
三、降低人工智能風(fēng)險的策略
在復(fù)雜的環(huán)境中,充分利用人工智能的潛力并降低風(fēng)險是一項(xiàng)持續(xù)的高難度任務(wù)。
Bocchi說:“成功的策略是從訓(xùn)練數(shù)據(jù)庫開始,從新一代人工智能系統(tǒng)的設(shè)計階段開始,定義確保遵守隱私法規(guī)的解決方案?!?/span>
另一項(xiàng)有效舉措是建立公司結(jié)構(gòu),以促進(jìn)高層管理人員之間的更大協(xié)作?!盀榱嗽黾訉π录夹g(shù)的信任,許多公司正在采取行動,成立內(nèi)部道德委員會,這些委員會還被賦予支持和促進(jìn)創(chuàng)新治理的職能,”她補(bǔ)充道。
在人工智能模型的訓(xùn)練和數(shù)據(jù)存儲方面,CNIL還建議企業(yè)注重人工智能系統(tǒng)的透明開發(fā)及其可審計性,并對模型開發(fā)技術(shù)進(jìn)行有效的同行評審。
四、駕馭技術(shù)和變革管理
在對人工智能技術(shù)的信任方面,首席信息官們擔(dān)心幻覺和歧視風(fēng)險。因此,為了獲得信任,有必要確保數(shù)據(jù)集的質(zhì)量,并適當(dāng)限制數(shù)據(jù)存儲,以防止個人或敏感信息泄露。
然而,鑒于這些前提,佛羅倫薩大學(xué)的拉維利亞表示,人工智能是一種完全可靠的工具,只要系統(tǒng)構(gòu)建良好、測試數(shù)據(jù)的性能令人放心,并且所使用的數(shù)據(jù)集代表數(shù)據(jù)的實(shí)際分布。
“一個例子是Alpha Fold,它廣泛用于結(jié)構(gòu)生物學(xué)和生物信息學(xué),”他說?!斑@是一個完全基于?DeepMind?開發(fā)的人工智能技術(shù)的程序,用于從蛋白質(zhì)的氨基酸序列開始預(yù)測蛋白質(zhì)的?3D?結(jié)構(gòu)。它具有革命性,因?yàn)樗梢栽谝惶靸?nèi)完成研究人員需要數(shù)月或數(shù)年才能完成的任務(wù),而且即使訓(xùn)練數(shù)據(jù)集很大,錯誤率也非常低。但它的數(shù)量級還不能與訓(xùn)練現(xiàn)代?LLM?的數(shù)據(jù)集相提并論。”
公司可以采用類似的方式使用預(yù)先訓(xùn)練的模型,以確保最佳配置、微調(diào)和適應(yīng)其用例。事實(shí)上,從頭開始使用自己的模型需要更多的數(shù)據(jù)收集工作和大量技能。但另一方面,使用大型技術(shù)套件中包含的產(chǎn)品是一種更直接的解決方案,但可定制性較差,因?yàn)樗赡軙仁笴IO?進(jìn)入某些應(yīng)用程序的界限。下載預(yù)先訓(xùn)練的模型,然后用自己的數(shù)據(jù)對其進(jìn)行改進(jìn),這對?IT?團(tuán)隊(duì)的創(chuàng)造力來說是一個很好的折衷方案,只要與業(yè)務(wù)一起,首先確定了可能為公司帶來優(yōu)勢的用例。
在公司中成熟地采用人工智能意味著在流程和功能中大規(guī)模推廣這項(xiàng)技術(shù),并努力產(chǎn)生超越提高生產(chǎn)力的效益。IT還需要專注于人工智能工程,即技術(shù)開發(fā)和具體實(shí)施。
此外,項(xiàng)目必須伴隨著技能提升和變革管理活動,因?yàn)閳F(tuán)隊(duì)的組織方式和工作方式注定會發(fā)生重大變化。根據(jù)普華永道最近的《人工智能就業(yè)晴雨表》研究,對使用人工智能的技能的需求增長了?25%,這意味著人們不會被人工智能取代,而是必須學(xué)習(xí)更好的方法來使用它,普華永道的另一項(xiàng)研究《2024?年全球首席執(zhí)行官調(diào)查》也證實(shí)了這一點(diǎn),該研究稱,對于?69%?的樣本來說,人工智能將要求大多數(shù)員工開發(fā)新技能。
【睿觀:首席信息官在人工智能時代面臨的挑戰(zhàn)與應(yīng)對
(一)核心問題與挑戰(zhàn)
數(shù)據(jù)隱私與安全:?如何在保證數(shù)據(jù)隱私的前提下,收集足夠高質(zhì)量的數(shù)據(jù)用于訓(xùn)練AI模型?
合規(guī)性:?如何在遵守相關(guān)法律法規(guī)的前提下,合法獲取和使用數(shù)據(jù)?
數(shù)據(jù)質(zhì)量與模型可靠性:?如何確保訓(xùn)練數(shù)據(jù)的高質(zhì)量,并降低模型產(chǎn)生幻覺或歧視的風(fēng)險?
技術(shù)人才與組織變革:?如何培養(yǎng)具備AI技能的人才,并推動組織適應(yīng)AI帶來的變革?
(二)應(yīng)對策略與建議
1、合成數(shù)據(jù):?利用合成數(shù)據(jù)解決數(shù)據(jù)不足和隱私問題。合成數(shù)據(jù)可以模擬真實(shí)數(shù)據(jù),但又不包含個人隱私信息。
2、數(shù)據(jù)匿名化與去標(biāo)識化:?對數(shù)據(jù)進(jìn)行匿名化和去標(biāo)識化處理,降低隱私風(fēng)險。
3、合法合規(guī):?嚴(yán)格遵守相關(guān)法律法規(guī),確保數(shù)據(jù)收集和使用的合法性。
4、建立道德委員會:?成立內(nèi)部道德委員會,監(jiān)督AI的開發(fā)和應(yīng)用,確保其符合倫理道德。
5、透明度與可審計性:?提高AI模型的透明度和可審計性,增強(qiáng)用戶對AI的信任。
6、預(yù)訓(xùn)練模型:?利用預(yù)訓(xùn)練模型,減少數(shù)據(jù)收集和模型訓(xùn)練的工作量。
7、技能提升與組織變革:?加強(qiáng)員工AI技能培訓(xùn),推動組織適應(yīng)AI帶來的變革。
(三)分析與建議
1、平衡隱私與實(shí)用性:?在數(shù)據(jù)隱私和模型性能之間找到平衡點(diǎn),既要保護(hù)用戶隱私,又要保證模型的準(zhǔn)確性。
2、關(guān)注模型解釋性:?提高模型的可解釋性,幫助用戶理解模型的決策過程,增強(qiáng)對模型的信任。
3、建立數(shù)據(jù)治理體系:?建立完善的數(shù)據(jù)治理體系,規(guī)范數(shù)據(jù)采集、存儲、使用和共享,確保數(shù)據(jù)安全。
4、加強(qiáng)國際合作:?加強(qiáng)國際合作,共同制定AI倫理規(guī)范和法律法規(guī)。
5、關(guān)注AI的社會影響:?關(guān)注AI對社會的影響,積極應(yīng)對AI可能帶來的挑戰(zhàn)。
總結(jié)
首席信息官在人工智能時代面臨著巨大的機(jī)遇和挑戰(zhàn)。通過積極應(yīng)對數(shù)據(jù)隱私、合規(guī)性、技術(shù)人才等方面的挑戰(zhàn),可以充分發(fā)揮人工智能的潛力,推動企業(yè)數(shù)字化轉(zhuǎn)型。
以下為首席信息官的行動建議:
1、制定AI戰(zhàn)略:?明確企業(yè)AI發(fā)展的目標(biāo)和方向,制定詳細(xì)的實(shí)施計劃。
2、組建AI團(tuán)隊(duì):?建立一支具備AI專業(yè)知識的團(tuán)隊(duì),負(fù)責(zé)AI項(xiàng)目的開發(fā)和管理。
3、投資AI基礎(chǔ)設(shè)施:?建立完善的AI基礎(chǔ)設(shè)施,包括硬件、軟件和數(shù)據(jù)平臺。
4、加強(qiáng)與業(yè)務(wù)部門的合作:?與業(yè)務(wù)部門緊密合作,共同探索AI應(yīng)用場景。
5、關(guān)注AI倫理:?始終將AI倫理放在首位,確保AI技術(shù)的負(fù)責(zé)任開發(fā)和應(yīng)用。
總結(jié)來說,人工智能的發(fā)展為企業(yè)帶來了巨大的機(jī)遇,但也帶來了新的挑戰(zhàn)。首席信息官需要積極應(yīng)對這些挑戰(zhàn),抓住機(jī)遇,推動企業(yè)在人工智能時代實(shí)現(xiàn)創(chuàng)新發(fā)展。】