人工智能的力量正在改變世界各行各業(yè),如醫(yī)療保健、金融、零售、公共部門和互聯(lián)網(wǎng)等。但是,隱私問題是人工智能亟待解決的挑戰(zhàn),尤其是在涉及合規(guī)性和法規(guī)方面。2017年,英國醫(yī)療服務(wù)體系(NHS)醫(yī)院未經(jīng)英國國家衛(wèi)生局的同意,向 Alphabet(谷歌母公司)的DeepMind提供了160萬患者數(shù)據(jù)。這些數(shù)據(jù)主要用于開發(fā)和完善一個智能診斷和檢測系統(tǒng),可以發(fā)現(xiàn)患者是否正處于急性腎損傷的風(fēng)險中。但此新聞被曝光后,在英國各界引起了極大地反響,患者們紛紛譴責(zé)谷歌這種“盜竊”行為。

另外,包括蘋果、谷歌和亞馬遜在內(nèi)的科技巨頭,在AI隱私方面也受到了廣泛關(guān)注,他們可能正在濫用錄音來改善Siri和Google Assistant等人工智能助手。
AI系統(tǒng)的脆弱性
在大多數(shù)AI系統(tǒng)的核心處,由神經(jīng)網(wǎng)絡(luò)組成,而神經(jīng)網(wǎng)絡(luò)則由神經(jīng)元組成。這些功能按層排列,然后將信號傳輸?shù)狡渌窠?jīng)元。這些信號從一層到另一層傳播,并緩慢地“調(diào)整”網(wǎng)絡(luò),實(shí)際上是在調(diào)整每個連接點(diǎn)的權(quán)重。隨著時間的推移,神經(jīng)網(wǎng)絡(luò)從數(shù)據(jù)集中提取特征并識別交叉樣本趨勢并最終學(xué)會數(shù)據(jù)預(yù)測。
神經(jīng)網(wǎng)絡(luò)不會攝取原始圖像、視頻、音頻或文本。而是將訓(xùn)練語料庫的樣本數(shù)據(jù)轉(zhuǎn)換為多維數(shù)組,例如標(biāo)量(單個數(shù)字),向量(標(biāo)量的有序數(shù)組)和矩陣(標(biāo)量排列成一列或多列和一列或多行)。盡管進(jìn)行了轉(zhuǎn)換,但通常仍可以從神經(jīng)網(wǎng)絡(luò)的輸出中識別出潛在的敏感數(shù)據(jù)。數(shù)據(jù)集本身也容易受到攻擊,因?yàn)樗鼈兺ǔ2粫换煜?,并且它們通常存儲在易于受到?shù)據(jù)泄露的集中式存儲庫中。
到目前為止,機(jī)器學(xué)習(xí)中最常見的攻擊為“隸屬推理攻擊”,其中攻擊者(使用單個數(shù)據(jù)點(diǎn)或多個數(shù)據(jù)點(diǎn))確定其是否屬于訓(xùn)練目標(biāo)模型的語料庫。事實(shí)證明,從數(shù)據(jù)集中刪除敏感信息并不意味著無法重新推斷它,因?yàn)锳I非常擅長重建數(shù)據(jù)樣本。除非使用隱私保護(hù)技術(shù),否則受過訓(xùn)練的模型很容易將數(shù)據(jù)泄露出去。
在一項(xiàng)研究中,威斯康星大學(xué)和馬什菲爾德診所研究基金會的研究人員,可以從經(jīng)過訓(xùn)練可預(yù)測藥物劑量的機(jī)器學(xué)習(xí)模型中提取患者的基因信息。在另一項(xiàng)研究中,卡內(nèi)基·梅隆大學(xué)和威斯康星大學(xué)的研究科學(xué)家從多個面部識別模型中,重建了特定的頭部圖像。
與科技進(jìn)步相比,數(shù)據(jù)隱私成為了用戶更關(guān)心的問題。在美國的50個州和哥倫比亞特區(qū),數(shù)百項(xiàng)涉及隱私,網(wǎng)絡(luò)安全和數(shù)據(jù)泄露的法案正在等待立案或已經(jīng)通過。其中最全面的是《加州消費(fèi)者隱私法》,大約在兩年前簽署成為法律。其他的包括《健康數(shù)據(jù)可移植性和責(zé)任制法案》(HIPAA),該法案要求科技公司在披露個人健康信息之前必須尋求授權(quán)。歐盟的《通用隱私數(shù)據(jù)保護(hù)條例》(GDPR)等國際框架旨在更好地控制企業(yè)在數(shù)據(jù)方面的收集和使用。所以,在新興技術(shù)中企業(yè)越來越關(guān)注用戶的隱私問題,聯(lián)合學(xué)習(xí)、差別隱私、同態(tài)加密這3項(xiàng)技術(shù)對于用戶的數(shù)據(jù)起到了很好的保護(hù)作用。
1、聯(lián)合學(xué)習(xí)
聯(lián)合學(xué)習(xí)是一種在不交換數(shù)據(jù)樣本的分散設(shè)備或服務(wù)器上訓(xùn)練AI算法的技術(shù)。先使用用戶的設(shè)備下載當(dāng)前的模型,然后用設(shè)備的數(shù)據(jù)訓(xùn)練這個模型,之后所有的改變都會總結(jié)為一個小的更新。最后,只有這個更新會被傳到云端(使用加密通信的方式),并與其他用戶的更新合在一起平均化,然后改善共享模型。所有的訓(xùn)練數(shù)據(jù)都保留在用戶的設(shè)備上,云端不會存儲單獨(dú)的數(shù)據(jù)。目前,Google已將聯(lián)合學(xué)習(xí)用于Gboard預(yù)測鍵盤中的個性化設(shè)置,用在成千上萬的iOS和Android設(shè)備中。在Pixel4推出的同時,Google推出了“即時播放”音樂識別功能的改進(jìn)版本,該功能以聯(lián)合方式匯總歌曲的播放次數(shù),根據(jù)不同地區(qū)來確定最受歡迎的歌曲以提高識別度。
2、差別隱私
差別隱私是密碼學(xué)中的一種保護(hù)系統(tǒng),旨在提供一種從統(tǒng)計數(shù)據(jù)庫查詢時,最大化數(shù)據(jù)查詢的準(zhǔn)確性,同時最大限度減少識別其記錄的機(jī)會。當(dāng)年蘋果在發(fā)布“iOS 10”系統(tǒng)時便著重介紹了差別隱私這項(xiàng)技術(shù)。蘋果通過使用差別隱私技術(shù),使系統(tǒng)在不影響個人隱私的前提下,幫助發(fā)現(xiàn)大批量用戶的使用模式。為了掩蓋個人身份,差別隱私會像個人使用模式的小樣本中加入數(shù)學(xué)噪音。隨著更多的用戶呈現(xiàn)出相同的模式,總體模式就會開始顯現(xiàn),這可以用來保護(hù)用戶敏感數(shù)據(jù)。
差別隱私是統(tǒng)計和數(shù)據(jù)分析領(lǐng)域中的研究主題,利用哈希、分段抽樣和噪聲注入等方法,在實(shí)現(xiàn)眾包學(xué)習(xí)時也完全保護(hù)了用戶的個人隱私。蘋果在這個技術(shù)方面做了很多非常重要的努力,來確保其可以進(jìn)行大規(guī)模的應(yīng)用。根據(jù)蘋果的說法,差別隱私是一個統(tǒng)計學(xué)的概念,在試圖更多分析了解一個群組信息整體趨勢的同時,可以盡可能少的了解這個群組中的個體詳情。利用差別隱私,蘋果可以收集和存儲其用戶數(shù)據(jù),并從中總結(jié)出用戶們在做什么、喜歡什么、想要什么等,但同時又不會提取到有關(guān)該群體中任何可能會侵犯隱私的個人信息。并且在理論上,黑客或者情報機(jī)構(gòu)也不可能提取到這些個體信息。
同態(tài)加密并不是一項(xiàng)新鮮技術(shù),早在2009年IBM研究員CraigGentry開發(fā)了第一個同態(tài)加密的保護(hù)機(jī)制。同態(tài)加密是一項(xiàng)基于數(shù)學(xué)難題的計算復(fù)雜性理論的密碼學(xué)技術(shù)。對經(jīng)過同態(tài)加密的數(shù)據(jù)進(jìn)行處理得到一個輸出,將這一輸出進(jìn)行解密,其結(jié)果與用同一方法處理未加密的原始數(shù)據(jù)得到的輸出結(jié)果是一樣的。同態(tài)加密技術(shù)最優(yōu)秀的地方在于,其關(guān)注的是數(shù)據(jù)處理安全。同態(tài)加密提供了一種對加密數(shù)據(jù)進(jìn)行處理的功能。也就是說,其他人可以對加密數(shù)據(jù)進(jìn)行處理,但是處理過程不會泄露任何原始內(nèi)容;同時,擁有密鑰的用戶對處理過的數(shù)據(jù)進(jìn)行解密后,得到將是處理后的結(jié)果。
在應(yīng)用方面,IBM高級研究科學(xué)家Flavio Bergamaschi及其團(tuán)隊與一家美國銀行進(jìn)行合作,使用同態(tài)加密技術(shù)對機(jī)器學(xué)習(xí)處理流程進(jìn)行加密。該機(jī)器學(xué)習(xí)處理流程是一個線性回歸模型,擁有超過12個變量,它分析了來自賬戶持有人24個月的交易數(shù)據(jù),以預(yù)測這些賬戶的財務(wù)狀況,部分是推薦貸款等產(chǎn)品。由于客戶的隱私和合規(guī)性問題,IBM團(tuán)隊對現(xiàn)有模型和有問題的交易數(shù)據(jù)進(jìn)行了加密,并且他們使用加密和未加密的模型進(jìn)行預(yù)測以比較性能。盡管前者的運(yùn)行速度比后者慢,但準(zhǔn)確性卻是相同的。
未經(jīng)允許不得轉(zhuǎn)載:RPA中國 | RPA全球生態(tài) | 數(shù)字化勞動力 | RPA新聞 | 推動中國RPA生態(tài)發(fā)展 | 流 > AI存在隱私問題,但這3項(xiàng)技術(shù)可以輕松解決
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發(fā)者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發(fā)展洞察(2022)》報告正式發(fā)布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產(chǎn)業(yè)共進(jìn),第四屆ISIG中國產(chǎn)業(yè)智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業(yè)研究報告》正式發(fā)布 | RPA中國