網(wǎng)站建設(shè)四個(gè)階段蘇州seo免費(fèi)咨詢
開(kāi)放隱私計(jì)算


開(kāi)放隱私計(jì)算
開(kāi)放隱私計(jì)算OpenMPC是國(guó)內(nèi)第一個(gè)且影響力最大的隱私計(jì)算開(kāi)放社區(qū)。社區(qū)秉承開(kāi)放共享的精神,專注于隱私計(jì)算行業(yè)的研究與布道。社區(qū)致力于隱私計(jì)算技術(shù)的傳播,愿成為中國(guó) “隱私計(jì)算最后一公里的服務(wù)區(qū)”。
183篇原創(chuàng)內(nèi)容
公眾號(hào)

知識(shí)圖譜(Knowledge Graph)技術(shù)憑借其拓?fù)浣Y(jié)構(gòu)的信息關(guān)聯(lián)關(guān)系和消息傳遞機(jī)制,能夠?qū)误w信息進(jìn)行有益補(bǔ)充,因此正在被逐步應(yīng)用于金融反欺詐、反洗錢和精準(zhǔn)營(yíng)銷等場(chǎng)景。但是,因?yàn)楝F(xiàn)實(shí)社會(huì)中的數(shù)據(jù)孤島問(wèn)題,單一機(jī)構(gòu)內(nèi)的圖數(shù)據(jù)往往只是一小部分,導(dǎo)致了更全面的關(guān)聯(lián)關(guān)系和消息傳遞范式被阻斷,這使得圖數(shù)據(jù)的現(xiàn)實(shí)應(yīng)用價(jià)值大打折扣。為此,洞見(jiàn)科技自主研發(fā)了「安全多方圖聯(lián)邦(Insight Federated Graph,InsightFG)」技術(shù),并獲得了國(guó)家發(fā)明專利。該技術(shù)從能力上涵蓋了多方圖數(shù)據(jù)的安全構(gòu)建、安全查詢、安全表示和安全學(xué)習(xí),旨在基于隱私計(jì)算技術(shù)與知識(shí)圖譜技術(shù)的深度結(jié)合,打破圖數(shù)據(jù)孤島,安全釋放多方圖數(shù)據(jù)的融合價(jià)值。

圖1 圖數(shù)據(jù)孤島
01
多方圖數(shù)據(jù)挖掘技術(shù)發(fā)展
傳統(tǒng)的圖數(shù)據(jù)價(jià)值挖掘主要可分為三類:圖查詢、圖表示與圖學(xué)習(xí),其中圖構(gòu)建是一切應(yīng)用的基礎(chǔ)。在現(xiàn)實(shí)場(chǎng)景中,由于安全合規(guī)或競(jìng)爭(zhēng)關(guān)系等原因,圖數(shù)據(jù)擁有者不能或不愿彼此共享,這種數(shù)據(jù)孤島問(wèn)題嚴(yán)重限制了圖數(shù)據(jù)價(jià)值的充分釋放。如何在保護(hù)隱私和數(shù)據(jù)安全的條件下進(jìn)行多圖數(shù)據(jù)價(jià)值挖掘成為一個(gè)重要的研究問(wèn)題。隱私計(jì)算技術(shù)的發(fā)展,為解決上述問(wèn)題提供了多種解決方案。
多方圖構(gòu)建
即在隱私保護(hù)和數(shù)據(jù)安全的前提下構(gòu)建一個(gè)全局圖,例如基于秘密分享的圖并集計(jì)算和基于門(mén)限解密密碼系統(tǒng)的圖并集計(jì)算。該方案比較依賴圖數(shù)據(jù)本身的存儲(chǔ)形式(秘密分享方案需要圖數(shù)據(jù)是鄰接矩陣表示的;基于門(mén)限解密密碼系統(tǒng)設(shè)計(jì)的方案甚至需要設(shè)計(jì)新的數(shù)據(jù)編碼形式),不適用實(shí)際場(chǎng)景中有向且異構(gòu)的圖數(shù)據(jù)。
多方圖查詢
指基于多圖結(jié)構(gòu)(結(jié)點(diǎn)、邊和屬性)進(jìn)行隱私安全的語(yǔ)義查詢??梢詫⒍喾綀D數(shù)據(jù)加密融合,基于融合后的密文進(jìn)行查詢,但是因?yàn)樯婕按罅康拿芪牟僮?#xff0c;所以面臨性能瓶頸問(wèn)題;也可以從特定算法角度著手,如利用同態(tài)加密算法設(shè)計(jì)最短路徑查詢算法,以實(shí)現(xiàn)具有隱私保護(hù)作用的圖查詢,但仍然存在效率問(wèn)題,另一方面,由于無(wú)法使用圖查詢語(yǔ)言,導(dǎo)致使用門(mén)檻較高,且缺乏并行能力。
多方圖表示
是指針對(duì)多圖結(jié)構(gòu)進(jìn)行隱私安全的重組、抽象或者傳播迭代得到點(diǎn)/邊全局屬性的過(guò)程,如PageRank值、介性中心度(Betweenness)和圖向量表示(embedding)的計(jì)算等。在安全多方計(jì)算范式下,早期的多方圖表示算法多為示例性方案,難以應(yīng)用大規(guī)模數(shù)據(jù)集。在混淆電路的基礎(chǔ)上引入現(xiàn)代并行編程范式可以在一定程度上提升計(jì)算效率,但通信開(kāi)銷仍是一個(gè)很大的問(wèn)題,且在計(jì)算參與方上會(huì)受到限制,很難自由擴(kuò)充至多方。
多方圖學(xué)習(xí)
是指基于多圖數(shù)據(jù)進(jìn)行隱私安全的機(jī)器學(xué)習(xí)訓(xùn)練。根據(jù)圖數(shù)據(jù)的使用方法可分為兩大類:一是利用派生出的圖特征,與已有結(jié)點(diǎn)屬性一起進(jìn)行傳統(tǒng)機(jī)器學(xué)習(xí)的模型訓(xùn)練;二是利用圖神經(jīng)網(wǎng)絡(luò)(Graph Neural Networks,GNN)進(jìn)行的深度學(xué)習(xí)模型訓(xùn)練。聯(lián)邦圖機(jī)器學(xué)習(xí)(Federated Graph Machine Learning, FGML)可以通過(guò)聯(lián)邦的方式訓(xùn)練圖機(jī)器學(xué)習(xí)模型從而實(shí)現(xiàn)對(duì)多方圖數(shù)據(jù)融合價(jià)值的挖掘,但傳統(tǒng)FGML中大多采用的是各個(gè)參與方各自在本地進(jìn)行消息傳遞與聚合,再將本地中間結(jié)果融合計(jì)算,仍然無(wú)法真正讓多圖數(shù)據(jù)價(jià)值達(dá)到全局最優(yōu)效益。

圖2 縱向圖聯(lián)邦與橫向圖聯(lián)邦
綜上,基于安全多方計(jì)算的方案由于大量使用了密文運(yùn)算,面臨很大的性能瓶頸難題,而基于聯(lián)邦學(xué)習(xí)的方案由于是在各自本地進(jìn)行消息傳遞與聚合,再將本地中間結(jié)果融合計(jì)算,導(dǎo)致全局?jǐn)?shù)據(jù)價(jià)值效用無(wú)法最大化,因此一般只能解決圖計(jì)算中的某些特定問(wèn)題,無(wú)法適用于未來(lái)多樣化的圖數(shù)據(jù)價(jià)值挖掘場(chǎng)景,且實(shí)現(xiàn)路徑差異較大,很難統(tǒng)一到一個(gè)解決方案中。
02
洞見(jiàn)安全多方圖聯(lián)邦平臺(tái)
洞見(jiàn)安全多方圖聯(lián)邦平臺(tái)通過(guò)融合安全多方計(jì)算、假名化、隨機(jī)化等技術(shù)等實(shí)現(xiàn)了跨多方的全局圖的安全構(gòu)建,并在此基礎(chǔ)上實(shí)現(xiàn)了多級(jí)分布式圖計(jì)算引擎,涵蓋了多方圖數(shù)據(jù)的安全存儲(chǔ)、安全查詢、安全表示與安全學(xué)習(xí),并可以完成結(jié)點(diǎn)分類、邊分類、鏈接預(yù)測(cè)、標(biāo)簽傳播、社區(qū)發(fā)現(xiàn)等多類型任務(wù)。

圖3 InsightFG架構(gòu)設(shè)計(jì)
03
InsightFG建模效果分析
以圖數(shù)據(jù)集DGraph為例,其為一個(gè)有向無(wú)權(quán)的動(dòng)態(tài)圖,頂點(diǎn)達(dá)300萬(wàn),邊達(dá)到400萬(wàn),傳統(tǒng)圖算法的效果如下:
Baseline:集中方式模型效果

我們將DGraph拆分成兩個(gè)數(shù)據(jù)集模擬縱向聯(lián)邦場(chǎng)景,通過(guò)InsightFG的安全圖構(gòu)建和安全圖表示,并基于圖表示結(jié)果采用縱向邏輯回歸和縱向XGB算法進(jìn)行模型訓(xùn)練。得益于全局圖的構(gòu)建,通過(guò)InsightFG可以將原模型效果提升約7個(gè)百分點(diǎn);使用InsightFG的模型效果高于直接使用圖聯(lián)邦機(jī)器學(xué)習(xí)的方案(V-GNN);且相較于已有的基于集中圖數(shù)據(jù)的模型效果,InsightFG+V-XGB的模型效果僅僅低于GraphSAGE(NeighborSampler)算法不到1個(gè)百分點(diǎn)??梢?jiàn),采用InsightFG能夠在隱私保護(hù)與數(shù)據(jù)安全的條件下使得模型精準(zhǔn)性與集中數(shù)據(jù)建立的模型效果相當(dāng)。
InsightFG:聯(lián)邦方式建模效果

04
總結(jié)
圖數(shù)據(jù)因?yàn)槠渫負(fù)浣Y(jié)構(gòu)方式的信息關(guān)聯(lián)關(guān)系和消息傳遞范式,能把紛雜的信息變得有序、直觀、清晰,在許多行業(yè)領(lǐng)域都有巨大的應(yīng)用價(jià)值。在隱私保護(hù)和數(shù)據(jù)安全的大背景下,基于隱私計(jì)算的多方圖數(shù)據(jù)價(jià)值挖掘是前沿技術(shù)研究熱點(diǎn)。洞見(jiàn)科技在大量理論研究的基礎(chǔ)上,結(jié)合多年圖數(shù)據(jù)挖掘的經(jīng)驗(yàn)積累,推出了InsightFG平臺(tái),集安全多方圖構(gòu)建、安全多方圖查詢、安全多方圖表示和安全多方圖學(xué)習(xí)于一體,貫徹圖數(shù)據(jù)價(jià)值挖掘的全生命周期,在安全性、易用性和效率上能更好地滿足多方圖數(shù)據(jù)價(jià)值融合的場(chǎng)景應(yīng)用。
【參考文獻(xiàn)】
[1] Kukkala, V.B., Iyengar, S.S., & Saini, J.S. Secure Multiparty Computation of a Social Network. 2015.
[2] 魏瓊, 李順東, 王文麗,等. 圖交集和并集的安全多方計(jì)算[J]. 密碼學(xué)報(bào), 2020, 7(6):15.
[3] PGAS: Privacy-preserving graph encryption for accurate constrained shortest distance querie
[4] Lai S , Yuan X , Sun S F , et al. GraphSE: An Encrypted Graph Database for Privacy-Preserving Social Search[J]. ACM, 2019.
[5] Brickell J , Shmatikov V . Privacy-Preserving Graph Algorithms in the Semi-honest Model[C]// Advances in Cryptology - ASIACRYPT 2005, 11th International Conference on the Theory and Application of Cryptology and Information Security, Chennai, India, December 4-8, 2005, Proceedings. Springer, Berlin, Heidelberg, 2005.
[6] He C , Balasubramanian K , Ceyani E , et al. FedGraphNN: A Federated Learning System and Benchmark for Graph Neural Networks[J]. 2021.
[7] Chaochao C , Jun Z , Longfei Z , et al. Vertically Federated Graph Neural Network for Privacy-Preserving Node[C]. JCAI. 2022.
[8] Fu, X., Zhang, B., Dong, Y., Chen, C., & Li, J. Federated Graph Machine Learning: A Survey of Concepts, Techniques, and Applications. 2022. ArXiv, abs/2207.11812.
[9] https://github.com/DGraphXinye/DGraphFin_baseline
來(lái)源: 洞見(jiàn)科技InsightOne
END
往期推薦:
隱私計(jì)算頭條周刊(2.20-2.26)
近期隱私計(jì)算行業(yè)招聘
合規(guī)要點(diǎn)解析:如何正確的使用隱私增強(qiáng)技術(shù)
速來(lái)!掘金數(shù)據(jù)時(shí)代2022年度隱私計(jì)算評(píng)選活動(dòng)火熱報(bào)名中!
開(kāi)放隱私計(jì)算社區(qū)征稿啦!
熱門(mén)文章:
姚期智院士:數(shù)據(jù)、算法、算力為何是數(shù)字經(jīng)濟(jì)核心技術(shù)?
隱私計(jì)算又遇技術(shù)突破,億級(jí)數(shù)據(jù)密態(tài)分析可在10分鐘內(nèi)完成
清華大學(xué)張超:實(shí)現(xiàn)數(shù)據(jù)確權(quán)與保護(hù),數(shù)據(jù)密態(tài)漸成行業(yè)共識(shí)
數(shù)據(jù)確權(quán):第五要素的戰(zhàn)爭(zhēng)
未來(lái)十年,將會(huì)有95%的企業(yè)采用隱私計(jì)算技術(shù)


分享此內(nèi)容的人還喜歡
應(yīng)對(duì)數(shù)據(jù)管理成本和復(fù)雜性,數(shù)據(jù)基礎(chǔ)設(shè)施架構(gòu)的革命
Andy730閱讀 22不喜歡
不看的原因確定
內(nèi)容質(zhì)量低
不看此公眾號(hào)

展望2023:工業(yè)互聯(lián)網(wǎng)發(fā)展呈現(xiàn)八大趨勢(shì)
工聯(lián)網(wǎng)iitime閱讀 102不喜歡
不看的原因確定
內(nèi)容質(zhì)量低
不看此公眾號(hào)

數(shù)字孿生-電視生產(chǎn)線3D可視化管理平臺(tái)
木棉樹(shù)軟件閱讀 1356不喜歡
不看的原因確定
內(nèi)容質(zhì)量低
不看此公眾號(hào)
