本文版權(quán)為《郵電設(shè)計(jì)技術(shù)》所有,如需轉(zhuǎn)載請(qǐng)聯(lián)系《郵電設(shè)計(jì)技術(shù)》編輯部
摘 要:AI模型的訓(xùn)練和優(yōu)化高度依賴海量數(shù)據(jù),這些數(shù)據(jù)的來(lái)源呈現(xiàn)顯著的多樣性與分散性,傳統(tǒng)的數(shù)據(jù)共享機(jī)制面臨著數(shù)據(jù)泄露、數(shù)據(jù)篡改、隱私保護(hù)等問(wèn)題。在此背景下,構(gòu)建AI模型數(shù)據(jù)安全共享方案成為當(dāng)務(wù)之急。該方案依托區(qū)塊鏈與同態(tài)加密技術(shù),可確保訓(xùn)練數(shù)據(jù)無(wú)需離開(kāi)本地,通過(guò)聯(lián)盟協(xié)作訓(xùn)練實(shí)現(xiàn)AI模型開(kāi)發(fā)。通過(guò)這種方式,能在更大范圍內(nèi)實(shí)現(xiàn)數(shù)據(jù)的安全共享,進(jìn)而充分釋放AI模型的巨大潛力。
關(guān)鍵詞:AI模型;區(qū)塊鏈;同態(tài)加密;數(shù)據(jù)安全
doi:10.12045/j.issn.1007-3043.2025.09.007
引言
人工智能(AI)技術(shù)的迅猛發(fā)展高度依賴大量高質(zhì)量數(shù)據(jù),數(shù)據(jù)共享作為整合多方數(shù)據(jù)資源的有效手段,能夠大幅提升AI模型的準(zhǔn)確性與泛化能力。然而,AI模型數(shù)據(jù)常涉及敏感信息,如個(gè)人隱私數(shù)據(jù)、企業(yè)商業(yè)機(jī)密等。傳統(tǒng)數(shù)據(jù)共享方式在數(shù)據(jù)安全與隱私保護(hù)方面存在諸多漏洞,例如2023年某醫(yī)院病歷數(shù)據(jù)庫(kù)遭黑客攻擊,導(dǎo)致10萬(wàn)條隱私數(shù)據(jù)泄露,直接經(jīng)濟(jì)損失超2000萬(wàn)元,這些問(wèn)題嚴(yán)重阻礙了數(shù)據(jù)的有效共享。
現(xiàn)有研究已嘗試探索數(shù)據(jù)安全共享模式,早期方案多依賴集中式隱私計(jì)算,但存在計(jì)算開(kāi)銷大、單點(diǎn)故障風(fēng)險(xiǎn)等問(wèn)題。近年來(lái),區(qū)塊鏈與AI的融合成為研究熱點(diǎn):Google提出的聯(lián)邦學(xué)習(xí)框架實(shí)現(xiàn)了隱私保護(hù),但缺乏對(duì)模型參數(shù)篡改的防御機(jī)制;全同態(tài)加密算法雖能支持任意計(jì)算,但計(jì)算復(fù)雜度極高,難以適配AI模型的大規(guī)模訓(xùn)練;部分同態(tài)加密算法在浮點(diǎn)數(shù)計(jì)算上更適用于AI場(chǎng)景,但現(xiàn)有方案未明確密鑰分布式管理策略。
相比之下,本方案創(chuàng)新提出“區(qū)塊鏈+橫向聯(lián)邦學(xué)習(xí)+同態(tài)加密”的三層融合架構(gòu),在支持跨機(jī)構(gòu)協(xié)作訓(xùn)練的同時(shí),通過(guò)智能合約實(shí)現(xiàn)數(shù)據(jù)權(quán)屬的動(dòng)態(tài)更新。









































