環(huán)球最新:引入對抗性訓(xùn)練可以讓人工智能更難被攻擊和愚弄
(資料圖片)
洛斯阿拉莫斯國家實驗室的研究人員開發(fā)了一種比較神經(jīng)網(wǎng)絡(luò)的新方法,該方法著眼于人工智能的"黑箱",以幫助研究人員理解神經(jīng)網(wǎng)絡(luò)的行為。神經(jīng)網(wǎng)絡(luò)可以識別數(shù)據(jù)集中的模式,并被用于虛擬助手、面部識別系統(tǒng)和自動駕駛汽車等不同的應(yīng)用中。
洛斯阿拉莫斯網(wǎng)絡(luò)系統(tǒng)高級研究小組的研究員海頓-瓊斯說:"人工智能研究界不一定完全了解神經(jīng)網(wǎng)絡(luò)在做什么;它們給了我們很好的結(jié)果,但我們不知道如何或為什么,我們的新方法在比較神經(jīng)網(wǎng)絡(luò)方面做得更好,這是朝著更好地理解人工智能背后的數(shù)學(xué)的關(guān)鍵一步。"
洛斯阿拉莫斯的研究人員正在研究比較神經(jīng)網(wǎng)絡(luò)的新方法。這張圖片是用一個叫穩(wěn)定擴散的人工智能軟件創(chuàng)建的,使用的提示是"窺視神經(jīng)網(wǎng)絡(luò)的黑匣子"。
瓊斯是最近在人工智能不確定性會議上發(fā)表的一篇論文的主要作者。這篇論文除了研究網(wǎng)絡(luò)的相似性之外,也是描述魯棒神經(jīng)網(wǎng)絡(luò)行為的重要一步。
神經(jīng)網(wǎng)絡(luò)是高性能的,但也是脆弱的。例如,自主車輛采用神經(jīng)網(wǎng)絡(luò)來識別道路標志。在完美的情況下,它們相當(dāng)善于這樣做。然而,神經(jīng)網(wǎng)絡(luò)可能會錯誤地檢測到一個標志,如果有哪怕是最輕微的異常,如停止標志上的貼紙就可以形成對人工智能的攻擊,并且后者并不會因此而停下來。
因此,為了改進神經(jīng)網(wǎng)絡(luò),研究人員正在尋找提高網(wǎng)絡(luò)魯棒性的策略。一種最先進的方法是在網(wǎng)絡(luò)被訓(xùn)練時對其進行"攻擊"。人工智能被訓(xùn)練成可以忽略研究人員有目的地引入的異常情況。從本質(zhì)上講,這種被稱為對抗性訓(xùn)練的技術(shù),使欺騙網(wǎng)絡(luò)變得更加困難。
在一個令人驚訝的發(fā)現(xiàn)中,瓊斯和他在洛斯阿拉莫斯的合作者雅各布-斯普林格和加勒特-凱尼恩,以及瓊斯的導(dǎo)師賈斯頓-摩爾,將他們新的網(wǎng)絡(luò)相似性指標應(yīng)用于對抗性訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。他們發(fā)現(xiàn),隨著攻擊嚴重程度的增加,對抗性訓(xùn)練導(dǎo)致計算機視覺領(lǐng)域的神經(jīng)網(wǎng)絡(luò)收斂到非常相似的數(shù)據(jù)表示,而不考慮網(wǎng)絡(luò)架構(gòu)。
"我們發(fā)現(xiàn),當(dāng)我們訓(xùn)練神經(jīng)網(wǎng)絡(luò)對對抗性攻擊具有魯棒性時,它們開始做同樣的事情,"瓊斯說。
工業(yè)界和學(xué)術(shù)界一直在努力尋找神經(jīng)網(wǎng)絡(luò)的"正確架構(gòu)",但洛斯阿拉莫斯團隊的發(fā)現(xiàn)表明,引入對抗性訓(xùn)練后,這一搜索空間大大縮小。因此,人工智能研究界可能不需要花那么多時間去探索新的架構(gòu),因為他們知道對抗性訓(xùn)練會使不同的架構(gòu)收斂到類似的解決方案。
"通過發(fā)現(xiàn)健壯的神經(jīng)網(wǎng)絡(luò)彼此相似,我們正在使人們更容易理解健壯的人工智能可能真的如何工作。"瓊斯說:"我們甚至可能會發(fā)現(xiàn)關(guān)于人類和其他動物的感知是如何發(fā)生的暗示。
關(guān)鍵詞: 人工智能 引入對抗性訓(xùn)練可以讓人工智能更難被攻擊和
相關(guān)新聞