2018-2019-2 20189206 《密碼與安全新技術專題》 第三次做業

學號 2018-2019-2 《密碼與安全新技術專題》第三次做業

課程:《密碼與安全新技術專題》html

班級: 1892算法

姓名: 王子榛編程

學號:20189206安全

上課教師:金鑫服務器

上課日期:2019年2月25日網絡

1.本次講座的學習總結

基於深度學習的密碼分析與設計初探

人工智能

人工智能(Artificial Intelligence),英文縮寫爲AI。它是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。同時,人工智能所涉及的領域不少,機器學習只是其中的一個研究方向。框架

由上圖能夠看到,人工智能的領域十分普遍,包括機器學習

  • planning and scheduling 規劃與調度
  • Expert System 專家系統
    • 專家們的知識——即解決問題的方法與方式,可被保存和習得,它可被保存放在計算機設備中,並可被別人須要時使用。在人工智能中,專家系統是模擬人類專家決策能力的計算機系統。專家系統旨在經過知識體系推理來解決複雜問題,主要表現爲if-then規則而不是傳統的程序代碼。
  • multi-agent systems 多代理體系或自組織系統
    • 是多個交互的組成的計算機系統的智能代理。多代理系統能夠解決單個代理或單個系統難以或不可能解決的問題。智能能夠包括方法,功能,程序方法,算法搜索或強化學習。
  • Evolutionary Computation 進化計算
    • 在計算機科學領域,進化計算(Evolutionary Computation)是人工智能(Artificial Intelligence),進一步說是智能計算(Computational Intelligence)中涉及到組合優化問題的一個子域。其算法是受生物進化過程當中「優勝劣汰」的天然選擇機制和遺傳信息的傳遞規律的影響,經過程序迭代模擬這一過程,把要解決的問題看做環境,在一些可能的解組成的種羣中,經過天然演化尋求最優解。
  • Fussy Logic and Rough Set 粗糙邏輯模糊集
  • Knowledge Learning
  • Knowledge Representation 知識表示
    • 知識表示(knowledge representation)是指把知識客體中的知識因子與知識關聯起來,便於人們識別和理解知識。知識表示是知識組織的前提和基礎,任何知識組織方法都是要創建在知識表示的基礎上。知識表示有主觀知識表示和客觀知識表示兩種。
  • Recommender Systems 推薦系統
  • Robotics and Perception 機器人與感知

還有許多其餘的方向,在這裏不詳細介紹,接下來介紹機器學習。分佈式

機器學習

機器學習(Machine Learning, ML)是一門多領域交叉學科,涉及機率論、統計學、逼近論、凸分析、算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行爲,以獲取新的知識或技能,從新組織已有的知識結構使之不斷改善自身的性能。它是人工智能的核心,是使計算機具備智能的根本途徑,其應用遍佈人工智能的各個領域,它主要使用概括、綜合而不是演繹。機器學習的研究人員也是試圖從多個樣本與標籤配對來進行機器學習模型的求解(訓練)。函數

能夠看到,機器學習是利用樣本x,輸入函數中,獲得結果y,利用已有樣本x y訓練F(x) ,可以達到,輸入一個不包含在樣本集的x'能夠獲得正確的y',保證正確率可以保持在一個較高的水平,這就是我根據老師上的的理解,只是比較淺的理解,在之後的學習中繼續加深我對機器學習的理解。

<table><tr><td bgcolor=AntiqueWhite>機器學習與密碼分析</td></tr></table>

密碼分析與機器學習之間有自然的類似性,在密碼分析中,攻擊者試圖經過推算出密鑰來破解密碼系統。解密函數是從一個由密鑰索引的已知函數空間(解空間)求解出。攻擊者的目的是發現解密函數的精確解。若是攻擊者可以獲取多個獲取密文與明文配對來進行密碼分析,其與機器學習的概念類似:機器學習的研究人員也是試圖從多個樣本與標籤配對來進行機器學習模型的求解(訓練)。因此能夠將兩者進行結合,研究利用機器學習如何進行密碼分析。

<table><tr><td bgcolor=AntiqueWhite>機器學習的發展方向</td></tr></table>

從研究趨勢發展來看,愈來愈多的密碼分析方法開始使用機器學習技術,例如用於破解DES的遺傳算法、用於側信道分析的支撐向量機算法等。雖然主要的密碼系統的算法仍然難以破解,然而機器學習算法經過分析網絡流已經取得了很大的進步。

深度學習

深度學習的概念源於人工神經網絡的研究。含多隱層的多層感知器就是一種深度學習結構。深度學習經過組合低層特徵造成更加抽象的高層表示屬性類別或特徵,以發現數據的分佈式特徵表示。

深度學習是機器學習中一種基於對數據進行表徵學習的方法。觀測值(例如一幅圖像)可使用多種方式來表示,如每一個像素強度值的向量,或者更抽象地表示成一系列邊、特定形狀的區域等。而使用某些特定的表示方法更容易從實例中學習任務(例如,人臉識別或面部表情識別)。深度學習的好處是用非監督式或半監督式的特徵學習和分層特徵提取高效算法來替代手工獲取特徵。

<table><tr><td bgcolor=AntiqueWhite>深度學習的現狀</td></tr></table>

能夠看到深度學習是屬於機器學習中的一個分支,度學習技術掀起了人工智能研究與應用的新一輪浪潮,深度學習技術在多個方面取得了較大突破,其在人工智能系統中所佔的比例日趨增大,已經應用於多項實際場景業務系統中。

  • 人工神經網絡
    • 人工神經網絡的內部是一個黑盒子,就像咱們人類的大腦同樣,咱們不知道它內部的分析過程,咱們不知道它是如何識別出人臉的,也不知道它是如何戰勝圍棋世界冠軍的。咱們只是爲它構造了一個軀殼而已。人工神經網絡是受到人類大腦結構的啓發而創造,下圖是一我的工神經網絡的構造圖。
    • x是神經元的輸入,w是對應的權重,影響着每一個輸入x的刺激強度,網絡的結構越複雜,也就是深度神經網絡,訓練深度神經網絡的過程就稱爲深度學習。

  • 深度神經網絡( DNN: Deep Neural Networks )也有許多類型,例如:
    • 卷積神經網絡( CNN: Convolutional Neural Networks)
    • 循環神經網絡( RNN: Recurrent Neural Networks)
    • 生成對抗網絡( GAN: Generative Adversarial Networks)

深度學習與密碼分析

深度學習與密碼分析能夠分爲如下四類:

  • 基於卷積神經網絡的側信道攻擊

  • 基於循環神經網絡的明文破譯

  • 基於生成對抗網絡的口令破解

    • 經過測試集訓練對抗網絡判別口令的正確與錯誤,能夠實現破解口令的功能。
    • 對抗網絡

    生成式對抗網絡(GAN, Generative Adversarial Networks )是一種深度學習模型,是近年來複雜分佈上無監督學習最具前景的方法之一。模型經過框架中(至少)兩個模塊:生成模型(Generative Model)和判別模型(Discriminative Model)的互相博弈學習產生至關好的輸出。

  • 基於深度神經網絡的密碼基元識別

隨着加密算法的複雜性以及祕鑰長度的增長,明文破譯的難度也隨之增長,發展不如其餘方面那麼好,基於深度神經網絡的密碼基元能夠識別出加密所使用的的算法。

深度學習的最新進展

  • 知識驅動的深度學習
  • 深度森林
  • 圖深度學習

深度學習與密碼設計

隨着量子技術的快速發展對密碼技術產生了極大的威脅和挑戰,一旦量子計算機出現,對於離散對數、整數分解的公鑰密碼體制將被快速攻破,意味着網絡信息系統再也不安全。「組件化可變密碼算法設計與安全性評估」,「密文可編程數據安全存儲與計算」,兩大問題是解決如今密碼技術收到威脅的方法。

對於新密碼算法的設計需求將與日俱增,但目前人工設計密碼算法耗時耗力,難以適應將來密碼算法設計的需求,咱們提出————讓機器自動設計密碼算法

老師在課上以Google的案例:Google's neural networks invent their own encryption

谷歌Brain team團隊開始時有三個分別叫作愛麗絲,鮑勃和夏娃的神經網絡。每一個系統都通過培訓,以完善本身在溝通中的做用。Alice的工做是向Bob發送一條祕密消息,Bob的工做是解碼Alice發送的消息,而Eve的工做是試圖竊聽。

最初,神經網絡在發送祕密消息方面至關差。但隨着他們更多的練習,愛麗絲慢慢開發了本身的加密策略,鮑勃研究出如何解密它。 在場景播放15,000次以後,Bob可以將Alice的密文短信轉換回純文本,而Eve能夠猜想造成該消息的16位中的8位。因爲每一個位只有1或0,這與純粹機會所指望的成功率相同。

能夠看出,深度學習在密碼設計方面有着很大的發展前景。


2.學習中遇到的問題及解決

  • 問題1:深度神經網絡是如何將數據輸入到神經網絡中,又是如何進行預測的?
  • 問題1解決方案:神經網絡顧名思義是模仿人類的大腦結構,是一個黑盒子,之前的人工智能都是「假智能」,人類能夠清楚地知道它們的內部分析過程,而人工神經網絡,沒法知道它內部的分析過程,這也正是人工智能的可怕之處,所以世界上成立了很多安全協會來防範人工智能。

對於不一樣的應用,須要識別的對象多是圖片、視頻、語音等,但在計算機中都對應有數字的表示形式。在人工智能領域中,每個輸入到神經網絡的數據都被稱爲是一個特徵,即特徵向量。神經網絡通過訓練,接收到這個輸入,進行預測。預測是由公式進行計算,經過學習獲得當計算結果大於某個值會被預測爲某種結果,那麼當咱們輸入數據,根據權重進行計算,若是結果大於某個值,預測爲某種結果。

  • 問題2:什麼是卷積神經網絡?
  • 問題2解決方案:在課上咱們知道卷積神經網絡是深度神經網絡中的一種,在神經網絡與密碼分析中,老師講到基於卷積神經網絡的側信道攻擊,因此我經過百度、CSDN博客等方式進行了必定的瞭解。

卷積神經網絡(Convolutional Neural Networks, CNN)是一類包含卷積計算且具備深度結構的前饋神經網絡(Feedforward Neural Networks),是深度學習(deep learning)的表明算法之一。因爲卷積神經網絡可以進行平移不變分類(shift-invariant classification),所以也被稱爲「平移不變人工神經網絡(Shift-Invariant Artificial Neural Networks, SIANN)」。

卷積神經網絡仿造生物的視知覺(visual perception)機制構建,能夠進行監督學習和非監督學習,其隱含層內的卷積核參數共享和層間鏈接的稀疏性使得卷積神經網絡可以以較小的計算量對格點化(grid-like topology)特徵,例如像素和音頻進行學習、有穩定的效果且對數據沒有額外的特徵工程(feature engineering)要求。

卷積神經網絡的層級結構:

  • 數據輸入層/ Input layer:該層要作的處理主要是對原始圖像數據進行預處理,
  • 卷積計算層/ CONV layer:這一層就是卷積神經網絡最重要的一個層次,也是「卷積神經網絡」的名字來源。 在這個卷積層,有兩個關鍵操做:
    • 局部關聯。每一個神經元看作一個濾波器(filter)
    • 窗口(receptive field)滑動, filter對局部數據計算
  • ReLU激勵層 / ReLU layer:把卷積層輸出結果作非線性映射。
  • 池化層 / Pooling layer:池化層夾在連續的卷積層中間, 用於壓縮數據和參數的量,減少過擬合。
  • 全鏈接層 / FC layer:兩層之間全部神經元都有權重鏈接,一般全鏈接層在卷積神經網絡尾部。

3.本次講座的學習感悟、思考等)

做爲這幾年中很是熱門的研究方向,老師在課上用通俗易通的方式帶咱們初步瞭解了深度學習和機器學習,打開咱們的思路。剛剛開始的時候並不明白什麼是機器學習,利用機器學習到底可以作什麼事情。咱們做爲密碼專業的學生,機器學習與咱們有沒有什麼能夠聯繫到一塊兒的點。

後來明白,人工智能是一個很是寬泛的概念,每個研究方式的背後又是一個寬泛的世界。根據老師在課上的介紹,咱們能夠知道,機器學習在密碼方面的研究還能夠進一步深刻,還有不少方面沒有能將兩者結合在一塊兒。也是咱們在之後的學習中須要探索的。

4.最新研究現狀

<font ><table><tr><td bgcolor=#F8F8FF>Fast, Lean, and Accurate: Modeling Password Guessability Using Neural Networks</font></td></tr></table>

  • 會議名稱:25th USENIX Symposium on Networked Systems Design and Implementation
  • 做者:William Melicher, Blase Ur, Sean M. Segreti, Saranga Komanduri, Lujo Bauer
  • 論文題目:快速,精益和準確:使用神經網絡建模密碼可猜想性

文章提出現今採用的密碼方式存在不安全的因素,經過神經網絡檢查密碼的安全性,能夠幫助更好地檢測口令的安全性。這篇文章主要檢測用戶口令的安全性,並非咱們的密碼學中的密碼,這是須要強調的一點。

人類選擇的文本密碼是當今主要的身份驗證形式,容易受到猜想攻擊。遺憾的是,經過對對等密碼猜想建模來評估密碼強度的現有方法要麼不許確,要麼數量級太大並且對於實時的客戶端密碼檢查來講太慢。文章建議使用人工神經網絡來模擬文本密碼對猜想攻擊的抵抗力,並探索不一樣的體系結構和訓練方法如何影響神經網絡的猜想效果。實踐代表,神經網絡一般能夠比最早進的方法更有效地猜想密碼,例如機率上下文無關語法和馬爾可夫模型。咱們還代表,咱們的神經網絡能夠高度壓縮到幾百千字節,而不會顯着惡化猜想效果。基於這些結果,咱們在JavaScript中實現了密碼猜想的第一個原則客戶端模型,該模型分析密碼對任意持續時間的猜想攻擊的抵抗力,具備亞秒級延遲。總之,本文的貢獻使得密碼檢查可以比之前更加準確和實用。

<font ><table><tr><td bgcolor=#F8F8FF>Membership Inference Attacks Against Machine Learning Models</font></td></tr></table>

  • 會議名稱:38th IEEE Symposium on Security and Privacy
  • 做者:Reza Shokri,Marco Stronati,Congzheng Song,and Vitaly Shmatikov
  • 論文題目:經過預測API竊取機器學習模型

文章提出了機器學習存在的隱私泄露的問題,機器學習在解決問題以前須要接受數據集的訓練,而這些數據集每每包含着用戶的我的隱私。可是,機器學習模型不斷地被部署,經過公共訪問接口訪問模型, 例如機器學習即服務( Machine Learning as a service, MLaaS):用戶能夠在MLaaS 平臺利用隱私敏感數據訓練機器學習模型,而且將訪問接口發佈給其餘用戶使用,同時收取必定的費用。

針對機器學習模型機密性和其公共訪問的矛盾上,筆者提出了機器學習模型提取攻擊:攻擊者在沒有任何關於該模型的先驗知識(訓練數據,模型參數,模型類型等)狀況下,只利用公共訪問接口對該模型的黑盒訪問,從而構造出和目標模型類似度很是高的模型。

文章定量研究機器學習模型如何泄漏有關他們接受培訓的我的數據記錄的信息。關注基本的成員資格推理攻擊:給定數據記錄和對模型的黑匣子訪問,肯定記錄是否在模型的訓練數據集中。爲了對目標模型進行成員資格推理,咱們進行機器學習的對抗性使用並訓練咱們本身的推理模型,以識別目標模型對其訓練的輸入與其未訓練的輸入的預測的差別。咱們根據Google和亞馬遜等商業「機器學習即服務」提供商培訓的分類模型,對咱們的推理技術進行了實證評估。使用真實的數據集和分類任務,包括其成員資格從隱私角度敏感的出院數據集,咱們代表這些模型易受成員資格推斷攻擊。而後,咱們調查影響這種泄漏的因素並評估緩解策略。

<font ><table><tr><td bgcolor=#F8F8FF>SecureML: A System for Scalable Privacy-Preserving Machine Learning</font></td></tr></table>

  • 會議名稱:38th IEEE Symposium on Security and Privacy
  • 做者:Payman Mohassel and Yupeng Zhang
  • 論文題目:SecureML可擴展隱私保護機器學習系統

機器學習在實踐中被普遍用於爲諸如圖像處理,語音和文本識別的應用產生預測模型。在對從不一樣來源收集的大量數據進行培訓時,這些模型更加準確。可是,海量數據收集引起了隱私問題。在本文中,咱們提出了新的和有效的隱私保護機器學習協議,用於線性迴歸,邏輯迴歸和使用隨機梯度降低法的神經網絡訓練。咱們的協議屬於雙服務器模型,其中數據全部者在兩個非串通服務器之間分發其私有數據,這兩個服務器使用安全的雙方計算(2PC)在聯合數據上訓練各類模型。咱們開發了新的技術來支持對共享十進制數的安全算術運算,並提出了對非線性函數(如sigmoid和softmax)的MPC友好替代方案,這些方法優於之前的工做。咱們用C ++實現咱們的系統。咱們的實驗證明,咱們的協議比隱私保護線性和邏輯迴歸的現有技術實現快幾個數量級,而且能夠擴展到具備數千個特徵的數百萬個數據樣本。咱們還實施了第一個用於訓練神經網絡的隱私保護系統。

<font ><table><tr><td bgcolor=#F8F8FF>Structure2vec: Deep Learning for Security Analytics over Graphs</font></td></tr></table>

  • 會議名稱:2018 USENIX Security and AI Networking Conference
  • 做者:Le Song
  • 論文題目:Structure2vec基於圖形的安全分析的深度學習

網絡和圖表在許多現實世界的應用中是廣泛的,例如在線社交網絡,支付平臺中的交易,推薦系統中的用戶項交互以及知識庫中的關係信息。大量圖形數據的可用性帶來了巨大的新挑戰。如何表示此類數據以捕獲相關實體之間的類似性或差別?如何根據大量此類數據學習預測模型並執行推理?之前的深度學習模型,如CNN和RNN,是爲圖像和序列設計的,但它們不適用於圖形數據。 在本文中,介紹一個名爲Structure2Vec的嵌入框架,用於以端到端的方式學習圖形數據的表示。Structure2Vec提供了一個統一的框架,用於整合來自節點特徵,邊緣特徵,異構網絡結構和網絡動態的信息,並將它們與下游監督和無監督學習以及強化學習聯繫起來。還將討論安全分析中的幾個應用程序,其中Structure2Vec比之前的最新技術有了顯着的改進。

<font ><table><tr><td bgcolor=#F8F8FF>Automating the Discovery and Investigation of Targeted Attacks with AI and Machine Learning</font></td></tr></table>

  • 會議名稱:2018 USENIX Security and AI Networking Conference
  • 做者:Alejandro Borgia
  • 論文題目:利用AI和機器學習自動發現和調查目標攻擊

目標攻擊是當今企業安全面臨的最危險威脅之一。然而,在安全系統產生的大量警報下,它們經常被隱藏起來,使攻擊者有時間訪問系統並獲取有價值的數據。賽門鐵克的新型目標攻擊分析(TAA)技術利用先進的機器學習功能,自動發現目標攻擊,識別真正有針對性的活動,並以高度可靠的事件報告的形式對其進行優先排序。TAA是賽門鐵克攻擊調查團隊與賽門鐵克頂級安全數據科學家團隊在機器學習研究領域的內部聯合努力的結果,分析了來自最大的威脅數據之一的普遍數據。同時提供全球自動化目標威脅檢測。

參考資料

相關文章
相關標籤/搜索