摘要: 網絡安全碰見機器學習,會摩擦出怎樣的火花呢?
至關多的文章已經描述了機器學習在網絡安全的應用以及保護咱們免受網絡攻擊的能力。儘管如此,咱們仍然須要仔細研究人工智能(AI)、機器學習(ML)和深度學習(DL),它們到底能不能像炒做內容所說的無所不能。php
首先,我要讓你失望了。我經過研究發現與圖像識別或天然語言處理相比,機器學習永遠不會成爲網絡安全的靈丹妙藥,而這兩個領域的機器學習應用正在蓬勃發展。由於總會有人試圖找到系統或ML算法的弱點並繞過安全機制。更糟糕的是,如今黑客可以利用機器學習來完成他們邪惡想法。算法
幸運的是,機器學習能夠幫助解決最多見的任務,包括迴歸,預測和分類。在數據量極大且網絡安全人才短缺的時代,ML彷佛又是惟一的解決方案。編程
本文介紹了實際應用於網絡安全的ML研究的當前進展和將來方向的實用技術理解。安全
定義代表,網絡安全領域主要指機器學習(而不是AI),並且很大一部分任務與人類無關。網絡
機器學習意味着使用基於你擁有的數據和特定方法來解決某些任務。機器學習
大多數最多見的任務,以下所述:分佈式
對於某些任務,你只能使用一種方法,但能夠有多種方法用於其餘任務。工具
讓咱們看一下可用於解決機器學習任務的不一樣方法的示例,以及它們與網絡安全任務的關係。學習
迴歸(或預測)很簡單。利用關於現有數據的知識來了解新數據。舉一個房價預測的例子。在網絡安全中,它能夠應用於欺詐檢測,經過特徵(例如,可疑交易的總量,位置等)肯定欺詐行爲的機率。測試
至於迴歸這方面的技術,能夠分爲兩大類:機器學習和深度學習。
機器學習&迴歸
如下是可用於迴歸任務的機器學習方法的簡短列表(具備各自的優缺點)。
你能夠在此處找到每種方法的詳細說明 。
深度學習&迴歸
對於迴歸任務,可使用如下深度學習模型:
分類也很簡單。想象一下,你有兩堆按類型分類的圖片(例如,狗和貓)。在網絡安全方面,將垃圾郵件與其餘郵件分開的垃圾郵件過濾器能夠做爲一個例子。垃圾郵件過濾器多是應用於網絡安全任務的第一種ML方法。
監督學習方法通經常使用於分類,其中某些組的示例是已知的,全部類都應該在開頭定義。
下面是與算法相關的列表。
機器學習類
SVM和隨機森林這樣的方法被認爲是效果最好的,可是請記住,沒有一個通用的規則。
深度學習類
若是你有更多數據,深度學習方法會更好。可是,若是你計劃在生產中使用它並按期從新訓練系統,它們會消耗更多計算資源。
聚類是相似於具備惟一但有主要差別的分類方式。有關數據類的信息未知,大體意思是不知道這些數據是否能夠分類。這實際上是無人監督的學習。
據推測,聚類的最佳任務是取證分析。事件的緣由、過程和結果都很模糊,須要對全部活動進行分類以找出異常狀況。惡意軟件分析(即惡意軟件保護或安全電子郵件網關)的解決方案能夠實現它以將法律文件與異常值分開。
能夠應用聚類的另外一個有趣的領域是用戶行爲分析。在這種狀況下,應用程序用戶彙集在一塊兒,以即可以查看它們是否應屬於特定組。
一般,聚類不適用於解決網絡安全中的特定任務,由於它更像是管道中的子任務之一(例如,將用戶分組到單獨的組中以調整風險值)。
用於聚類的機器學習
用於聚類的深度學習
關聯規則學習(推薦系統)
Netflix和SoundCloud根據你的電影或音樂偏好推薦電影或歌曲。在網絡安全方面,這一原則主要用於事件響應。若是公司面臨一系列事件並提供各類類型的響應,系統會學習特定事件的響應類型(例如,將其標記爲誤報、更改風險值、進行調查)。若是風險管理解決方案自動爲新漏洞或基於其描述構建的錯誤配置分配風險值,那麼它們能夠帶來很大的便利。
解決推薦任務的算法:
關聯規則學習的深度學習
最新的推薦系統是基於首先玻爾茲曼機及其更新版本,例若有前途的深度新年網絡。
降維或泛化不像分類那樣受歡迎,但若是你處理具備未標記數據和許多潛在特徵的複雜系統,那必須進行降維。你沒法應用聚類,由於傳統的方法會限制特徵的數量,或者它們不起做用。降維能夠幫助處理它並減小沒必要要的特徵。與聚類同樣,降維一般是更復雜模型中的任務之一。對於網絡安全任務,降維是常見的面部檢測解決方案。
用於降維的機器學習
你能夠在此處找到有關降維的更多信息(包括方法及其功能的通常說明)。
生成模型的任務不一樣於上述模型,雖然這些任務涉及現有信息和相關決策,但生成模型旨在根據先前的決策模擬實際數據(而不是生成決策)。
攻擊性網絡安全的任務是生成輸入參數列表,以測試針對注入漏洞的特定應用程序。或者是擁有適用於Web應用程序的漏洞掃描工具。其中一個模塊是測試文件以進行未經受權的訪問。這些測試可以改變現有的文件名以識別新的文件名。例如,生成模型很擅長更擅長,若是爬蟲檢測到名爲login.php的文件,最好經過嘗試login_1.php,login_backup.php,login.php.2017等名稱來檢查是否存在任何備份或測試其副本。
用於生成模型的機器學習
用於生成模型的深度學習
最近,GANs取得了使人矚目的成績。他們成功地模仿了一段視頻,咱們能夠想象一下它如何用於生成模糊測試的示例。
本文爲雲棲社區原創內容,未經容許不得轉載。