后端融合模型的10折交叉驗證的準確率是%,對數(shù)損失是,,混淆矩陣如圖13所示,,規(guī)范化后的混淆矩陣如圖14所示。后端融合模型的roc曲線如圖15所示,,其顯示后端融合模型的auc值為,。(6)中間融合中間融合的架構如圖16所示,中間融合方式用深度神經網絡從三種模態(tài)的特征分別抽取高等特征表示,,然后合并學習得到的特征表示,,再作為下一個深度神經網絡的輸入訓練模型,隱藏層的***函數(shù)為relu,,輸出層的***函數(shù)是sigmoid,,中間使用dropout層進行正則化,防止過擬合,,優(yōu)化器(optimizer)采用的是adagrad,,batch_size是40。圖16中,,用于抽取dll和api信息特征視圖的深度神經網絡包含3個隱含層,,其***個隱含層的神經元個數(shù)是128,第二個隱含層的神經元個數(shù)是64,,第三個隱含層的神經元個數(shù)是32,,且3個隱含層中間間隔設置有dropout層。用于抽取格式信息特征視圖的深度神經網絡包含2個隱含層,,其***個隱含層的神經元個數(shù)是64,,其第二個隱含層的神經元個數(shù)是32,且2個隱含層中間設置有dropout層,。用于抽取字節(jié)碼n-grams特征視圖的深度神經網絡包含4個隱含層,,其***個隱含層的神經元個數(shù)是512,第二個隱含層的神經元個數(shù)是384,,第三個隱含層的神經元個數(shù)是256,,第四個隱含層的神經元個數(shù)是125。專業(yè)機構認證該程序內存管理效率優(yōu)于行業(yè)平均水平23%,。漏洞掃描一次多少錢
每一種信息的來源或者形式,,都可以稱為一種模態(tài),。例如,人有觸覺,,聽覺,,視覺,嗅覺,。多模態(tài)機器學習旨在通過機器學習的方法實現(xiàn)處理和理解多源模態(tài)信息的能力,。多模態(tài)學習從1970年代起步,經歷了幾個發(fā)展階段,,在2010年后***步入深度學習(deeplearning)階段,。在某種意義上,深度學習可以被看作是允許我們“混合和匹配”不同模型以創(chuàng)建復雜的深度多模態(tài)模型,。目前,,多模態(tài)數(shù)據(jù)融合主要有三種融合方式:前端融合(early-fusion)即數(shù)據(jù)水平融合(data-levelfusion)、后端融合(late-fusion)即決策水平融合(decision-levelfusion)以及中間融合(intermediate-fusion),。前端融合將多個**的數(shù)據(jù)集融合成一個單一的特征向量空間,,然后將其用作機器學習算法的輸入,訓練機器學習模型,,如圖1所示,。由于多模態(tài)數(shù)據(jù)的前端融合往往無法充分利用多個模態(tài)數(shù)據(jù)間的互補性,且前端融合的原始數(shù)據(jù)通常包含大量的冗余信息,。因此,,多模態(tài)前端融合方法常常與特征提取方法相結合以剔除冗余信息,基于領域經驗從每個模態(tài)中提取更高等別的特征表示,,或者應用深度學習算法直接學習特征表示,,然后在特性級別上進行融合。后端融合則是將不同模態(tài)數(shù)據(jù)分別訓練好的分類器輸出決策進行融合,,如圖2所示,。醫(yī)療軟件測試中心第三方測評顯示軟件運行穩(wěn)定性達99.8%,未發(fā)現(xiàn)重大系統(tǒng)崩潰隱患,。
生成取值表,。3把取值表與選擇的正交表進行映射控件數(shù)Ln(取值數(shù))3個控件5個取值5的3次冪混合正交表當控件的取值數(shù)目水平不一致時候,使用allp**rs工具生成1等價類劃分法劃分值2邊界值分析法邊界值3錯誤推斷法經驗4因果圖分析法關系5判定表法條件和結果6流程圖法流程路徑梳理7場景法主要功能和業(yè)務的事件8正交表先關注主要功能和業(yè)務流程,,業(yè)務邏輯是否正確實現(xiàn),,考慮場景法需要輸入數(shù)據(jù)的地方,考慮等價類劃分法+邊界值分析法,,發(fā)現(xiàn)程序錯誤的能力**強存在輸入條件的組合情況,,考慮因果圖判定表法多種參數(shù)配置組合情況,正交表排列法采用錯誤推斷法再追加測試用例。需求分析場景法分析主要功能輸入的等價類邊界值輸入的各種組合因果圖判定表多種參數(shù)配置正交表錯誤推斷法經驗軟件缺陷軟件產品中存在的問題,,用戶所需要的功能沒有完全實現(xiàn),。
先將當前軟件樣本件的二進制可執(zhí)行文件轉換為十六進制字節(jié)碼序列,,然后采用n-grams方法在十六進制字節(jié)碼序列中滑動,,產生大量的連續(xù)部分重疊的短序列特征,提取得到當前軟件樣本的二進制可執(zhí)行文件的字節(jié)碼n-grams的特征表示,。生成軟件樣本的dll和api信息特征視圖,,是先統(tǒng)計所有類別已知的軟件樣本的pe可執(zhí)行文件引用的dll和api信息,從中選取引用頻率**高的多個dll和api信息,;然后判斷當前的軟件樣本的導入節(jié)里是否存在選擇出的某個引用頻率**高的dll和api信息,,如存在,則將當前軟件樣本的該dll或api信息以1表示,,否則將其以0表示,,從而對當前軟件樣本的所有dll和api信息進行表示形成當前軟件樣本的dll和api信息特征視圖。生成軟件樣本的格式信息特征視圖,,是從當前軟件樣本的pe格式結構信息中選取可能區(qū)分惡意軟件和良性軟件的pe格式結構特征,,形成當前軟件樣本的格式信息特征視圖。從當前軟件樣本的pe格式結構信息中選取可能區(qū)分惡意軟件和良性軟件的pe格式結構特征,,是從當前軟件樣本的pe格式結構信息中確定存在特定格式異常的pe格式結構特征以及存在明顯的統(tǒng)計差異的格式結構特征,。特定格式異常包括:(1)代碼從**后一節(jié)開始執(zhí)行,(2)節(jié)頭部可疑的屬性,,,。功能完整性測試發(fā)現(xiàn)3項宣傳功能未完全實現(xiàn),。
12)把節(jié)裝入到vmm的地址空間,;(13)可選頭部的sizeofcode域取值不正確;(14)含有可疑標志,。此外,,惡意軟件和良性軟件間以下格式特征也存在明顯的統(tǒng)計差異:(1)證書表是軟件廠商的可認證的聲明,惡意軟件很少有證書表,,而良性軟件大部分都有軟件廠商可認證的聲明,;(2)惡意軟件的調試數(shù)據(jù)也明顯小于正常文件的,這是因為惡意軟件為了增加調試的難度,,很少有調試數(shù)據(jù),;(3)惡意軟件4個節(jié)(.text、.rsrc,、.reloc和.rdata)的characteristics屬性和良性軟件的也有明顯差異,,characteristics屬性通常**該節(jié)是否可讀、可寫、可執(zhí)行等,,部分惡意軟件的代碼節(jié)存在可寫異常,,只讀數(shù)據(jù)節(jié)和資源節(jié)存在可寫、可執(zhí)行異常等,;(4)惡意軟件資源節(jié)的資源個數(shù)也明顯少于良性軟件的,,如消息表、組圖表,、版本資源等,,這是因為惡意軟件很少使用圖形界面資源,也很少有版本信息,。pe文件很多格式屬性沒有強制限制,,文件完整性約束松散,存在著較多的冗余屬性和冗余空間,,為pe格式惡意軟件的傳播和隱藏創(chuàng)造了條件,。此外,由于惡意軟件為了方便傳播和隱藏,,盡一切可能的減小文件大小,,文件結構的某些部分重疊,同時對一些屬性進行了特別設置以達到anti-dump,、anti-debug或抗反匯編,。性能基準測試GPU利用率未達理論最大值67%。軟件能測試報告
用戶隱私測評確認數(shù)據(jù)采集范圍超出聲明條款3項,。漏洞掃描一次多少錢
此外格式結構信息具有明顯的語義信息,,但基于格式結構信息的檢測方法沒有提取決定軟件行為的代碼節(jié)和數(shù)據(jù)節(jié)信息作為特征。某一種類型的特征都從不同的視角反映刻畫了可執(zhí)行文件的一些性質,,字節(jié)碼n-grams,、dll和api信息、格式結構信息都部分捕捉到了惡意軟件和良性軟件間的可區(qū)分信息,,但都存在著一定的局限性,,不能充分、綜合,、整體的表示可執(zhí)行文件的本質,,使得檢測結果準確率不高、可靠性低,、泛化性和魯棒性不佳,。此外,惡意軟件通常偽造出和良性軟件相似的特征,,逃避反**軟件的檢測,。技術實現(xiàn)要素:本發(fā)明實施例的目的在于提供一種基于多模態(tài)深度學習的惡意軟件檢測方法,,以解決現(xiàn)有采用二進制可執(zhí)行文件的單一特征類型進行惡意軟件檢測的檢測方法檢測準確率不高、檢測可靠性低,、泛化性和魯棒性不佳的問題,,以及其難以檢測出偽造良性軟件特征的惡意軟件的問題。本發(fā)明實施例所采用的技術方案是,,基于多模態(tài)深度學習的惡意軟件檢測方法,,按照以下步驟進行:步驟s1、提取軟件樣本的二進制可執(zhí)行文件的dll和api信息,、pe格式結構信息以及字節(jié)碼n-grams的特征表示,,生成軟件樣本的dll和api信息特征視圖,、格式信息特征視圖以及字節(jié)碼n-grams特征視圖,。漏洞掃描一次多少錢