在不知道多長的子序列能更好的表示可執(zhí)行文件的情況下,,只能以固定窗口大小在字節(jié)碼序列中滑動,,產生大量的短序列,由機器學習方法選擇可能區(qū)分惡意軟件和良性軟件的短序列作為特征,,產生短序列的方法叫n-grams,?!?80074ff13b2”的字節(jié)碼序列,如果以3-grams產生連續(xù)部分重疊的短序列,,將得到“080074”,、“0074ff”、“74ff13”,、“ff13b2”四個短序列,。每個短序列特征的權重表示有多種方法。**簡單的方法是如果該短序列在具體樣本中出現,,就表示為1,;如果沒有出現,就表示為0,,也可以用,。本實施例采用3-grams方法提取特征,3-grams產生的短序列非常龐大,,將產生224=(16,777,216)個特征,,如此龐大的特征集在計算機內存中存儲和算法效率上都是問題。如果短序列特征的tf較小,,對機器學習可能沒有意義,,選取了tf**高的5000個短序列特征,,計算每個短序列特征的,每個短序列特征的權重是判斷其所在軟件樣本是否為惡意軟件的依據,,也是區(qū)分每個軟件樣本的依據,。(4)前端融合前端融合的架構如圖4所示,前端融合方式將三種模態(tài)的特征合并,,然后輸入深度神經網絡,,隱藏層的***函數為relu,輸出層的***函數是sigmoid,,中間使用dropout層進行正則化,,防止過擬合,優(yōu)化器,。數據安全與合規(guī):艾策科技的最佳實踐,。蘭州第三方軟件評測實驗室
此外格式結構信息具有明顯的語義信息,但基于格式結構信息的檢測方法沒有提取決定軟件行為的代碼節(jié)和數據節(jié)信息作為特征,。某一種類型的特征都從不同的視角反映刻畫了可執(zhí)行文件的一些性質,,字節(jié)碼n-grams、dll和api信息,、格式結構信息都部分捕捉到了惡意軟件和良性軟件間的可區(qū)分信息,,但都存在著一定的局限性,不能充分,、綜合,、整體的表示可執(zhí)行文件的本質,使得檢測結果準確率不高,、可靠性低,、泛化性和魯棒性不佳。此外,,惡意軟件通常偽造出和良性軟件相似的特征,,逃避反**軟件的檢測。技術實現要素:本發(fā)明實施例的目的在于提供一種基于多模態(tài)深度學習的惡意軟件檢測方法,,以解決現有采用二進制可執(zhí)行文件的單一特征類型進行惡意軟件檢測的檢測方法檢測準確率不高,、檢測可靠性低、泛化性和魯棒性不佳的問題,,以及其難以檢測出偽造良性軟件特征的惡意軟件的問題,。本發(fā)明實施例所采用的技術方案是,基于多模態(tài)深度學習的惡意軟件檢測方法,,按照以下步驟進行:步驟s1,、提取軟件樣本的二進制可執(zhí)行文件的dll和api信息、pe格式結構信息以及字節(jié)碼n-grams的特征表示,,生成軟件樣本的dll和api信息特征視圖,、格式信息特征視圖以及字節(jié)碼n-grams特征視圖。第三方軟件質量測試報價負載測試證實系統最大承載量較宣傳數據低18%,。
軟件測試技術測試分類編輯軟件測試的狹義論和廣義論——靜態(tài)和動態(tài)的測試軟件測試技術軟件測試的辨證論——正向思維和反向思維軟件測試的風險論——測試是評估軟件測試的經濟學觀點——為盈利而測試軟件測試的標準論——驗證和確認軟件測試技術測試工具編輯幾種常用的測試工具:1,、軟件錯誤管理工具Bugzilla2、功能測試工具WinRunner3,、負載測試工具LoadRunner4,、測試管理工具TestDirector軟件測試技術同名圖書編輯軟件測試技術圖書1書名:軟件測試技術軟件測試技術作者:曲朝陽出版社:**水利水電出版社出版時間:2006ISBN:97開本:16定價:元內容簡介本書詳盡地闡述了軟件測試領域中的一些基本理論和實用技術。首先從軟件測試的基本原則,,以及常用的軟件測試技術入手,,介紹了與軟件測試領域相關的基礎知識。然后,,分別從單元測試,、集成測試和系統測試3個層面深入分析了如何選擇和設計有效的測試用例,制定合適的測試策略等主題,。**后,,討論了面向對象的軟件測試和軟件測試自動化技術。附錄中還附錄了常見的軟件錯誤,,供讀者參閱,。本書作為軟件測試的實際應用參考書,除了力求突出基本知識和基本概念的表述外,,更注重軟件測試技術的運用,。
[1]中文名軟件測試方法外文名SoftwareTestingMethod目的測試軟件性能所屬行業(yè)計算機作用選擇合適的軟件目錄1概述2原則3分類?靜態(tài)測試和動態(tài)測試?黑盒測試、白盒測試和灰盒測試?手動測試和自動化測試4不同階段測試?單元測試?集成測試?系統測試?驗收測試5重要性軟件測試方法概述編輯軟件測試方法的目的包括:發(fā)現軟件程序中的錯誤,、對軟件是否符合設計要求,,以及是否符合合同中所要達到的技術要求,進行有關驗證以及評估軟件的質量,。**終實現將高質量的軟件系統交給用戶的目的,。而軟件的基本測試方法主要有靜態(tài)測試和動態(tài)測試、功能測試,、性能測試,、黑盒測試和白盒測試等等。[2]軟件測試方法眾多,,比較常用到的測試方法有等價類劃分,、場景法,偶爾會使用到的測試方法有邊界值和判定表,,還有包括不經常使用到的正交排列法和測試大綱法,。其中等價類劃分、邊界值分析,、判定表等屬于黑盒測試方法,;只對功能是否可以滿足規(guī)定要求進行檢查,,主要用于軟件的確認測試階段。白盒測試也叫做結構測試或邏輯驅動測試,,是基于覆蓋的全部代碼和路徑,、條件的測試,通過測試檢測產品內部性能,,檢驗程序中的路徑是否可以按照要求完成工作,,但是并不對功能進行測試,主要用于軟件的驗證,。安全掃描確認軟件通過ISO 27001標準,,無高危漏洞記錄。
本發(fā)明屬于惡意軟件防護技術領域::,,涉及一種基于多模態(tài)深度學習的惡意軟件檢測方法,。背景技術:::惡意軟件是指在未明確提示用戶或未經用戶許可的情況下,故意編制或設置的,,對網絡或系統會產生威脅或潛在威脅的計算機軟件,。常見的惡意軟件有計算機**(簡稱**)、特洛伊木馬(簡稱木馬),、計算機蠕蟲(簡稱蠕蟲),、后門、邏輯**等,。惡意軟件可能在用戶不知情的情況下竊取計算機用戶的信息和隱私,,也可能非法獲得計算機系統和網絡資源的控制,破壞計算機和網絡的可信性,、完整性和可用性,,從而為惡意軟件控制者謀取非法利益。騰訊安全發(fā)布的《2017年度互聯網安全報告》顯示,,2017年騰訊電腦管家pc端總計攔截**近30億次,,平均每月攔截木馬**近,共發(fā)現**或木馬***,。這些數目龐大,、名目繁多的惡意軟件侵蝕著我國的***、經濟,、文化,、***等各個領域的信息安全,帶來了前所未有的挑戰(zhàn),。當前的反**軟件主要采用基于特征碼的檢測方法,,這種方法通過對代碼進行充分研究,獲得惡意軟件特征值(即每種惡意軟件所獨有的十六進制代碼串),,如字節(jié)序列,、特定的字符串等,,通過匹配查找軟件中是否包含惡意軟件特征庫中的特征碼來判斷其是否為惡意軟件??缭O備測試報告指出平板端UI元素存在比例失調問題,。遼寧軟件測試實驗室
艾策檢測團隊采用多模態(tài)傳感器融合技術,構建智能工廠設備狀態(tài)健康監(jiān)測體系,。蘭州第三方軟件評測實驗室
3)pe可選頭部有效尺寸的值不正確,(4)節(jié)之間的“間縫”,,(5)可疑的代碼重定向,,(6)可疑的代碼節(jié)名稱,(7)可疑的頭部***,,(8)來自,,(9)導入地址表被修改,(10)多個pe頭部,,(11)可疑的重定位信息,,(12)把節(jié)裝入到vmm的地址空間,(13)可選頭部的sizeofcode域取值不正確,,(14)含有可疑標志,。存在明顯的統計差異的格式結構特征包括:(1)無證書表;(2)調試數據明顯小于正常文件,,(3).text,、.rsrc、.reloc和.rdata的characteristics屬性異常,,(4)資源節(jié)的資源個數少于正常文件,。生成軟件樣本的字節(jié)碼n-grams特征視圖,是統計了每個短序列特征的詞頻(termfrequency,,tf),,即該短序列特征在軟件樣本中出現的頻率。先從當前軟件樣本的所有短序列特征中選取詞頻tf**高的多個短序列特征,;然后計算選取的每個短序列特征的逆向文件頻率idf與詞頻tf的乘積,,并將其作為選取的每個短序列特征的特征值,,,表示該短序列特征表示其所在軟件樣本的能力越強,;**后在選取的詞頻tf**高的多個短序列特征中選取,生成字節(jié)碼n-grams特征視圖,。:=tf×idf,;tf(termfrequency)是詞頻,定義如下:其中,,ni,j是短序列特征i在軟件樣本j中出現的次數,,∑knk,j指軟件樣本j中所有短序列特征出現的次數之和,。蘭州第三方軟件評測實驗室