在不知道多長的子序列能更好的表示可執(zhí)行文件的情況下,只能以固定窗口大小在字節(jié)碼序列中滑動(dòng),,產(chǎn)生大量的短序列,,由機(jī)器學(xué)習(xí)方法選擇可能區(qū)分惡意軟件和良性軟件的短序列作為特征,產(chǎn)生短序列的方法叫n-grams,?!?80074ff13b2”的字節(jié)碼序列,如果以3-grams產(chǎn)生連續(xù)部分重疊的短序列,,將得到“080074”,、“0074ff”、“74ff13”,、“ff13b2”四個(gè)短序列,。每個(gè)短序列特征的權(quán)重表示有多種方法。**簡單的方法是如果該短序列在具體樣本中出現(xiàn),,就表示為1,;如果沒有出現(xiàn),就表示為0,,也可以用,。本實(shí)施例采用3-grams方法提取特征,3-grams產(chǎn)生的短序列非常龐大,,將產(chǎn)生224=(16,777,216)個(gè)特征,,如此龐大的特征集在計(jì)算機(jī)內(nèi)存中存儲(chǔ)和算法效率上都是問題。如果短序列特征的tf較小,,對(duì)機(jī)器學(xué)習(xí)可能沒有意義,,選取了tf**高的5000個(gè)短序列特征,計(jì)算每個(gè)短序列特征的,,每個(gè)短序列特征的權(quán)重是判斷其所在軟件樣本是否為惡意軟件的依據(jù),,也是區(qū)分每個(gè)軟件樣本的依據(jù)。(4)前端融合前端融合的架構(gòu)如圖4所示,,前端融合方式將三種模態(tài)的特征合并,,然后輸入深度神經(jīng)網(wǎng)絡(luò),隱藏層的***函數(shù)為relu,,輸出層的***函數(shù)是sigmoid,,中間使用dropout層進(jìn)行正則化,防止過擬合,,優(yōu)化器,。數(shù)據(jù)安全與合規(guī):艾策科技的最佳實(shí)踐。蘭州第三方軟件評(píng)測(cè)實(shí)驗(yàn)室
此外格式結(jié)構(gòu)信息具有明顯的語義信息,但基于格式結(jié)構(gòu)信息的檢測(cè)方法沒有提取決定軟件行為的代碼節(jié)和數(shù)據(jù)節(jié)信息作為特征,。某一種類型的特征都從不同的視角反映刻畫了可執(zhí)行文件的一些性質(zhì),,字節(jié)碼n-grams、dll和api信息,、格式結(jié)構(gòu)信息都部分捕捉到了惡意軟件和良性軟件間的可區(qū)分信息,,但都存在著一定的局限性,不能充分,、綜合,、整體的表示可執(zhí)行文件的本質(zhì),使得檢測(cè)結(jié)果準(zhǔn)確率不高,、可靠性低,、泛化性和魯棒性不佳。此外,,惡意軟件通常偽造出和良性軟件相似的特征,,逃避反**軟件的檢測(cè)。技術(shù)實(shí)現(xiàn)要素:本發(fā)明實(shí)施例的目的在于提供一種基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測(cè)方法,,以解決現(xiàn)有采用二進(jìn)制可執(zhí)行文件的單一特征類型進(jìn)行惡意軟件檢測(cè)的檢測(cè)方法檢測(cè)準(zhǔn)確率不高,、檢測(cè)可靠性低、泛化性和魯棒性不佳的問題,,以及其難以檢測(cè)出偽造良性軟件特征的惡意軟件的問題,。本發(fā)明實(shí)施例所采用的技術(shù)方案是,基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測(cè)方法,,按照以下步驟進(jìn)行:步驟s1,、提取軟件樣本的二進(jìn)制可執(zhí)行文件的dll和api信息,、pe格式結(jié)構(gòu)信息以及字節(jié)碼n-grams的特征表示,,生成軟件樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖,。第三方軟件質(zhì)量測(cè)試報(bào)價(jià)負(fù)載測(cè)試證實(shí)系統(tǒng)最大承載量較宣傳數(shù)據(jù)低18%,。
軟件測(cè)試技術(shù)測(cè)試分類編輯軟件測(cè)試的狹義論和廣義論——靜態(tài)和動(dòng)態(tài)的測(cè)試軟件測(cè)試技術(shù)軟件測(cè)試的辨證論——正向思維和反向思維軟件測(cè)試的風(fēng)險(xiǎn)論——測(cè)試是評(píng)估軟件測(cè)試的經(jīng)濟(jì)學(xué)觀點(diǎn)——為盈利而測(cè)試軟件測(cè)試的標(biāo)準(zhǔn)論——驗(yàn)證和確認(rèn)軟件測(cè)試技術(shù)測(cè)試工具編輯幾種常用的測(cè)試工具:1、軟件錯(cuò)誤管理工具Bugzilla2,、功能測(cè)試工具WinRunner3,、負(fù)載測(cè)試工具LoadRunner4、測(cè)試管理工具TestDirector軟件測(cè)試技術(shù)同名圖書編輯軟件測(cè)試技術(shù)圖書1書名:軟件測(cè)試技術(shù)軟件測(cè)試技術(shù)作者:曲朝陽出版社:**水利水電出版社出版時(shí)間:2006ISBN:97開本:16定價(jià):元內(nèi)容簡介本書詳盡地闡述了軟件測(cè)試領(lǐng)域中的一些基本理論和實(shí)用技術(shù),。首先從軟件測(cè)試的基本原則,,以及常用的軟件測(cè)試技術(shù)入手,介紹了與軟件測(cè)試領(lǐng)域相關(guān)的基礎(chǔ)知識(shí),。然后,,分別從單元測(cè)試、集成測(cè)試和系統(tǒng)測(cè)試3個(gè)層面深入分析了如何選擇和設(shè)計(jì)有效的測(cè)試用例,制定合適的測(cè)試策略等主題,。**后,,討論了面向?qū)ο蟮能浖y(cè)試和軟件測(cè)試自動(dòng)化技術(shù)。附錄中還附錄了常見的軟件錯(cuò)誤,,供讀者參閱,。本書作為軟件測(cè)試的實(shí)際應(yīng)用參考書,除了力求突出基本知識(shí)和基本概念的表述外,,更注重軟件測(cè)試技術(shù)的運(yùn)用,。
[1]中文名軟件測(cè)試方法外文名SoftwareTestingMethod目的測(cè)試軟件性能所屬行業(yè)計(jì)算機(jī)作用選擇合適的軟件目錄1概述2原則3分類?靜態(tài)測(cè)試和動(dòng)態(tài)測(cè)試?黑盒測(cè)試、白盒測(cè)試和灰盒測(cè)試?手動(dòng)測(cè)試和自動(dòng)化測(cè)試4不同階段測(cè)試?單元測(cè)試?集成測(cè)試?系統(tǒng)測(cè)試?驗(yàn)收測(cè)試5重要性軟件測(cè)試方法概述編輯軟件測(cè)試方法的目的包括:發(fā)現(xiàn)軟件程序中的錯(cuò)誤,、對(duì)軟件是否符合設(shè)計(jì)要求,,以及是否符合合同中所要達(dá)到的技術(shù)要求,進(jìn)行有關(guān)驗(yàn)證以及評(píng)估軟件的質(zhì)量,。**終實(shí)現(xiàn)將高質(zhì)量的軟件系統(tǒng)交給用戶的目的,。而軟件的基本測(cè)試方法主要有靜態(tài)測(cè)試和動(dòng)態(tài)測(cè)試、功能測(cè)試,、性能測(cè)試,、黑盒測(cè)試和白盒測(cè)試等等。[2]軟件測(cè)試方法眾多,,比較常用到的測(cè)試方法有等價(jià)類劃分,、場(chǎng)景法,偶爾會(huì)使用到的測(cè)試方法有邊界值和判定表,,還有包括不經(jīng)常使用到的正交排列法和測(cè)試大綱法,。其中等價(jià)類劃分、邊界值分析,、判定表等屬于黑盒測(cè)試方法,;只對(duì)功能是否可以滿足規(guī)定要求進(jìn)行檢查,主要用于軟件的確認(rèn)測(cè)試階段,。白盒測(cè)試也叫做結(jié)構(gòu)測(cè)試或邏輯驅(qū)動(dòng)測(cè)試,,是基于覆蓋的全部代碼和路徑、條件的測(cè)試,,通過測(cè)試檢測(cè)產(chǎn)品內(nèi)部性能,,檢驗(yàn)程序中的路徑是否可以按照要求完成工作,但是并不對(duì)功能進(jìn)行測(cè)試,,主要用于軟件的驗(yàn)證,。安全掃描確認(rèn)軟件通過ISO 27001標(biāo)準(zhǔn),無高危漏洞記錄,。
本發(fā)明屬于惡意軟件防護(hù)技術(shù)領(lǐng)域::,,涉及一種基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測(cè)方法,。背景技術(shù):::惡意軟件是指在未明確提示用戶或未經(jīng)用戶許可的情況下,故意編制或設(shè)置的,,對(duì)網(wǎng)絡(luò)或系統(tǒng)會(huì)產(chǎn)生威脅或潛在威脅的計(jì)算機(jī)軟件,。常見的惡意軟件有計(jì)算機(jī)**(簡稱**)、特洛伊木馬(簡稱木馬),、計(jì)算機(jī)蠕蟲(簡稱蠕蟲),、后門、邏輯**等,。惡意軟件可能在用戶不知情的情況下竊取計(jì)算機(jī)用戶的信息和隱私,,也可能非法獲得計(jì)算機(jī)系統(tǒng)和網(wǎng)絡(luò)資源的控制,破壞計(jì)算機(jī)和網(wǎng)絡(luò)的可信性,、完整性和可用性,,從而為惡意軟件控制者謀取非法利益。騰訊安全發(fā)布的《2017年度互聯(lián)網(wǎng)安全報(bào)告》顯示,,2017年騰訊電腦管家pc端總計(jì)攔截**近30億次,,平均每月攔截木馬**近,共發(fā)現(xiàn)**或木馬***,。這些數(shù)目龐大,、名目繁多的惡意軟件侵蝕著我國的***、經(jīng)濟(jì),、文化,、***等各個(gè)領(lǐng)域的信息安全,帶來了前所未有的挑戰(zhàn),。當(dāng)前的反**軟件主要采用基于特征碼的檢測(cè)方法,,這種方法通過對(duì)代碼進(jìn)行充分研究,獲得惡意軟件特征值(即每種惡意軟件所獨(dú)有的十六進(jìn)制代碼串),,如字節(jié)序列,、特定的字符串等,通過匹配查找軟件中是否包含惡意軟件特征庫中的特征碼來判斷其是否為惡意軟件,??缭O(shè)備測(cè)試報(bào)告指出平板端UI元素存在比例失調(diào)問題,。遼寧軟件測(cè)試實(shí)驗(yàn)室
艾策檢測(cè)團(tuán)隊(duì)采用多模態(tài)傳感器融合技術(shù),,構(gòu)建智能工廠設(shè)備狀態(tài)健康監(jiān)測(cè)體系。蘭州第三方軟件評(píng)測(cè)實(shí)驗(yàn)室
3)pe可選頭部有效尺寸的值不正確,,(4)節(jié)之間的“間縫”,,(5)可疑的代碼重定向,(6)可疑的代碼節(jié)名稱,,(7)可疑的頭部***,,(8)來自,(9)導(dǎo)入地址表被修改,(10)多個(gè)pe頭部,,(11)可疑的重定位信息,,(12)把節(jié)裝入到vmm的地址空間,(13)可選頭部的sizeofcode域取值不正確,,(14)含有可疑標(biāo)志,。存在明顯的統(tǒng)計(jì)差異的格式結(jié)構(gòu)特征包括:(1)無證書表;(2)調(diào)試數(shù)據(jù)明顯小于正常文件,,(3).text,、.rsrc、.reloc和.rdata的characteristics屬性異常,,(4)資源節(jié)的資源個(gè)數(shù)少于正常文件,。生成軟件樣本的字節(jié)碼n-grams特征視圖,是統(tǒng)計(jì)了每個(gè)短序列特征的詞頻(termfrequency,,tf),,即該短序列特征在軟件樣本中出現(xiàn)的頻率。先從當(dāng)前軟件樣本的所有短序列特征中選取詞頻tf**高的多個(gè)短序列特征,;然后計(jì)算選取的每個(gè)短序列特征的逆向文件頻率idf與詞頻tf的乘積,,并將其作為選取的每個(gè)短序列特征的特征值,,,表示該短序列特征表示其所在軟件樣本的能力越強(qiáng),;**后在選取的詞頻tf**高的多個(gè)短序列特征中選取,生成字節(jié)碼n-grams特征視圖,。:=tf×idf,;tf(termfrequency)是詞頻,定義如下:其中,,ni,j是短序列特征i在軟件樣本j中出現(xiàn)的次數(shù),,∑knk,j指軟件樣本j中所有短序列特征出現(xiàn)的次數(shù)之和。蘭州第三方軟件評(píng)測(cè)實(shí)驗(yàn)室