此外格式結(jié)構(gòu)信息具有明顯的語義信息,,但基于格式結(jié)構(gòu)信息的檢測(cè)方法沒有提取決定軟件行為的代碼節(jié)和數(shù)據(jù)節(jié)信息作為特征。某一種類型的特征都從不同的視角反映刻畫了可執(zhí)行文件的一些性質(zhì),,字節(jié)碼n-grams,、dll和api信息、格式結(jié)構(gòu)信息都部分捕捉到了惡意軟件和良性軟件間的可區(qū)分信息,,但都存在著一定的局限性,,不能充分、綜合,、整體的表示可執(zhí)行文件的本質(zhì),,使得檢測(cè)結(jié)果準(zhǔn)確率不高、可靠性低,、泛化性和魯棒性不佳,。此外,惡意軟件通常偽造出和良性軟件相似的特征,,逃避反**軟件的檢測(cè),。技術(shù)實(shí)現(xiàn)要素:本發(fā)明實(shí)施例的目的在于提供一種基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測(cè)方法,,以解決現(xiàn)有采用二進(jìn)制可執(zhí)行文件的單一特征類型進(jìn)行惡意軟件檢測(cè)的檢測(cè)方法檢測(cè)準(zhǔn)確率不高、檢測(cè)可靠性低,、泛化性和魯棒性不佳的問題,,以及其難以檢測(cè)出偽造良性軟件特征的惡意軟件的問題。本發(fā)明實(shí)施例所采用的技術(shù)方案是,,基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測(cè)方法,,按照以下步驟進(jìn)行:步驟s1、提取軟件樣本的二進(jìn)制可執(zhí)行文件的dll和api信息,、pe格式結(jié)構(gòu)信息以及字節(jié)碼n-grams的特征表示,,生成軟件樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖,。深圳艾策信息科技:打造智慧供應(yīng)鏈的關(guān)鍵技術(shù),。軟件信息系統(tǒng)安全檢測(cè)公司
3)pe可選頭部有效尺寸的值不正確,(4)節(jié)之間的“間縫”,,(5)可疑的代碼重定向,,(6)可疑的代碼節(jié)名稱,(7)可疑的頭部***,,(8)來自,,(9)導(dǎo)入地址表被修改,(10)多個(gè)pe頭部,,(11)可疑的重定位信息,,(12)把節(jié)裝入到vmm的地址空間,(13)可選頭部的sizeofcode域取值不正確,,(14)含有可疑標(biāo)志,。存在明顯的統(tǒng)計(jì)差異的格式結(jié)構(gòu)特征包括:(1)無證書表;(2)調(diào)試數(shù)據(jù)明顯小于正常文件,,(3).text,、.rsrc、.reloc和.rdata的characteristics屬性異常,,(4)資源節(jié)的資源個(gè)數(shù)少于正常文件,。生成軟件樣本的字節(jié)碼n-grams特征視圖,是統(tǒng)計(jì)了每個(gè)短序列特征的詞頻(termfrequency,,tf),,即該短序列特征在軟件樣本中出現(xiàn)的頻率。先從當(dāng)前軟件樣本的所有短序列特征中選取詞頻tf**高的多個(gè)短序列特征,;然后計(jì)算選取的每個(gè)短序列特征的逆向文件頻率idf與詞頻tf的乘積,并將其作為選取的每個(gè)短序列特征的特征值,,,,表示該短序列特征表示其所在軟件樣本的能力越強(qiáng),;**后在選取的詞頻tf**高的多個(gè)短序列特征中選取,生成字節(jié)碼n-grams特征視圖,。:=tf×idf,;tf(termfrequency)是詞頻,定義如下:其中,,ni,j是短序列特征i在軟件樣本j中出現(xiàn)的次數(shù),,∑knk,j指軟件樣本j中所有短序列特征出現(xiàn)的次數(shù)之和。軟件質(zhì)量測(cè)試中心滲透測(cè)試報(bào)告暴露2個(gè)高危API接口需緊急加固,。
12)把節(jié)裝入到vmm的地址空間,,(13)可選頭部的sizeofcode域取值不正確,(14)含有可疑標(biāo)志,;所述存在明顯的統(tǒng)計(jì)差異的格式結(jié)構(gòu)特征包括:(1)無證書表,;(2)調(diào)試數(shù)據(jù)明顯小于正常文件,(3).text,、.rsrc,、.reloc和.rdata的characteristics屬性異常,(4)資源節(jié)的資源個(gè)數(shù)少于正常文件,。進(jìn)一步的,,所述生成軟件樣本的字節(jié)碼n-grams特征視圖的具體實(shí)現(xiàn)過程如下:先從當(dāng)前軟件樣本的所有短序列特征中選取詞頻tf**高的多個(gè)短序列特征;然后計(jì)算選取的每個(gè)短序列特征的逆向文件頻率idf與詞頻tf的乘積,,并將其作為選取的每個(gè)短序列特征的特征值,,,表示該短序列特征表示其所在軟件樣本的能力越強(qiáng),;**后在選取的詞頻tf**高的多個(gè)短序列特征中選取,,生成字節(jié)碼n-grams特征視圖;:=tf×idf,;其中,,ni,j是短序列特征i在軟件樣本j中出現(xiàn)的次數(shù),∑knk,j指軟件樣本j中所有短序列特征出現(xiàn)的次數(shù)之和,,k為短序列特征總數(shù),,1≤i≤k;其中,,|d|指軟件樣本j的總數(shù),,|{j:i∈j}|指包含短序列特征i的軟件樣本j的數(shù)目。進(jìn)一步的,,所述步驟s2采用中間融合方法訓(xùn)練多模態(tài)深度集成模型,。
對(duì)一些質(zhì)量要求和可靠性要求較高的模塊,一般要滿足所需條件的組合覆蓋或者路徑覆蓋標(biāo)準(zhǔn)。[2]軟件測(cè)試方法集成測(cè)試集成測(cè)試是軟件測(cè)試的第二階段,,在這個(gè)階段,,通常要對(duì)已經(jīng)嚴(yán)格按照程序設(shè)計(jì)要求和標(biāo)準(zhǔn)組裝起來的模塊同時(shí)進(jìn)行測(cè)試,明確該程序結(jié)構(gòu)組裝的正確性,,發(fā)現(xiàn)和接口有關(guān)的問題,,比如模塊接口的數(shù)據(jù)是否會(huì)在穿越接口時(shí)發(fā)生丟失;各個(gè)模塊之間因某種疏忽而產(chǎn)生不利的影響,;將模塊各個(gè)子功能組合起來后產(chǎn)生的功能要求達(dá)不到預(yù)期的功能要求,;一些在誤差范圍內(nèi)且可接受的誤差由于長(zhǎng)時(shí)間的積累進(jìn)而到達(dá)了不能接受的程度;數(shù)據(jù)庫因單個(gè)模塊發(fā)生錯(cuò)誤造成自身出現(xiàn)錯(cuò)誤等等,。同時(shí)因集成測(cè)試是界于單元測(cè)試和系統(tǒng)測(cè)試之間的,,所以,,集成測(cè)試具有承上啟下的作用,。因此有關(guān)測(cè)試人員必須做好集成測(cè)試工作。在這一階段,,一般采用的是白盒和黑盒結(jié)合的方法進(jìn)行測(cè)試,,驗(yàn)證這一階段設(shè)計(jì)的合理性以及需求功能的實(shí)現(xiàn)性。[2]軟件測(cè)試方法系統(tǒng)測(cè)試一般情況下,,系統(tǒng)測(cè)試采用黑盒法來進(jìn)行測(cè)試的,,以此來檢查該系統(tǒng)是否符合軟件需求。本階段的主要測(cè)試內(nèi)容包括健壯性測(cè)試,、性能測(cè)試,、功能測(cè)試、安裝或反安裝測(cè)試,、用戶界面測(cè)試,、壓力測(cè)試、可靠性及安全性測(cè)試等,。多平臺(tái)兼容性測(cè)試顯示Linux環(huán)境下存在驅(qū)動(dòng)適配問題,。
降低成本對(duì)每個(gè)階段都進(jìn)行測(cè)試,包括文檔,,便于控制項(xiàng)目過程缺點(diǎn)依賴文檔,,沒有文檔的項(xiàng)目無法使用,復(fù)雜度很高,,實(shí)踐需要很強(qiáng)的管理H模型把測(cè)試活動(dòng)完全**出來,,將測(cè)試準(zhǔn)備和測(cè)試執(zhí)行體現(xiàn)出來測(cè)試準(zhǔn)備-測(cè)試執(zhí)行就緒點(diǎn)其他流程----------設(shè)計(jì)等v模型適用于中小企業(yè)需求在開始必須明確,不適用變更需求w模型適用于中大企業(yè)包括文檔也需要測(cè)試(需求分析文檔概要設(shè)計(jì)文檔詳細(xì)設(shè)計(jì)文檔代碼文檔)測(cè)試和開發(fā)同步進(jìn)行H模型對(duì)公司參與人員技能和溝通要求高測(cè)試階段單元測(cè)試-集成測(cè)試-系統(tǒng)測(cè)試-驗(yàn)證測(cè)試是否覆蓋代碼白盒測(cè)試-黑盒測(cè)試-灰盒測(cè)試是否運(yùn)行靜態(tài)測(cè)試-動(dòng)態(tài)測(cè)試測(cè)試手段人工測(cè)試-自動(dòng)化測(cè)試其他測(cè)試回歸測(cè)試-冒*測(cè)試功能測(cè)試一般功能測(cè)試-界面測(cè)試-易用性測(cè)試-安裝測(cè)試-兼容性測(cè)試性能測(cè)試穩(wěn)定性測(cè)試-負(fù)載測(cè)試-壓力測(cè)試-時(shí)間性能-空間性能負(fù)載測(cè)試確定在各種工作負(fù)載下,,系統(tǒng)各項(xiàng)指標(biāo)變化情況壓力測(cè)試:通過確定一個(gè)系統(tǒng)的剛好不能接受的性能點(diǎn),。獲得系統(tǒng)能夠提供的**大服務(wù)級(jí)別測(cè)試用例為特定的目的而設(shè)計(jì)的一組測(cè)試輸入,,執(zhí)行條件和預(yù)期結(jié)果,以便測(cè)試是否滿足某個(gè)特定需求,。通過大量的測(cè)試用例來檢測(cè)軟件的運(yùn)行效果,,它是指導(dǎo)測(cè)試工作進(jìn)行的依據(jù)。5G 與物聯(lián)網(wǎng):深圳艾策的下一個(gè)技術(shù)前沿,。北京軟件檢測(cè)報(bào)告規(guī)格
基于 AI 視覺識(shí)別的自動(dòng)化檢測(cè)系統(tǒng),助力艾策實(shí)現(xiàn)生產(chǎn)線上的零缺陷品控目標(biāo),!軟件信息系統(tǒng)安全檢測(cè)公司
后端融合模型的10折交叉驗(yàn)證的準(zhǔn)確率是%,,對(duì)數(shù)損失是,混淆矩陣如圖13所示,,規(guī)范化后的混淆矩陣如圖14所示,。后端融合模型的roc曲線如圖15所示,其顯示后端融合模型的auc值為,。(6)中間融合中間融合的架構(gòu)如圖16所示,,中間融合方式用深度神經(jīng)網(wǎng)絡(luò)從三種模態(tài)的特征分別抽取高等特征表示,然后合并學(xué)習(xí)得到的特征表示,,再作為下一個(gè)深度神經(jīng)網(wǎng)絡(luò)的輸入訓(xùn)練模型,,隱藏層的***函數(shù)為relu,輸出層的***函數(shù)是sigmoid,,中間使用dropout層進(jìn)行正則化,,防止過擬合,優(yōu)化器(optimizer)采用的是adagrad,,batch_size是40,。圖16中,用于抽取dll和api信息特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含3個(gè)隱含層,,其***個(gè)隱含層的神經(jīng)元個(gè)數(shù)是128,,第二個(gè)隱含層的神經(jīng)元個(gè)數(shù)是64,第三個(gè)隱含層的神經(jīng)元個(gè)數(shù)是32,,且3個(gè)隱含層中間間隔設(shè)置有dropout層,。用于抽取格式信息特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含2個(gè)隱含層,其***個(gè)隱含層的神經(jīng)元個(gè)數(shù)是64,,其第二個(gè)隱含層的神經(jīng)元個(gè)數(shù)是32,,且2個(gè)隱含層中間設(shè)置有dropout層。用于抽取字節(jié)碼n-grams特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含4個(gè)隱含層,,其***個(gè)隱含層的神經(jīng)元個(gè)數(shù)是512,,第二個(gè)隱含層的神經(jīng)元個(gè)數(shù)是384,第三個(gè)隱含層的神經(jīng)元個(gè)數(shù)是256,,第四個(gè)隱含層的神經(jīng)元個(gè)數(shù)是125,。軟件信息系統(tǒng)安全檢測(cè)公司