久久这里只有精品国产99-久久这里只有精品2-久久这里只有精品1-久久这里只精品热在线99-在线少女漫画-在线涩涩免费观看国产精品

基于特征工程與集成學習的惡意軟件預測研究

來源:期刊VIP網所屬分類:軟件開發時間:瀏覽:

  摘要:針對微軟惡意軟件預測數據集,文章結合特征工程的思想和集成學習算法實現惡意軟件感染的預測。為了更好地適應算法的輸入要求,對數據集進行預處理和特征構建,并提出一種利用LightGBM算法以提高預測性能的啟發式搜索方式,得到最終的特征集。以篩選后的特征構成的數據集實現了LightGBM,XGBoost和CART算法的預測,并對預測性能進行了比對分析。通過完全相同的交叉驗證證明,在惡意軟件預測時,集成學習算法有更好的預測性能,AUC值明顯高于傳統決策樹算法。

  關鍵詞:惡意軟件預測;特征工程;LightGBM;XGBoost

軟件開發論文

  0引言

  近年來,惡意軟件在PC端的傳播感染和攻擊行為日益頻繁,給企業和個人計算機用戶的信息安全和財產帶來嚴重威脅,在此背景下微軟提供Windows計算機惡意軟件感染數據集,旨在實現對計算機是否感染惡意軟件的概率預測。機器學習在網絡安全領域的應用也越來越廣泛嘲,boosting集成學習算法是近年來機器學習中較為流行的算法,例如基于樹模型集成的LightGBM和XGBoost算法,近年來常用于基于數據集的預測。本文對數據集進行了預處理,并根據特征工程的理論進行特征的構建與選擇,最終使用boosting算法,實現對惡意軟件感染的有效預測。如何從大量原始數據中盡可能地挖掘出與預測惡意軟件相關聯的信息,并借助集成學習的預測性能實現惡意軟件的預測是本文研究的主要內容。

  1數據認知與預處理

  1.1數據認知

  本文數據引用自kaggle網站的微軟惡意軟件預測數據集。本文預測目的為Windows計算機是否感染惡意軟件,預測標簽為計算機是否檢測出惡意軟件(檢測出記為1,未檢測出記為0),即原數據集中的HasDetections字段。為探究boosting算法在該數據集上的預測效果,本文取其前120萬條數據進行研究。

  所取樣本中預測標簽的正負樣本分布大致相同,因此不需要進行額外的分層抽樣以確保訓練集中的正負樣本比例。將其他特征與預測標簽進行了數據趨勢分析,例如,圖1所舉的示例為不同“AVProduc-tInstalled”(安裝防衛軟件數目)下“HasDetections”的數據分布,從中可以看出,在感染惡意軟件的數據更集中于防衛軟件數目較少的情況。通過以上特征間的分析過程,證明其他特征與預測標簽有一定關聯性。

  1.2數據預處理

  數據集中大部分特征都為類別特征。為了使數據更適用于機器學習算法的訓練,對于原始數據集中的類別型數據采用標簽編碼的方式。例如,圖2給出“ProductName”字段的標簽編碼過程,該字段原有6個類別,在特征編碼時將數量少于1000的所有類別視為異常值,合并劃為同一標簽。

  對于數據集中的數值型數據與布爾型數據不作處理,保留原有數據格式。經過數據預處理后,得到可以投入機器學習訓練的數據集。

  2相關方法與理論

  2.1特征工程及特征選擇方法

  特征工程(Feature Engineering),是一系列工程活動的總稱。特征工程的目的,是最大限度地從原始數據中找到適合模型的特征。此過程不僅能夠降低計算的運行速度,提高模型的預測性能,也使得模型更好理解和維護。

  特征選擇是特征工程中關鍵的一步,實際的特征構建過程中,特征之間可能存在依賴,也可能存在與預測目標不相關的特征。特征選擇是篩選出合適特征的過程,本文提出一種啟發性特征搜索方式以提高預測性能,主要思想是以分類器的預測性能作為判斷準則,從當前的特征集合中移除最不重要的特征,其次根據準則決定部分特征是否刪減或保留,重復上述過程,直到最終的特征集不再發生變化。

  2.2分類算法

  CART算法,即分類與回歸樹(classification andregression tree,CART),是一種常用于分類和回歸任務的決策樹算法。在執行分類任務時,用基尼指數選擇判斷最優特征及最優切分點的依據來構造分類樹。最后基于子樹的平方誤差或基尼指數,剪去部分子樹,減少過擬合以更適應未知數據的預測。

  XGBoost是以分類回歸樹(CART樹)進行組合的一種boosting集成學習方法。XGBoost在使用CART作為基分類器時增加了正則項,大大提升了模型的泛化能力。基于分類回歸樹的XGBoost算法能很好地處理本文中的表格性數據,還可以自動對缺失值進行處理,同時提供更好的優化參數的方式。

  作為boosting集合模型中的新進成員,LightGBM是一種基于決策樹算法的分布式梯度提升框架,原理上采用損失函數的負梯度作為當前決策樹的殘差近似值去擬合新的決策樹。在特征重要性判斷上,LightGBM相對于其他集成學習算法有很多重要的優勢,例如支持直接輸入類別特征,能輸出特征重要性分數,以及較低的計算代價等。

  2.3二分類模型評估指標

  2.3.1混淆矩陣

  混淆矩陣是用來評估二分類模型的一種可視化工具。本文根據模型的預測結果與真實分類結果的比較將所有樣本劃分為四部分,具體如表l所示。

  表1中的四部分具體如下。

  真正(True Positive,TP):當一個正樣本被模型預測為正類。

  假正(False Positive,FP):當一個負樣本被模型預測為正類。

  假負(False Negative,FN):當一個正樣本被模型預測為負類。

  真負(True Negative,TN):當一個負樣本被模型預測為負類。

  推薦閱讀:SCI論文圖片用什么軟件做?

老师在办公室被躁在线观看| 美女又黄又免费的视频| 亚洲国产AV玩弄放荡人妇系列 | 亚洲男人第一AV天堂| 天堂无码人妻精品一区二区三区| 女人下边水润紧致好处| 久久精品国产精油按摩| 国产精品一国产精品一K频道| 波多野结衣一区二区三区AV高清| 97无码免费人妻超级碰碰碰碰| 亚洲人成国产精品无码| 性色AV浪潮AV色欲AV| 欧美人妻一区二区| 蜜桃色欲AV久久无码精品软件| 欧美黑人又大又粗高潮喷水 | 亚洲精品无码成人片久久不卡 | 亚洲精品成人久久AV| 无码中文字幕加勒比一本二本| 日日摸日日碰夜夜爽无| 欧美成人天天综合在线| 蜜桃中文字日产乱幕4区| 欧美专区日韩视频人妻| 欧美另类VIDEOSBESTS| 少妇 黑人 欧美 亚洲| 日出水了特别黄的视频| 日本三级吃奶头添泬| 日本欧美午夜成人免费观看| 人性禁岛1破禁果| 日本三级黄色视频| 亚洲 校园 欧美 国产 另类| 荫蒂添的好舒服小说短篇| 又黄又硬又湿又刺激视频免费| 亚洲少妇一区二区视频| 亚洲中文无码永久在线电影| 亚洲天天做日日做天天谢日日欢| 91人妻人人揉人人躁人人| 92成人午夜福利一区二区| 丰满妇女伦大片免费| 国产AV无码专区亚洲AV| 国产成人A视频高清在线观看| 国产AV高清无亚洲| 久久精品水蜜桃AV综合天堂| 久无码久无码AV无码| 男男车车CP视频| 欧美人妻精品一区二区| 无码精品毛片波多野结衣| 香港A级毛片经典免费观看| 亚洲AV人人澡人人爽人人夜夜| 亚洲 中文字幕 日韩 无码| 14萝自慰专用网站| YY8840私人影院爱不停下载| 布丁漫画土豪漫画入口页面| 皇上御花园HLH| 久久夜色精品国产网站| 女厕脱裤撒尿大全视频| 欧洲一本到卡二卡三卡乱码| 日韩AV毛片无码免费| 亚洲精品无码AV人在线观看| 宝贝你下面喷潮了| 国产成人精品久久一区二区三区| 久久久久精品国产99久久综合 | 人妻丰满熟妇AV无码区| 日韩一区二区三区在线| 亚洲熟妇无码AV不卡在线播放| 动漫精品啪啪一区二区三区 | 婷婷五月深爱憿情网六月综合| 无码人妻一区二区三区在线| 亚洲国产AⅤ精品一区二区蜜桃| 扒开双腿疯狂进出爽爽爽免费 | 国精品无码人妻一区二区三区 | 亚洲第一成人网站| 泳池里强摁做开腿呻吟漫画视频| 国产98在线 | 免费| 黑人精品一区二区三区| 久久精品亚洲中文无东京热| 天干天干天啪啪夜爽爽色| 亚洲国产成人极品综合| 荡公乱妇HD电影中文字幕| 国产在线无码视频一区二区三区| 久久精品99国产精品日本| 熟妇熟女乱妇乱女网站| 亚洲日韩精品无码一区二区三区| 97超碰中文字幕久久精品| 极品少妇被扒开双腿躁出白小说 | 一本色道久久综合狠狠躁篇| EEUSS影院WWW在线观看| 国产精品欧美久久久久无广告| 精品一区二区三区免费毛片爱 | 制服丝袜中文字幕在线| 宝贝腿开大点我添添公口述视频| 久久精品国产72国产精| 性高朝久久久久久久3小时| 成人一区二区免费视频| 好男人电影在线观看| 能让我流水水的一千字| 亚洲嫩模喷白浆在线观看 | 少妇无码一区二区二三区| 亚洲精品色午夜无码专区日韩| 丰满岳乱妇在线观看中字无码 | 少妇人妻精品一区二区| PORNO日本╳╳╳| 国产亚洲色欲色一色WWW| 少妇人妻激情乱人伦| 宝宝两根就哭男男是不是太早了 | 中国极品少妇XXXXX| 九九精品99久久久香蕉| 亚洲AV日韩AV奶水无码| 国产精品久久久久精品日日| 久久人人玩人妻潮喷内射人人| 日韩无码视频二区| 亚洲色大成网站WWW| 国产在线精品一区二区三区直播 | 高潮毛片无遮挡高清免费| 久久AV无码AV高潮AV喷吹| 人人爽人人澡人人人人妻| 55大东北熟女啪啪嗷嗷叫| 国产精品亚洲专区无码WEB| 视频视频APP在线看| 床震吃胸膜奶免费视频| 久久久久亚洲精品无码网址| 熟女少妇丰满一区二区| 车子一晃一晃的就C进去了肉| 久久精品久久久久久噜噜| 亚洲国产精品无码成人片久久| 国产日韩精品SUV| 人妻色欲AV无码专区精油按摩| 97精品久久久久中文字幕| 免费A级毛片18禁网站APP| 亚洲AV无码成人精品区一本二本| china熟女熟妇乱老女人百度| 免费SM虐女调教网站视频| 中文字幕无码久久一区| 国内精品宾馆在线精品酒店| 亚洲 欧美 叧类人妖| 国产午夜福利在线观看红一片| 人妻少妇看A偷人无码精品视频| KDBACC小蝌蚪新版本的特点| 欧美日韩亚洲中文字幕一区二区三 | 久久国产精品一国产精品金尊 | H无遮挡H无码黄3D漫画| 精品无码国产自产拍在线观看蜜桃| 少妇粉嫩小泬喷水视频WWW| 丰满人妻无码使劲张开双腿AV| 上课我穿超短裙被同桌摸出水| 国产成人AAAAA级毛片| 无码国产精品一区二区免费式芒果 | 人妻少妇乱子伦无码专区 | 好男人资源在线观看好| 亚洲欧美高清一区二区三区| 久久久久亚洲AV无码专区| 中文字幕亚洲无线码| 精品国产一区二区三区无码蜜桃| 舌头伸进去添的我好爽高潮欧美| 粉嫩虎白女P虎白女在线| 无套内射GIF舔B吃奶| 丁香花在线视频完整版| 婷婷综合缴情亚洲狠狠| 韩国无码无遮挡在线观看不卡| 亚洲人成网站18禁止影院| 久久久久久久久久精品电影 | 久久久亚洲精品无码| 2018AV无码视频在线播放| 人与动物PPT免费模板| 国产丰满麻豆HDXVIDEOS| 日本熟妇厨房XXXXX乱| 国产精华液和欧美的精华液的区别| 亚洲AV狠狠爱一区二区三区| 久久久久亚洲AV无码专区| CHINESE妓女野外直播| 熟睡被义子侵犯中文字幕| 好男人在线观看无遮挡版| 在线观看大片免费播放器 | 亚洲精品无码久久久久去Q| 美女高潮20分钟视频在线观看| 亚洲欧美性爱视频在线| 妺妺窝人体色www在线观看婚闹| 夜夜高潮次次欢爽AV女| 欧美久久高潮久久高潮| 国产成年女人毛片80S网站| 亚洲成人av在线| 内射合集对白在线| 丰满人妻被两个按摩师| 亚洲成AV人片久久| 男生J桶进女人P又色又爽又黄| 荡女小姿的YIN乱生活| 亚洲成无码电影在线观看| 女人自熨全过程视频免费| 公和我做好爽添厨房在线观看| 亚洲精品1卡2卡三卡23卡| 欧美巨大巨粗黑人性AAAAAA| 国产精品美女一区二区三区| 伊人久久亚洲综合AV影院| 日韩精品视频一区二区| 精品国产乱码久久久久久人妻 | 女孩子手脚绑起来嘴用胶带封上| 给老子叫 老子喜欢听| 亚洲自偷自偷在线成人网站传媒| 日本粉色IPHONE| 精品久久久噜噜噜久久久| 亚洲国产精品无码久久|