当前位置:大学毕业论文> 本科论文>材料浏览

关于算法类论文范文文献 跟基于SimHash算法的Android恶意程序检测类电大毕业论文范文

主题:算法论文写作 时间:2024-04-07

基于SimHash算法的Android恶意程序检测,本文是关于算法类论文如何写和恶意程序和SimHash算法和Android相关毕业论文题目范文.

算法论文参考文献:

算法论文参考文献 paperfree论文检测论文抄袭率检测论文检测论文字数检测

【摘 要】 不断更新发展的智能手机极大的便利了人们的生活,但也使更多的安全隐患存在,各种恶性攻击行为不仅威胁了用户的隐私安全,甚至造成经济损失.当前智能手机市场中,Android 系统占据较大比重,基于此,本文在SimHash 算法的基础上,提出了一种Android 恶意程序检测方法,经过提取APK 文件特征文本,完成恶意程序的检测,实例实验结果显示,能够有效的检测出Android系统的恶意程序.

【关键词】 SimHash 算法 Android 系统 恶意程序 检测

前言:现阶段,研究与分析Android 恶意程序时,静态检测和动态检测为常用方法.静态检测开展前提条件为应用程序不运行,利用逆向工程技术,将应用程序特征提取出来,之后以特征为基础,分析检测应用程序;动态检测中,Android 应用程序安装不在真机中进行,而是采用虚拟机、沙盒等方法代替,并对安装应用程序的实际运行状态做出模拟,再分析监控到的应用程序行为.不过,这些检测方法均存在一定的不足,影响了检测结果的准确性.Sim Hash 算法是一种相似度检测算法,主要用于大规模网页去重任务的检测及解决,检测过程中,计算成本能够减少,且检测效率能够提高.由此看来,本文研究基于SimHash 算法的Android恶意程序检测方法具有十分重要的现实意义.

一、SimHash 算法介绍

SimHash 算法是指相似度检测算法,其主要思想为先进行f 维度空间的定义,之后以该空间为范围,对每个特征对应的向量做出定义,再把向量与权重相结合,加权求和,获得和向量,和向量即可对文档做出表征[1].在本文中,基于传统SimHash 算法,对其精确性做出改进,使相似度检测过程中的准确度提高.改进后,SimHash 算法步骤共6 个[2-3]:第一步,分词,提取特征,将可使用的特征向量获得,再把相应的权重值赋予每个特征向量;第二步,散列,散列函数仍采用传统的,散列值与每个特征向量相对应,由1 和0 组成;第三步,加权,散列值获得后,结合特征向量对应的权重值,得到加权结果;第四步,合并,合并上一步计算出来的所有结果,采取简单累加的方法合并;第五步,减值,阈值T 选定,结果序列串的每一项要将阈值T 减去,之后获得的结果序列串就是最终的;第六步,降维,相同于原SimHash 算法,变换最终结果序列串,得到SimHash 值.

二、基于SimHash 算法的Android 恶意程序检测方法2.1 Android 程序复合特征

根据恶性代码特征定义,特征既可以是程序的代码段,也可以是程序的网络访问,对于Android 程序,特征包含权限、服务等,因单一特征具备一定的局限性,不能将应用程序特征全面的概括出来,所以组合多种单一特征,形成Android程序的复合特征,以将程序特性精准的、全面的反映出来[4].Androlyze.py 工具存在于开源恶意软件分析包Androguard中,利用此工具将APK 文件的相关信息导出,如权限信息、广播接收器信息,导出后组合,使其复合特征文本形成.

2.2 提取Android 程序的单一特征信息

第一,提取权限及调用映射,Androlyze.py-s 命令基础上,进入Shell 交互环境,利用相应的命令,提取apk、dex文件对象,并调用DidVMFormat() 的功能,最后将权限、调用映射提取出来;第二,提取广播接收器信息,提取该信息的命令的为a.get_receivers();第三,提取服务信息,命令为a.get_services().

2.3 检测实例

1、待测APK 文件描述.以3 个apk 程序作为待测试应用程序,其中,1 个为远程控制木马程序Android4-4.apk,1个为Android4-4.apk 的升级版Android4-5.apk,1 个为C&C类型恶意程序cutepuppies.apk.2、APK 文件特征文本.分别提取这3 个apk 程序的特征文本、权限及调用映射.由于本文篇幅有限,仅给出了Android4-4.apk 的特征文本.3、计算结果分析.提取完后转换特征文本,变为字符串,再利用SimHash 算法计算, 结果显示,Android4-4.apk 与Android4-5.apk、cutepuppies.apk 的海明距离分别为2、14,后两个apk 的海明距离为14.由于散列值为64 位,所以Android4-4.apk 与Android4-5.apk、cutepuppies.apk 的相似度分别为96.88%、78.15%,后两个apk 的相似度为78.15%.

4、检测结果比较.SimHash 算法的散列值为64 位情况下,海明距离如果是3,将会获得比较高的准确率和召回率,可达到75% 左右,因此,对于海明距离在3 以内的,认为具备相似性.根据本文检测实例的检测结果,发现大文本较为适合SimHash 算法,字数超过500 时,检测效果经比较好.初步统计发现,Android 恶意程序提取出来的特征文本基本都超过600 字,但不多于3000 字,从字数上看,检测时适合采用SimHash 算法.再次选择5 款恶意程序,检测时分别采用SimHash 算法和360 杀毒软件,比较检测结果,发现SimHash 算法的检测率要比360 杀毒软件高.

结论:现阶段,Android 应用程序的质量良莠不齐,恶意程序大量存在,使用户的个人隐私及信息安全受到极大的影响,本文进行Android 恶意程序检测时,基于SimHash 算法提出相应的检测方法,结果显示该算法具有良好的检测效果,能够有效的检测出恶意程序.

此文总结:本文是一篇关于对不知道怎么写恶意程序和SimHash算法和Android论文范文课题研究的大学硕士、算法本科毕业论文算法论文开题报告范文和文献综述及职称论文的作为参考文献资料.

高维数据集之中基于距离的离群快速检测算法
摘要针对现有的挖掘算法并不适用于大规模的高维数据集的问题,给出了一种针对高维数据集的RBRP算法,能够快速检测出数据集中基于距离的异常,该算法将对数线性作为数据点个数的函数,线性作为维数的函数 实验结.

混合式学习模式在高职《Android程序开发》课程中的应用
【摘 要】本课题构建适合高职计算机课程的基于MOOC的混合式学习模式,使学生完成线上学习、线下交流讨论和学习心得分享的全新学习过程,以期学生能够在轻松的学习氛围下自主学习的方式开展学习,并在课堂上积极.

被算法实现的天真梦想
摘自读者药师 文2017年10月,诺贝尔经济学奖揭晓,获奖者理查德·泰勒,研究的是人类种种理性和非理性的行为决策 虽然经济学时常强调“理性人假设”,假定经济活动.

推动智能门锁行业安全标准制定全国智能门锁安全检测联合实验室成立
3 月22 日,全国智能建筑及居住区数字化标准化技术委员会(以下简称“全国智标委”)与检测中心(以下简称“银检中心”)、北京亿速码数据处理有限责任公司在.

论文大全