特征库的p2p流量检测与控制研究(附件)【字数:6682】

摘 要近年来,P2P发展非常迅速,用户可以通过P2P流量传输进行交流,使得人们交流更加的方便快捷。使得信息在短时间内传播的更快、更广、更远。正是P2P发展的如此迅速,使得P2P应用就变得无法有效的控制,引发了一系列的问题,如电驴、腾讯视频等应用占用了大量流量与带宽,造成了其他用户的卡顿,无法正常使用网络,增加了运营成本、降低了使用效率、浪费用户的时间与网络资源。P2P应用传染病毒也是网络造成瘫痪的主要原因。为了解决这个问题,就要对P2P的流量进行监控并对识别出的流量进行有效的控制,对恶意软件进行阻断。本文综合这些问题设计出了一种基于特征库的P2P流量识别技术。特征库是用于存放特征数据的集合,截取的数据与特征库的数据进行比对,进行分析。本文以特征库流量识别技术为核心,首先抓取数据,对数据进行预处理以便于对比特征库的数据,再调取特征库的特征数据,输出显示模块,最后进行监控。为了保证识别的准确性,需要反复的抓取、分析,这样才能准确的对过载用户进行监控。本文根据对比的结果进行处理,根据需求进行阻断、禁止、限速等操作。 特征库流量监控技术在网络安全有着举足轻重的地位,他可以代替一些其他复杂的网络安全技术,实现网络安全简单化,结构化、多样化。
目 录
第一章 绪论 1
1.1 研究背景及意义 1
1.2 需求分析 1
第二章 特征库设计与构成 2
2.1 特征库流量识别技术 2
2.2 特征库基本构成 2
2.3 特征库规则描述 3
2.4 特征库模块的设计 3
第三章 流量监控系统的设计 5
3.1 流量监控系统整体架构设计 5
3.2 流量监控系统模块介绍 5
3.2.1 流量预处理模块 5
3.2.2 特征库流量识别模块 6
3.2.3 DB模块 6
3.2.4 用户管理模块 6
3.2.5 输出显示模块 6
3.2.6 流量控制模块 6
第四章 系统测试验证 7
4.1 流量抓取处理 7
4.2 流量比对 8
4.3 用户数据监控 8
总结语  *好棒文|www.hbsrm.com +Q: &351916072& 
9
致 谢 10
参考文献 11
第一章 绪论
1.1 研究背景及意义
互联网发展至今,其发展速度惊人。互联网可以及时的获取相应的信息,可以促进经济的发展,可以丰富人们的生活。相反,互联网也会带来很多不必要的烦恼。例如:大量用户下载游戏,观看视频,占用了其他用户的带宽,严重影响了其他用户的上网体验,与工作效率。
P2P是点对点、端对端的对等网络。网络中的各个用户既是参与者也是分享者。既可以是资源的获取者又可以是资源的传播者。整个网络不依赖专用的服务器,更没有专用的服务站。简单的说,P2P就是直接将人们联系起来,让人们通过互联网直接交互。P2P使得网络上的沟通变得容易、更直接共享和交互,真正地消除中间商。用户可直接访问对等计算机上的共享资源。网络中的对等方可直接在本地存储器上共享文件,而不必在中央服务器上进行共享。
对P2P流量的实时监控就显得尤为重要,可以及时的预防,解决不必要的麻烦,对大量占用带宽的用户进行限制或者阻断,进而使大家得到公平的网络服务。要进行限制,阻断等操作就要对流量进行监控。
综上,流量的监控有着极为重要的作用,他能够使管理者更加简洁明了的进行操作,能够使用户得到更加舒畅的网络环境,设计一个高效准确的P2P流量监控系统成为了大部分网络公司的首要任务。
1.2 需求分析
由于P2P网络传输不需要服务器,这样就使得P2P变得不可控。如果一台机器中了病毒,它就会一传二,二传四,这样无节制的传染下去。在P2P网络中,服务器不再是网络的中心,但是仍然协调着整个网络的工作,服务器的瘫痪将导致整个网络的瘫痪。不难想象,一个拥有众多用户的P2P网络将会成为黑客的攻击目标,这将极大地威胁P2P网络的安全。
特征库的主要需求就是对抓取到的数据进行准确、快速、有效的分析。特征库里存取的数据要具有相关数据独有的特征,在查询检测的时候,可以准确的找到。除此之外,特征库里的数据要具有多样性,数据要尽量的多,要包含各大P2P软件的特征数据,还要不断的升级更新。
监控系统的主要需求是要准确的抓取到相应P2P的流量包,准确的抓取可以极大的提高监控系统的效率,避免了抓取到错误的数据包操作,从而浪费大量时间。
第二章 特征库设计与构成
2.1 特征库流量识别技术
本文综合设计出一种基于流量特征的P2P识别技术。用户在使用网络时会产生数据流量包,然后通过抓取网络的数据包,分析数据的特征与数据的报文,提取这个数据其特有的数据特征,然后将特征串以某种特定的格式写成文件。特征库流量识别技术是指根据数据库中已有数据的特征和抓取到数据的特征进行比对,按照规定的识别过程,对流量进行识别、分析、总结的网络流量识别技术。特征库要根据具体数据具体分析,每个数据的特征都大不相同,必须进过多次抓取才能确定该数据的特征。
2.2 特征库基本构成
本章以建立的特征库为主体包含了各个数据的特征,其中含有规则、协议/应用、父类等基本重要的特征,如表2l所示。
表21 特征库基本元素概念及其构成表
特征库构成元素
含义
父类
多个特征串相同的数据链
协议/应用
网络中流量的下载与上传的应用于协议
规则
按照特征库的语法及语义对流量进行识别判断的依据
根据特征库流量识别的数据来看,协议/应用是所能截取到数据的最小的单位。特征库中每个数据都有其相应的规则,通过这些规则才能准确的识别截取到数据,所以规则的详细、准确与否是特征库识别的关键所在。每个应用都有其所属的父类,有且只有一个。然而每个父类可以拥有多个子类。也就说父类包含子类,子类所属于父类。如表22所示,一个应用中也可以包含多个特征,只有一个特征才能准确具体的识别出数据的类型。
表22 父类对应关系表
父类名
应用归类
应用举例
GAME
各类游戏
Dota,王者荣耀
CHAT
聊天软件
QQ,微信
P2P
P2P软件
电驴酷狗
Mali
电子邮件

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/wljs/38.html

好棒文