支持向量数据描述在异常检测中的应用
支持向量数据描述在异常检测中的应用[20200419161633]
摘要
针对聚丙烯在聚合过程当中异常样本很难提取的问题,提出了一种基于支持向量数据描述算法的聚丙烯异常检测方法。该方法仅仅依靠一类目标样本来用作学习样本,而无需其他异常样本,便能够构造一个单值分类器,因而可将目标样本和异常样本区分开来。它的基本思想是在一个特征空间中寻找到一个包围目标数据集的超球,并通过使包围目标样本数据集的超球体的体积尽量最小,使目标样本点都尽量包围在超球体中,而离群点都尽可能的不被包围在超球体中。从而将两类样本数据区分开来。本文通过实验,说明了与传统的神经网络方法相比拟,支持向量数据描述算法具备更佳的分类本领和计算效率。
*查看完整论文请 +Q: 3 5 1 9 1 6 0 7 2
关键字:支持向量数据描述异常检测单值分类
目 录
第一章 绪论 1
1.1选题的目的和意义 1
1.2支持向量数据描述的国内外研究现状 1
1.3 异常检测技术的国内外研究现状 2
1.4 本文的主要内容 3
第二章 支持向量机理论概述 4
2.1 统计学习理论 4
2.1.1机器学习方法 4
2.1.2 统计学习理论 5
2.1.3 VC维 5
2.2支持向量机 5
2.2.1 支持向量机原理 5
2.2.2 最优超平面 6
2.2.3 Mercer定理 7
2.2.4 惩罚参数 8
第三章 支持向量数据描述理论 9
3.1 SVDD理论基础 9
3.1.1 数据描述方法 9
3.1.2 支持向量数据描述的基本原理 9
3.1.3 支持向量数据描述的特征 12
3.2 SVDD中的核函数 12
3.2.1 核函数的思想原理 12
3.2.2 SVDD常用的核函数 13
3.2.3 高斯核函数对SVDD的影响 14
3.2.4 SVDD中的数据预处理 14
第四章 支持向量数据描述为聚丙烯的生产过程建模 15
4.1 聚丙烯生产工艺 15
4.2 模型结构 15
4.2.1 建立模型 16
4.2.2 SVDD中参数的选择和构造 17
4.2.3 故障点检测 19
4.3 结果分析 22
第五章 结论与展望 23
致谢 24
参考文献 25
附录一 26
第一章 绪论
1.1选题的目的和意义
随着现代科学技术的快速发展,以及现代工业化步伐的不断推进。化工行业中也引入了更多的先进技术和先进的设备。随之而来的工程设备也日趋复杂化、精密化和自动化。功能也越来越多样化。但是设备在复杂多样化的同时,必然会出现这样或者那样的问题。由于遭受到很多不确定的因素的影响,设备的正常运行就会受到威胁,轻则影响产物品质、生产力下降,重则,会造成人员伤亡。例如2012年6月12日,某炼油厂生产车间发生聚丙烯急性爆炸,在爆炸事发地四周可以看到,该作坊车间处于一片狼藉之中,门窗全数脱落,此次事故造成一人受伤,间接经济损失数万元。而导致事故的原因仅仅是因为聚合釜投料口处发生活化剂泄露所致。
因此如何在设备发生故障前准确的预知设备的安全状况,成为了当前人们所面临的一个重要的问题。机械设备的正常运作及其可靠性主要依赖于以下两个方面。一是在设备的制造工艺过程中确保落实相关技术指标。因此,在设计上需要采用可靠的设计方法才能提升设备的安全性能。二是在设备的日常维护、保养和诊断过程中务必要达到硬性要求。因此,从另一个方面来讲保障设备正常运行的一个重要环节就是能够即时的对设备进行故障排除和诊断。随着工程技术的飞速成长,故障诊断的方法也渐渐向多元化发展,并且更加智能化。故障诊断学,其综合性比较强,并且是近年发展起来的。它涉及到人工智能、现代控制理论、模式识别等多种学术科目。按照德国故障检测专家Frank教授的见解,故障诊断办法能够划分为基于信号分析方法、基于模型方法以及基于知识的三种方法。本文在探索异常诊断的方法上提出了一个新的途径,支持向量数据描述的异常检测方法。此方法属于无监督的异常检测,他可以较全面的获取异常数据,体现故障特征,并且能够大大的提高异常数据检测的正确性。
1.2支持向量数据描述的国内外研究现状
支持向量数据描述方法是近年才被人们所认识的,它属于一种单值分类方法。它主要的依托就是统计学习理论和支持向量机。其基本思想是将被描述目标当做一个总体,并设法于特征空间中寻找一个最优超球体,且使该超球体全数或者尽量多的去包含被描述目标,而不是该类目标的则不包括或尽可能少的包括在该超球体内。被包含在超球体内部的描述对象被叫做目标类,而未被包围的描述对象被叫做离群类,以此来达到两类目标的分类。在设备运行和产品生产过程的异常检测过程中,正常运行状态的数据样本都是非常容易获取的,但是异常数据样本却出于各种原因很难获取,这一原因也是限制异常检测技术发展的一个重要因素。采用单值分类方法,单单需要常态下运行的数据样本而不需要离群类数据样本便能够构造一个单值分类器来实现两种样本分类,此方法与其他分类算法比拟,因其具有计算时间短亦可处理小样本数据等优点,所以在异常检测领域具备很好的推广价值。现阶段,支持向量数据描述方法的研究方向主要有理论和应用方面。
由于支持向量数据描述法是一种新的理论的发展,理论本身还存在许多问题。比方对一个已知的问题,如何对原始数据进行有用的预处理来让其符合支持向量数据描述算法的请求,以此来让其分类效果更显成效?如何计算映射函数的VC维?针对多数据样本如何选择算法来减少其计算量都是我们现阶段所需要解决的问题。支持向量数据描述作为一个小样本学习算法,当其对多数据进行处理的时候,往往伴随着学习时间较长的缺陷,这些问题让支持向量数据描述方法在实际工程中得到应用带来了很大的阻力。在故障诊断研究方面其应用还不是很广泛,现阶段的研究方向还主要集中在设备运行状态的监测和样本的特征提取。
1.3 异常检测技术的国内外研究现状
Dorthy Denning于1987年率先提及了入侵检测思想,当前所使用的各类检测技术与模型都是以它为基础的扩展和细分。Dorthy Denning提出的模型是一个基于机箱的入侵检测模型,他将当前被检测事件与模型进行校对,若不匹配则认为其实异常数据。
基于统计基础上的异常检测技术是全球起初发展,亦是最先进的异常检测技术。这个技术在大多数而且非常实用的入侵检测系统中被广泛利用到。在检测盗取者和外部侵入者时,基于统计的入侵检测技术将会展现出一个非常好的效果,但也会产生如下缺点:
1) 事件发生的顺序它不会考虑在内,因此根据事件发生的顺序对其进行攻击很难预测。
2) 当攻击者察觉到到被监督后,能够通过调节统计边界的自适应匹配,缓缓改变其行为,来培养正常边界,最后让检测系统判断其异常行为时出现错误。
3) 对于阀值的正常与否很难确定,阀值设置的太高或者太低都会引起虚警和漏警的现象。
为了解决Dorthy Denning模型没有参与考虑事件发生顺序的弊端,Henry于二十世纪末提出了预测模型,其检测入侵的手段是采用动态规则集合,上述规则以所观测到的事件顺序关系和局部特征来概括产生序列型态。而归纳机制则以时间的推理机作为基础,亦可以从一个过程的观察中找出暂态形式,进而事件的重复率也可以经过暂态模型体现出来,亦可用于精确预测。这类暂态模式的详细实现步骤是从所要观测的数据中生成一组假定,此组假定跟随动态数据变动而修改,而最终的结果是只有高品质假设才会存在在规则库中,而低品质的假设则会被丢失。通过对之前事件序列规律的观测,预测模型可以推算出下一时间输入数据流中某个时间较其他事件更有可能发生。
规则库的作用在于存储用户行为模式,每一种规则都对应着一个序列型态,并且以一定的概率判断下一个事件发生的可能性。
越来越多的人工智能方法的引入,给异常检测技术性能的提升提供了非常大的基础平台。这些人工智能的方法主要囊括了神经网络、数据挖掘等。自20世纪80年代来,异常检测技术经历了深入的研究,虽然至今才短短的20年,却已经取得了很大的成果。随着网络技术的向前推进,人们对安全认识也有了更加广泛的关注。从而亦促使了异常检测方法的不断增加,人们也越来越看好异常检测技术。
摘要
针对聚丙烯在聚合过程当中异常样本很难提取的问题,提出了一种基于支持向量数据描述算法的聚丙烯异常检测方法。该方法仅仅依靠一类目标样本来用作学习样本,而无需其他异常样本,便能够构造一个单值分类器,因而可将目标样本和异常样本区分开来。它的基本思想是在一个特征空间中寻找到一个包围目标数据集的超球,并通过使包围目标样本数据集的超球体的体积尽量最小,使目标样本点都尽量包围在超球体中,而离群点都尽可能的不被包围在超球体中。从而将两类样本数据区分开来。本文通过实验,说明了与传统的神经网络方法相比拟,支持向量数据描述算法具备更佳的分类本领和计算效率。
*查看完整论文请 +Q: 3 5 1 9 1 6 0 7 2
关键字:支持向量数据描述异常检测单值分类
目 录
第一章 绪论 1
1.1选题的目的和意义 1
1.2支持向量数据描述的国内外研究现状 1
1.3 异常检测技术的国内外研究现状 2
1.4 本文的主要内容 3
第二章 支持向量机理论概述 4
2.1 统计学习理论 4
2.1.1机器学习方法 4
2.1.2 统计学习理论 5
2.1.3 VC维 5
2.2支持向量机 5
2.2.1 支持向量机原理 5
2.2.2 最优超平面 6
2.2.3 Mercer定理 7
2.2.4 惩罚参数 8
第三章 支持向量数据描述理论 9
3.1 SVDD理论基础 9
3.1.1 数据描述方法 9
3.1.2 支持向量数据描述的基本原理 9
3.1.3 支持向量数据描述的特征 12
3.2 SVDD中的核函数 12
3.2.1 核函数的思想原理 12
3.2.2 SVDD常用的核函数 13
3.2.3 高斯核函数对SVDD的影响 14
3.2.4 SVDD中的数据预处理 14
第四章 支持向量数据描述为聚丙烯的生产过程建模 15
4.1 聚丙烯生产工艺 15
4.2 模型结构 15
4.2.1 建立模型 16
4.2.2 SVDD中参数的选择和构造 17
4.2.3 故障点检测 19
4.3 结果分析 22
第五章 结论与展望 23
致谢 24
参考文献 25
附录一 26
第一章 绪论
1.1选题的目的和意义
随着现代科学技术的快速发展,以及现代工业化步伐的不断推进。化工行业中也引入了更多的先进技术和先进的设备。随之而来的工程设备也日趋复杂化、精密化和自动化。功能也越来越多样化。但是设备在复杂多样化的同时,必然会出现这样或者那样的问题。由于遭受到很多不确定的因素的影响,设备的正常运行就会受到威胁,轻则影响产物品质、生产力下降,重则,会造成人员伤亡。例如2012年6月12日,某炼油厂生产车间发生聚丙烯急性爆炸,在爆炸事发地四周可以看到,该作坊车间处于一片狼藉之中,门窗全数脱落,此次事故造成一人受伤,间接经济损失数万元。而导致事故的原因仅仅是因为聚合釜投料口处发生活化剂泄露所致。
因此如何在设备发生故障前准确的预知设备的安全状况,成为了当前人们所面临的一个重要的问题。机械设备的正常运作及其可靠性主要依赖于以下两个方面。一是在设备的制造工艺过程中确保落实相关技术指标。因此,在设计上需要采用可靠的设计方法才能提升设备的安全性能。二是在设备的日常维护、保养和诊断过程中务必要达到硬性要求。因此,从另一个方面来讲保障设备正常运行的一个重要环节就是能够即时的对设备进行故障排除和诊断。随着工程技术的飞速成长,故障诊断的方法也渐渐向多元化发展,并且更加智能化。故障诊断学,其综合性比较强,并且是近年发展起来的。它涉及到人工智能、现代控制理论、模式识别等多种学术科目。按照德国故障检测专家Frank教授的见解,故障诊断办法能够划分为基于信号分析方法、基于模型方法以及基于知识的三种方法。本文在探索异常诊断的方法上提出了一个新的途径,支持向量数据描述的异常检测方法。此方法属于无监督的异常检测,他可以较全面的获取异常数据,体现故障特征,并且能够大大的提高异常数据检测的正确性。
1.2支持向量数据描述的国内外研究现状
支持向量数据描述方法是近年才被人们所认识的,它属于一种单值分类方法。它主要的依托就是统计学习理论和支持向量机。其基本思想是将被描述目标当做一个总体,并设法于特征空间中寻找一个最优超球体,且使该超球体全数或者尽量多的去包含被描述目标,而不是该类目标的则不包括或尽可能少的包括在该超球体内。被包含在超球体内部的描述对象被叫做目标类,而未被包围的描述对象被叫做离群类,以此来达到两类目标的分类。在设备运行和产品生产过程的异常检测过程中,正常运行状态的数据样本都是非常容易获取的,但是异常数据样本却出于各种原因很难获取,这一原因也是限制异常检测技术发展的一个重要因素。采用单值分类方法,单单需要常态下运行的数据样本而不需要离群类数据样本便能够构造一个单值分类器来实现两种样本分类,此方法与其他分类算法比拟,因其具有计算时间短亦可处理小样本数据等优点,所以在异常检测领域具备很好的推广价值。现阶段,支持向量数据描述方法的研究方向主要有理论和应用方面。
由于支持向量数据描述法是一种新的理论的发展,理论本身还存在许多问题。比方对一个已知的问题,如何对原始数据进行有用的预处理来让其符合支持向量数据描述算法的请求,以此来让其分类效果更显成效?如何计算映射函数的VC维?针对多数据样本如何选择算法来减少其计算量都是我们现阶段所需要解决的问题。支持向量数据描述作为一个小样本学习算法,当其对多数据进行处理的时候,往往伴随着学习时间较长的缺陷,这些问题让支持向量数据描述方法在实际工程中得到应用带来了很大的阻力。在故障诊断研究方面其应用还不是很广泛,现阶段的研究方向还主要集中在设备运行状态的监测和样本的特征提取。
1.3 异常检测技术的国内外研究现状
Dorthy Denning于1987年率先提及了入侵检测思想,当前所使用的各类检测技术与模型都是以它为基础的扩展和细分。Dorthy Denning提出的模型是一个基于机箱的入侵检测模型,他将当前被检测事件与模型进行校对,若不匹配则认为其实异常数据。
基于统计基础上的异常检测技术是全球起初发展,亦是最先进的异常检测技术。这个技术在大多数而且非常实用的入侵检测系统中被广泛利用到。在检测盗取者和外部侵入者时,基于统计的入侵检测技术将会展现出一个非常好的效果,但也会产生如下缺点:
1) 事件发生的顺序它不会考虑在内,因此根据事件发生的顺序对其进行攻击很难预测。
2) 当攻击者察觉到到被监督后,能够通过调节统计边界的自适应匹配,缓缓改变其行为,来培养正常边界,最后让检测系统判断其异常行为时出现错误。
3) 对于阀值的正常与否很难确定,阀值设置的太高或者太低都会引起虚警和漏警的现象。
为了解决Dorthy Denning模型没有参与考虑事件发生顺序的弊端,Henry于二十世纪末提出了预测模型,其检测入侵的手段是采用动态规则集合,上述规则以所观测到的事件顺序关系和局部特征来概括产生序列型态。而归纳机制则以时间的推理机作为基础,亦可以从一个过程的观察中找出暂态形式,进而事件的重复率也可以经过暂态模型体现出来,亦可用于精确预测。这类暂态模式的详细实现步骤是从所要观测的数据中生成一组假定,此组假定跟随动态数据变动而修改,而最终的结果是只有高品质假设才会存在在规则库中,而低品质的假设则会被丢失。通过对之前事件序列规律的观测,预测模型可以推算出下一时间输入数据流中某个时间较其他事件更有可能发生。
规则库的作用在于存储用户行为模式,每一种规则都对应着一个序列型态,并且以一定的概率判断下一个事件发生的可能性。
越来越多的人工智能方法的引入,给异常检测技术性能的提升提供了非常大的基础平台。这些人工智能的方法主要囊括了神经网络、数据挖掘等。自20世纪80年代来,异常检测技术经历了深入的研究,虽然至今才短短的20年,却已经取得了很大的成果。随着网络技术的向前推进,人们对安全认识也有了更加广泛的关注。从而亦促使了异常检测方法的不断增加,人们也越来越看好异常检测技术。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jxgc/zdh/4143.html