决策树方法的手机故障诊断(附件)【字数:10051】

摘 要随着科技的进步以及移动互联网的发展,手机已经成为大家日常生活中不可缺少的一部分。如今手机已经不再是简单的通讯工具,更是人们用来娱乐、消费、办公等活动的生活必需品。在这个科学技术日新月异的时代,手机故障显然成为了人们的一大困扰,这也是我们研究手机故障诊断的意义。通过手机的待机时长、运行速度等特征对手机故障进行预测,能有效评估风险。决策树方法作为数据挖掘技术中解决分类问题的方法之一,在实际运用中已得到广泛应用。本次课题我们将数据挖掘分类方法中的决策树与手机故障诊断相结合,从而进行了研究。经过对手机故障概念及原理的学习,将使用年限、待机时长、运行速度及信号稳定性作为特征,采集了30组训练数据。通过决策树中的ID3算法对该训练数据做出处理,最终生成了相应的故障诊断预测模型。在本次手机故障诊断系统中,以ID3为产生决策树的方法进行了研究,对该系统进行需求分析及详细设计,同时也对故障诊断系统中功能的实现有较为详细的介绍。
目 录
第一章 绪论 1
1.1课题研究背景 1
1.2课题研究重点和内容 1
1.3决策树算法 2
第二章 决策树技术的基本理论 3
2.1决策树技术及分类技术的发展 3
2.2决策树算法之最优特征选取 3
第三章 手机故障诊断设计 5
3.1系统总体设计 5
3.1.1系统需求分析 5
3.1.2系统设计方案 5
3.2手机故障诊断决策树的构造 6
第四章 手机故障诊断系统实现 10
4.1程序思路概述 10
4.2程序代码解析 10
第五章 手机故障诊断系统测试 13
5.1决策树模型生成测试 13
5.2手机故障预测测试 14
5.3历史预测信息查询 16
第六章 总结与展望 17
6.1研究总结 17
6.2决策树发展趋势 17
结束语 18
致 谢 19
参考文献 20
第一章 绪论
1.1课题研究背景
如今手机市场已看不到 *好棒文|www.hbsrm.com +Q: ^351916072^ 
摩托罗拉的身影,但第一台推向民用的手机以及大哥大的发明都是在摩托罗拉公司,这也是当初它在移动通讯行业上地位崇高的原因。大哥大传入大陆是在1993年,这也预示着中国通讯时代的到来。随后人们为了更高效且更方便地去使用,在历经了多年的研究之后,第一代“智能手机”终于问世了,它就是塞班系统手机。塞班系统的诺基亚手机和摩托罗拉一样难从市面上寻找到,但诺基亚的名气绝对是可以和摩托罗拉相媲美的。科技的力量是强大的,如今Android系统和IOS系统已经占据了主流地位。
在本次课题的研究中,我们将数据挖掘分类方法中的决策树与手机故障诊断相结合进行研究。首先简单介绍一下手机故障的因素,除了人为原因以外,其他的因素也是不可忽略的。使用年限就是其中的一个因素,手机和人一样,当手机的年份过长,运行速度就会变慢,严重的可能经常卡死。使用年限过长也可能带来待机时长的变短,而具体手机的使用寿命随使用者的使用而不同。尽管随着手机使用时间的变长这些问题是在所难免的,但是做出相应的保护也会延缓手机的这类故障。其次就是长时间搁置手机,这并不是对手机的保护,相反可能会有损害。大家都知道锂电池的自放电是比较强的,正常情况下他的放点为10%到20%左右,在不放电时,电池也会自放电,容量会慢慢用完。电池自放电过强是导致内部结构的损坏的因素,长时间搁置手机后再次进行充电带来的后果,轻则影响电池容量变小,重则导致手机无法充电。
此次课题研究数据挖掘分类方法中的决策树,将决策树引入到手机故障诊断中,将它作为故障诊断的方法进行了研究,将手机故障诊断与便于理解和解释的决策树结合在了一起。决策树作为一种预测模型,可以用来进行分类,能有效地对手机进行了风险预测,从而降低风险。
1.2课题研究重点和内容
基于决策树方法的手机故障诊断,利用决策树方法预测手机是否存在故障。首先要研究的是决策树,要求我们掌握分类决策树,如何通过样本数据建立起分类模型,又要如何进行数据分类(预测)。其次就是手机故障诊断,对手机故障原理要有一定了解。翻阅相关书籍及网上查阅,对分类决策树有了一定了解,最终我们选取ID3算法作为本次课题的研究重点。信息增益作为ID3对属性划分的依据自然是学习的重点,除此之外信息熵,条件熵都是需要掌握的重点。确定好手机故障的样本数据,经过多次计算信息熵及信息增益,各特征之间信息增益的比较,最终构造出决策树模型。不从程序的角度出发,构造这样的一棵决策树理论还是比较简单的,但由于信息增益的计算需要面对大量对数运算。
从构造决策树方面解析,选取最佳特征划分为核心,需要关注信息熵和信息增益的计算。除此之外,我们还需要编制一个可演示手机故障诊断的分类决策树的计算机程序。要求通过手机故障诊断的训练集数据生成决策树模型,当输入某台手机的测试特征数据时要能够输出测试结果。
1.3决策树算法
从目前的比较流行的ID3、C4.5以及CART决策树方法介绍,ID3算法被称为最简单的决策树,C4.5算法在ID3算法上进行了一定的改进,CART算法更是在数据挖掘领域内有很大影响,它不仅可以用于分类还可以用于回归。
建立在了奥卡姆剃刀基础上的ID3算法由Ross Quinlan发明,主要特征有以下几点:1、针对某个样本数据集合,计算不同特征信息增益值的大小,在第二章中我们也会对信息增益做出详细介绍。2、以信息增益作为最优特征选取的标志,取信息增益最大值的作为最优属性。3、在构建决策树模型时是反复调用建树算法。4、若样本在某个特征下的类都相同,即变为叶子结点。
继ID3之后Ross Quinlan又提出了C4.5,严格讲C4.5是ID3的改进。通过信息增益选取特征会存在弱泛化的问题,C4.5算法与ID3算法最大区别在于优化了节点分支的计算方式,解决了ID3算法分支过程中偏向取值较多的属性。
ID3算法及C4.5算法最优特征属性选取的度量标准为信息增益和信息增益比,这两者都是基于熵模型,虽然理解起来比较方便,但却包含了大量的对数运算。在数据挖掘中分类方法领域CART有里程碑的著称,它是以基尼系数选取最佳属性分类,与信息增益相反,基尼系数越小属性就越好。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/qrs/6.html

好棒文