如何通过对样本库进行模糊处理有效减少规则数量使其处于合理范围内,最终形成用于RBR诊断的故障规则库?? 番禺云梯车出租
新闻分类:行业动态 作者:admin 发布于:2018-01-164 文字:【
大】【
中】【
小】
摘要:
如何通过对样本库进行模糊处理有效减少规则数量使其处于合理范围内,最终形成用于RBR诊断的故障规则库?? 番禺云梯车出租, 南沙云梯车出租, 增城云梯车出租 基于规则推理是根据以规则形式表示的知识进行推理,最终寻求满足目标条件的推理过程,是人工智能中十分有效的推理方式。基于规则推理也有不足之处,其主要体现在知识库的建立及维护方面,因为传统的基于规则推理的专家系统基本上是靠人工进行知识库的建立和维护。随着近几年数据挖掘的兴起,利用数据挖掘手段建立并维护知识库以弥补人工维护的不足成为研宄热点。规则推理的前提是掌握相关领域的知识,其后将这些经验知识总结、形式化并通过规则描述出来,最后模仿专家在求解过程中的思路进行推理从而将当前问题与目标联系起来。基于规则推理中,将领域内专家的经验和知识抽象为格式统一的IF-THEN形式以便读取,其表示形式如下:IF条件THEN结论规则的“IF”部分(或左部)称为规则的前件或前提,“THEN”部分(或右部)是规则的结论。一个或多个属性(特征项)测试通过逻辑连接词AND或OR连接,组成规则前件。规则的结论用于指出当条件满足时,应进行的操作或结论。对于一个规则,如果规则前件中的条件(即所有属性测试)都满足,则此规则被满足。
在基于规则的推理时,有可能出一个规则的结论是另一个规则的前件,因此基于规则的推理是一个反复从规则库中寻找合适规则并加以执行的过程。本文通过数据挖掘中的关联规则分析法从模糊后的样本库中提取、挖掘有用的诊断规则并建立规则库以替代人工经验产生的规则库。模糊分析模糊理论是指用到了模糊集合的基本概念或连续隶属度函数的理论。模糊理论拥有五个分支,分别是模糊数学、不确定性和信息、模糊决策、模糊逻辑与人工智能、模糊系统,他们联系紧密,同一个系统中经常会用到模糊理论的多个分支。模糊理论在实际应用中主要分布在两个方面,分别是模糊系统和专家系统。本课题所涉及到的样本数量较多、每个样本中又包含多个特征项数据,直接使用关联规则分析进行规则提取容易出现以下两种情况:1、支持度阀值和置信度阀值设置较低时,产生海量规则,从而降低RBR系统的运行效率。2、支持度阀值和置信度阀值设置较高时,产生规则数有限,使大量问题寻找不到合适的规则进行匹配。为避免上述两种情况的发生,本文将各特征项的特征值转化为模糊语义后再进行诊断规则的提取。这样不仅能够将诊断规则控制在合理范围而且可以提高规则的通用性。
模糊理论隶属度函数也称从属函数,它可以描述事物的模糊概念。隶属度函数按照取值范围不同分为偏小型、中间型和偏大型分布。偏小型分布拥有上偏差点和上极限点,中间型分布拥有上偏差点、下偏差点和上极限点、下极限点,偏大型分布拥有下偏差点和下极限点。本文依靠这些模糊分布中的特殊点来界定特征值的正常、偏高和偏低。
样本库的模糊处理以空调系统为例,对样本库中的数据进行统计,寻找出各特征项对应的隶属度函数分布,并使用各分布中的上下偏差点来界定样本库中特征项的值的正常或偏差。空调系统各部位的压力和温度数据皆通过连接三通管测得。 电压作为空调系统的基本属性,其主要目的是界定本系统的运行情况,一般为24V,可能出现上下5%的浮动。电压也可能出现过高或过低的故障现象,经过对比发现样本库中系统电压的特征值可以利用正态分布中间型进行模糊处理,其上下偏差点大致为26V和22V。因此,设其正常值为:22V-26V,偏低值为:低于22V,偏高值为:高于26V。2、压缩机转速在样本库中的分布情况。 样本库中压缩机转速的特征值可以利用正态分布中间型进行模糊处理,但是压缩机转速作为空调系统的基本属性,其主要功能是用来界定系统运行的工况,不存在故障情况,因此不对其进行模糊处理。3、压缩机出口压力的特征值在样本库中的分布情况。本库中压缩机出口压力的特征值可以利用梯形分布中间型进行模糊处理,其上下偏差点大致为2.9MPa和1.6MPa。因此,设其正常值为:1.6MPa-2.9MPa,偏低值为:低于1.6MPa,偏高值为:高于2.9Mpa。4、冷凝器出口压力的特征值在样本库中的分布情况。
番禺云梯车出租, 南沙云梯车出租, 增城云梯车出租
发现样本库中蒸发器出口压力的特征值可以利用梯形分布偏大型进行模糊处理,其下偏差点大致为0.1MPa。因此,设其正常值为:0.1MPa-0.2MPa,偏低值为:低于0.1MPa。9、蒸发器出口温度的特征值在样本库中的分布情况。本库中蒸发器出口温度的特征值可以利用梯形分布偏小型进行模糊处理,其上偏差点大致为15°C。因此,设其正常值为:10°C-15°C,偏高值为:大于15°C。将样本库中的数据通过上述模糊处理后,得到的模糊后的空调系统故障样本库(部分)。
support(B)规则的提升度的意义在于度量A和B的独立性。如果提升度等于1说明A和B没有任何关联。28(RBR)关联规则首先要从数据集合中找出所有满足用户给定最小支持度的频繁项目集(频繁项目集中所包含项目的个数可以根据用户的需求设定);第二步要在频繁项目集的基础上生成所有满足用户给定的最小可信度(支持度、置信度)的关联规则。第一步集中了绝大部分的计算量,主要是数据量巨大造成的,因此对于算法的效率以及可扩展性都具有很强的挑战性。第二步相对简单,其关键问题就是选择合适的支持度阀值和置信度阀值,从而将产生的规则控制在合理范围内。Apriori算法是关联规则中的经典算法。算法首先扫描整个数据库,找出满足最小支持度的项,形成频繁1项集的集合记为&。其后,以&为基础使用同样的方式寻找出频繁2项集的集合,如此循环,直到不能够找到频繁A:项集为止。利用R总结规则1、加载数据库中的数据使用RStudio进行关联规则分析并总结规则的第一步是从数据库或者Excel表格中将数据读取出来。数据加载过程应用到了ROBDC包,其中包含开放数据库连接。函数用来建立一个数据库连接;函数用来向数据库发送一个SQL查询;函数〇办cC/o〇,用来关闭己经建立的数据库连接。以空调系统为例,将“模糊后的空调系统故障样本库”加载到RSdudio中,并展示出来。
2、使用关联规则本文应用Apriori算法进行关联规则挖掘,Apriori算法的相关代码包含在R的arules包中。Apriori函数用法的伪代码。在Apriori算法的使用中,默认的值往往不能为研究者提供可靠的规则,因此需要对设置进行修改编写。w/n/ert用来设定关联规则的最小长度,(LeftHandSide)指的是关联规则左侧出现的项集,r/w(RightHandSide)指的是关联规则右侧出现的项集。除此之外可以压缩过程的细节信息,函数可以让关联规则按一定顺序排列。在Apriori算法中最小支持度阀值体现出了项集之间的关联性,如果某次得到的关联规则过多,可以通过提高最小支持度阀值的方式来减少规则,因此一般在刚开始时将最小支持度阀值设置为较低值,在得到较多规则、验证不合适后慢慢提高其值。“模糊后的空调系统故障样本库”通过计算得到了12条规则,比较符合设想和经验,因此可以接受。
番禺云梯车出租, 南沙云梯车出租, 增城云梯车出租