【摘要】本文以所有半直驱机型是吊车的风力发电机组是吊车的历史故障数据为研究对象,通过对过去所有是吊车的历史数据进行数据处理后,基于运行期间的平均无故障运行时间(MeanTime Between Failure,MTBF)及其所属删失数据类型,采用Kaplan-Meier非参数估计方法拟合生存曲线,进而计算出机组未来时间的故障发生率,并以图示进行直观展示,达到提前预报风机的异常状况,为运维人员进行故障前的预见性维护提供有力支撑,从而降低风机全生命周期维护成本,提升运维效率。
【关键词】平均无故障运行时间;Kaplan-Meier非参数估计方法;故障发生率
随着人工智能技术和边缘计算技术在工业领域中的快速发展,预见性维护在工业互联网方面有着极为重要的作用。预见性维护是通过采集数据分析设备的状态,预测可能的失效时间,提前进行维护,以防止故障的发生。传统的风机维护模式多以“被动式运维”为主,主要依靠现场工作人员进行定期维护和故障检修,其运维成本极高,也容易出现由于人员水平不一导致过度维护或欠维护,引起发电量的损失。而对风电机组有效的状态监测和提前的故障信号的捕捉,及时进行预见性维护,不仅能够大量减少计划外停机时间和维护时间,还能大幅降低故障维修成本,进而提高风电场的运行水平。
通过分析风机各部件历史故障规律,抓取风机故障前兆,在风机某故障真正发生之前,判断风机故障率是否达到警戒红线,进而及时预报风机的异常状况,采取相应的措施,从而最大程度的降低因风机发生故障所造成的损失。本文以公司的半直驱机组为例,收集与分析该机型某故障的所有信息,通过数据处理计算出平均无故障运行时间,确定数据的删失类型为右删失数据,选择合适的非参数估计方法Kaplan-Meier方法估计可靠度,进而计算出累积故障率,以预测可能故障时间,为预见性维护提供一定的参考依据。
2.1基本概念简介
Kaplan-Meier(K-M)估计也称乘积限估计(productlimit estimator),简称PL估计。由Kaplanand Meier于1958年首次提出,主要用于对非参数数据进行累积故障率和危险率的估计。
其定义为:产品在规定的条件下和时间内,丧失规定功能的概率称为累积故障率,其是时间的函数,一般用表示。如果用表示产品寿命,那么对于规定的时间,有
而可靠度的定义是产品在规定的条件下、规定的时间内能完成规定功能的概率。同样,可靠度也是时间的函数,对于某个指定的时间而言,如果产品的寿命大于规定的时间,即,则产品一定能完成规定的功能;否则,若,则产品不能完成规定的功能。一般用表示可靠度函数,它可以看作事件“”发生的概率,即
由式(1)和式(2)可得,可靠度函数和累积故障率分布函数之和恒定为1,如果将两条曲线绘制在同一张图中,两者的升降趋势刚好相反,如图1所示。
图1 可靠度函数和累积故障率分布函数
2.2 算法原理
对总体的个个体的运行时间进行观测,得到(其中可能有右删失数据,但没有左删失数据)。当是精确数据时,令;当是右删失数据时,令。那么数据就可以记为()()。将这些从小到大重排(当一个删失数据和一个精确数据相等时,则将精确数据排在删失数据之前),得到当是精确数据时,令;当是右删失数据时,令。
通过统计理论的结果知,对于上述数据,其可靠度函数R(t)的乘积限估计为:
根据可靠度与累积故障率的关系,可知累积故障率。
3.1故障树建立
故障树专家库建立主要分为两种,第一种是基于专家经验建立的故障树,第二种则是利用NLP方法,提取故障工单关键词,将其核心关键词与部件进行相关联建立故障树。
3.1.1 故障树节点概率计算
在计算相应节点概率过程中,一部分采用专家经验值作为节点概率,另一方面则是将故障工单中的关键信息进行提取,采用TF-IDF方法和TextRank方法对词频进行分析,对相关词进行重组之后与相应的节点进行对应,从而计算出相应节点的概率。本文以齿轮箱油位低为基础,进行节点概率计算,其故障树以及节点概率见表1。其中,node_id为故障节点编号,node_parentid为故障父节点编号,node_type为节点类型(1根节点,2中间节点,3叶节点),node_type_desc为节点描述,node_name为故障节点名称,pr为故障原因概率(各叶子节点概率为在同一中间节点下的概率占比)。
表1齿轮箱油位低故障树以及节点概率
3.2 数据预处理
采用2016年以来所有故障数据作为原始数据集。原始数据主要存储内容为故障开始时间、故障结束时间、故障持续时间、故障码、机型等信息。通过数据清洗将缺失数据进行剔除后进行无故障时间计算、故障次数、删失数据标记、平均无故障时间计算等。
3.2.1 平均无故障时间计算
1)平均无故障时间的计算采取两种方式:方式一是针对历史发生过该故障的机组,计算其平均无故障运行时间;方式二是针对全部机组,计算其无故障运行时间。以相邻故障时间差作为无故障时间,部分计算结果见表2。其中,wtgs_code为风机编号,Nofault_time为无故障运行时间,Fre为故障频次,E为数据缺失类型(1为精确数据,0为右删失),ave_nofault为平均无故障运行时间。
表2数据清洗以及部分计算结果
3.2.2 K-M非参数估计计算
根据平均无故障时间和删失数据标记进行K-M分析计算,再依据可靠度与累积故障率的关系计算出故障树根节点各时间段对应的故障率,计算的部分结果如图2、图3所示。其中,横轴为机组无故障运行时间,纵轴为根节点的累积故障率。故障机组指历史上有触发过该故障的机组,全部机组指历史上未触发过该故障的机组。
图2故障机组累计故障率结果
图3全部机组累计故障率结果
3.2.3结果与分析
图4齿轮箱油位低故障树
通过上述的分析过程,建立起一个完整的故障树,里面包含根节点、叶子节点、中间节点、相应节点发生的故障概率,以及在相应的无故障运行时间下,估计发生故障的概率,图4为故障机组齿轮箱油位低无故障运行一周后,故障树及其故障概率展示。(红色:,橙色:,蓝色:,灰色)
本文对2016年以来所有机组故障进行建模分析,采用专家经验和文本挖掘思路建立相应故障树。利用非参数估计K-M估计建立平均无故障运行时间和累计故障率之间的关系,对各个节点概率分别进行计算,以2021年故障数据进行验证,该模型准确率达到80%左右。案例结果表明,所提方法不仅可以快速定位已有故障的具体根因,而且可以通过预测某台机组在相应的无故障运行时间下的故障发生率,为现场预见性运维提供一定的参考价值。
参考文献:
[1]李晨光.五轴联动数控机床可靠性评价及其系统实现[D].北京信息科技大学,2020.
[2] 马逢时,吴诚鸥,蔡霞.基于Minitab的现代实用统计[M].中国人民大学出版社,2017.
[3] 芮晓明,张穆勇,霍娟.试运行期间风电机组平均故障间隔时间的估计[J].中国电机工程学报,2014.
作者:明阳智慧能源集团股份公司 李高娟、张辉 鲁纳纳 孙启涛