明阳智慧能源孙启涛:风电机组健康管理与故障预测
2017年10月16日-19日,2017北京国际风能大会(CWP2017)在北京隆重召开。在中国国际展览中心(新馆)“风电场智能运维”专场,明阳智慧能源集团股份公司大数据中心数据分析部部长孙启涛就“风电机组健康管理与故障预测”发表演讲。孙总提出管理与故障预测系统需要数据采集的能力、分析建模的能力和智能化分析能力。
以下为演讲内容:
孙启涛:尊敬的各位专家,各位同仁下午好,我来自明阳智慧大数据中心。
首先是开篇一个引言,我想分享一个故事,这个故事估计有的人听过,扁鹊应该是我国古代非常有名的医生,我相信大家可能不是特别了解他有两个哥哥,他的两个哥哥分别从事医学,医学高明,有一天魏文王为扁鹊你们三个都是搞医学的,你们谁的医术最高的?扁鹊思考了一下说,在家里面,长兄医术最高,中兄次之,我是最差的。
我说我的长兄治的是病情发作之初,中兄是治病于发作起初之时,他能够在病情发作之时看出来,而我扁鹊治病是到病情发作之后,人们看到我做的手术,实际上我的医术不如他们两个。
相信这个故事我们反思一下,我们在风电管理和运维当中,我们扮演的角色是扁鹊的长兄、中兄还是扁鹊呢?相信我们都有很明确的答案,我们现在扮演的都是扁鹊的答案,当故障发生的时候我们才能有效地针对性维护,我们要通过故障预警,防患于未然,才是风电场运维的王道,在问题发现之初去进行维护。
如果我们要像扁鹊的长兄那样需要什么样能力?分别是数据采集的能力,不仅仅是传感器的数据、气象资源的数据,第二个要有非常强大的分析建模的能力。第三个层面的话,把我们前期采集到的数据通过大量的智能化分析之后,把它包装形成一定的应用,这样的应用系统大量的监控平台,能量管理平台,以及智能检测平台,来支撑前面我数据的分析应用。
第二部分,想跟大家谈一下亚健康预警的研究,其实我们大家知道风电机组设备跟人一样,不可能跟人一样良好的状态,一下到故障状态,它是有一个过程,不是说我现在分享风电机组知识,下一刻我就生病状态,是不可能的。
风电机组健康发电与故障之间的状态是有一种亚健康运行模式,这个模式是怎么发现的?需要我们进一步研究。
这个是风电机组的四大部件,其实每一种大部件有非常特有的模式,下面我以齿轮箱为例子,实际上对于整个齿轮箱来说,我们现在是自下而上的分析过程,下面这个T就代表齿轮箱损坏的故障,如果我们能够有效地识别它底层状态,并且在底层状态进行有效识别,并且防护的话,我们就能够有效地避免问题。
那么刚才提到了齿轮箱我们是从上而上分析的,反过来说就是齿轮箱FMEA的分析,通过这些分析我们可以有效地识别出来大部件失效的模式。
明阳在整个大部件运行过程当中是采用两种方法,第一种是专家经验,那么这一种专家经验是针对各个专业科室以及工程运维现场故障分析诊断的丰富经验进行集成,建立故障预警模型。但是它依托于有强大的运维经验。
同时为了避免这种情况产生,我们提供了大数据分析系统,第一个是利用统计学的方式,采用一些中位数、分位数、均值,来建立预警模型,第二个通过机器学习,人工智能、深度学习,通过历史故障记录,通过机器学习训练,来实现提前预警。
目前我们做的整个对机组的叶片主轴、叶片、偏航系统、变桨系统分别建立了预警模型,同时我们对每个预警模型进行了分析,这样的预警信息一旦推送到现场之后,必须在24小时之内进行第一时间处理,第四项情况就不是那么严重,对整个机组的健康运行,影响度是非常小的。
这也就是我们对于基于专家经验,对每一个预警模型建立亚健康运行的范围,我们如何识别亚健康的状态。
第二部分,基于大数据分析技术,通过机器学习算法,建立非常多的数字模型,通过我们大数据分析的云平台,实时地计算出你理论值和实际值进行比较,如果超出设定的范围,超出合理范围之后,这样会第一时间发出预警信息,也就是大数据预警模型。
现在明阳智慧已经开展了十多种算法,举几个例子来说,基于分为数和中位数的算法,我们其实在今年5月份的时候,首先通过过去一年的历史数据,进行了分为数和中位数的预算,我们再分析今年5月1号到5月7号的数据时发现,4号机组的齿轮箱某些标签点异常状况较为严重,通过专家判断后认为机组润滑散热等出现问题,需要排查,因此发出警告信息。
需要说明的是,其实在我们发出预警信息之后,这台4号机组在风电场同类型当中还是表现最优秀的,它平时表现非常好,但是很用可能它一出问题就是出一个大的,也就是说如果我们没有这样的技术,任由它自由发展,进一步导致就是润滑油整个的不足,进一步导致齿轮箱的损坏。
这个是TF-IDF的方法,左边这个图,红的0代表非故障的状态,1代表故障的状态,同时右边两个图,上边1号机组TF-IDF值比较高,3号机组状态是正常的,1号机组是偏向于异常的。
系统应用的话,刚才我们提到我们建立了许多预警模型,包括亚健康的分析,提到了应用的开发,现在已经上线了亚健康预警检测系统,在过去三个月当中,我们所有在线运行模型已经超过90%,按照预警等级,这些等级和故障情况可以有效识别你机组是什么状态,或者计算出健康度现在处于什么样的分数。
谈完亚健康的话,想跟大家分享一下健康状态评估的研究,我们现在基于劣化度的方法,有超小优越型,有中间型,还有越大越优的,这个我们有详细专业的评价过程,我们首先确定一些参数,包括历史度的参数,变量的类型,评估的等级,通过这些等级之后,我们一步一步通过我们实时采集的数据,计算出各个变量的劣化度,计算出各个部件的劣化度,然后计算出历史度,然后做出评判,得出一个部件的评估结果,最后综合而成一个整机的评估结果,最差的就是整机目前的状态结果。
这个是我们在过去一个月当中齿轮箱、发电机、叶片,整个组成机组的劣化度。通过这个分析出是处于亚健康状态,下一步怎么做呢?如何分析呢?其实这是一个问题,是什么原因和指标恶化,导致我们齿轮箱由一个良好状态进入恶化的状态。把每一个部件,每一个标签点计算出的劣化度,每一个时间周期,健康周期,这样一层层分析决策出来,就可以知道每一个部件相关联的健康程度,也就是我们可以决策出来每个部件产生的健康范围的范围,那么当这个范围出来的时候,我们就可以准确知道是什么问题。
这样的话,基于劣化度部件状态度,可以确定每个时间单位状态变化标签组合,通过前后状态的切换,得到两个时间单位的标签组合差,最终根据决策数的分值,来判断标签点值变化,从而进一步通过这种决策,进一步定位到是哪一个原因造成的。
我并不是特别关注你现在部件所处的状态,我们更加关注的是部件变化的过程,有的时候一些机组运行的状态,并不是从A到B到C到D,也有可能是从A到C。
刚才提到了比较具体的技术,这些技术能够支撑我们的运维服务,首先介绍一下明阳的大数据中心,我们在中山建立了大数据中心,它也是我们跟风电场互通互联,这里是7×2小时值班,首先我们通过大数据平台计算的数据,发送的隐患,实时推送到风电场,风电场根据计算出来的结果,跟工程技术专家团队计算结果以后,再把数据发送到平台,这样不断优化,模型不断调优,准确率是不断提升的。
其实刚开始进行机器学习的时候,准确率只有20%左右,反复的模型优化才逐渐达到比较可观的准确度。
其实刚才说到发出的这些预警信息,是不是第一时间内得到维护?答案是不一定的,我们依托于明阳集团开发的天气资源预测系统,这里是风资源的变化,包括温度、气压、云层,尤其是海上海浪的变化,这些数据支撑有可以有效指导现场进行排查计划。
比如现在需要排查一个隐患和预警的话,它不是那么着急,而且现在风资源特别大,我就可以通过根据情况来安排检修维护。
尤其是南方的台风,台风来的时候我们要有效避免台风带来的损坏,同时我们也希望变废为宝,利用到台风。
智慧运维服务,我们现在所有工单都是实现自动化的推送,支持手机APP和PC端,这一个就是我们一个预警工单排查的详细信息,以及排查的内容,包括你带什么样的工具,最后反馈一个模型的准确性,现场排查的原因,也就是说我们对于现场人员的支持,可以非常清晰地知道什么人在现场做什么事,每一个流程都需要上级审批的。
最后一个展望未来的话,我们希望通过风电大数据平台,建立一个大数据智库,包括我们整机制造厂商,以及行业协会,最终构成一个大数据生态圈,共享风电的良好发展,我的分享就以上内容,谢谢大家。
(发言为能见APP整理,未经本人审核)