天数智芯颉彧:风电场数字化技术应用
2018年10月17日-19日,由中国可再生能源学会风能专业委员会、中国循环经济协会可再生能源专业委员会、全球风能理事会、中国农业机械工业协会风力机械分会、国家可再生能源中心和中国电子信息产业发展研究院(赛迪集团)六大权威机构联合主办的2018北京国际风能大会暨展览会(CWP 2018)在北京新国展隆重召开。能见App全程直播本次大会。
天数智芯副总裁颉彧先生出席本次大会,在风电数字化技术论坛作“风电场数字化技术应用”的主旨演讲。
以下为发言实录:
颉彧:感谢各位来宾,首先是这样,今年是我第十次来风能展,分享我今天的感受,各个展馆看到数字化也好,智能化也好,很明显这是一个方向,我们看到的我认为从我个人的理解,更多的是大家想做的,而并非是大家已经做到的,这个方向没有错,怎么把这些东西实实在在的抛开一些噱头,抛开一些宣传,怎么把我们数字化和智能化真正的落下去,这可能是大家更多要去思考的方向。
我们传统工业产品向互联网的一些产品在去靠,但是仍然是在一个路上,我们还是回归到理性来分析一下这里面可能拥有的几个阶段,首先就是说可能从我们传统的采集处理,这个相信各个主机场,业主这个阶段已经度过去了,我们慢慢接触到一些核心的数据的分析的工作,状态的检测,故障的预警做一些东西,离我们真正想要的所谓的交互,感知目前来看有一些距离,在这个阶段对于风电行业,分三个阶段,我们讲采集传输和管理,各个厂家在去年到今年整个阶段集中在做这样的工作,我们各个厂家都在建设我们大数据平台,包括我们可能最早建设的好几个企业的大数据平台,大家把这个东西想的过于简单,推倒重来,这个过程中大家有一些很扎实的基础要去做。大家虽然都讲到都有了这些东西,但是水平目前在参差不齐的阶段。大家受困比较多的,这儿多年产生无数的数据,这个数据给我们有什么价值,如果任何的数据不能给我们挣到钱或者省到钱的话,除了占我们的硬盘以外,一点意义都没有,在分析层面也有更多的企业进来希望能从所谓的数据金矿里面正儿八经挖出一些金子出来,这样才可能为我们行业带来一些新的价值。
这轮的所谓叫智能制造也好,或者叫数据也好,最终看我们所有运行数据驱动智能的发展,我们解决的过程中三个因素,首先是我们讲的数据,数据我们行业已经有了,至于多不多,全不全准不准,抛开这个层面,我们有,算法和算利方面的支撑,剖析这方面可以做的一些工作。
在风电行业比较新的名字,所谓数据的采集和存储,这个方面实际坑比较多,大家也已经经历了掉坑里再爬上来的过程,我们这里面有几款核心的产品,skydb,skydi的东西,我们最终到底谁来用,我们有很多的数据平台厂家,帮各个企业搭建平台,进了另外一个坑,我的数据分析团队进来,你做的数据平台用不起来,把原有的平台推掉再做,一定要是懂数据分析的人来做,天数有一些优势,我们本身有很强大的数据分析的团队,我们在搭建的过程中和传统的企业不一样,我们在整个数据平台搭建过程中,我们只在乎什么样的组建对我数据变现有价值我用什么,而不是企业说我压缩比高,我帮你使省硬盘,我最重要数据干什么?要做分析,不是存起来。
帮我们做表格各种各样的方法,目前2013年并没有从传统的电器机械物理层面知识解决掉一些问题,因为我们剩下的还没有解决的问题都是疑难杂症,在这个方面我们有一款核心的产品,skylntelligent,最终这些东西都需要在系统里面做这样的数据变现,利用一个一个功能,帮我们最终把钱挣出来,最终把钱省下来,我们看一下数据的工作,我们帮很多企业做这样的数据平台,我想着重强调的是,我们在这里面有几个比较核心的点,比如说大家都用数据库,数据库有各种各样的数据库,我们从2017年开始在美国大火的数据库KSB,这种数据库我们发现在工业的数据分析场景里面具有非常大的一些优势,我们的团队基于此也对这个进行一些大改,进行很深化的改造,让数据库适合我们。
我们重要的力量在硅谷,我们做算法下推的工作,我们数据库完成第一步不光把肉放进去,做成肉丝肉片肉丸,炒什么菜做去做,可以提升平衡型的率系统里面整个的功能,现在我们怎么样做人工智能的应用,大家去写代码,和我差不多大多数都是学机械或者电器出身的,让我们写代码有点晚成本太高了,我们核心产品做探索性的分析,一个算法最终我自己去尝试用所谓的拖拉拽扯可以帮大家大大降低门槛,大家要思考一个问题,到底什么样的人做出来所谓的模型是最准确的,一定是在座各位的行业专家,但是我们缺什么,我们缺一些降低门槛的工具,这可能是我们下一步要做的事情,业务层面,PHM里面做的比较。
我们现在实际通过我们各个组建,运行数据采会,数据探索和理解,建模,模型库,运行环境,我们把整个链条打通了,模型的泛化性,也是影响发展的很重要的因素,传统的集控监控都有,技术难度并不高。PHM的核心价值,我们怎么判断某一台设备是否健康,我的设备现在是90分,里面发电机是80分。首先实际我这个分数评定是怎么评定,要准确,另外我现在机组60,你怎么告诉我回到85分。在这里边我们有大量的功能可以实现这一步,我们还有另外功能,不光要知道我的机器今天是多少分,还知道它两天以后,一周以后是什么样健康的状态,会不会有恶化的趋势,我们有一个48小时健康度的管理,通过各种各样模型。
我们叶片都是靠大量的叶根螺栓连起来的,我所有的螺栓scada无法发现故障,我们通过LSTM的短时记忆网络,随时森林方法,学习方式形成一个模型,模型越简单大家越明确,左下方很简单的表,红线是模型里面用到数据特定的趋势,最终实际我们模型,你当年让我训练的坏的事情又来了,发现螺栓要断裂了,通过这样的方式发现它。另外一个我们齿轮箱,左下角,数的维度是时间的维度,我们给大家提一个报警,损害概率8%,昨天上到12%,对我们业务专家我们可以理解,真的可能要坏了,我们发现这种概率上升到56%,实际的例子,我们在我们的scada,齿轮箱高速绳段了十万块钱就解决掉了,损害什么?大量的碎屑破坏最后没办法齿轮箱从天上掉下来,都是两百万两百五十万的适量帮大家解决大量损失的问题,我自己做故障分析起家的,让我分析为什么坏了,全是一堆铁沫子,分析出来结果我没有水平,早期故障的发现,让我们的故障分析师有一些很好的样本,我分析材料,分析组织也好,我们有一些好的样本,我有一天我们真正的从制造的环节解决这样的问题。
我们行业有一个扯不完的事情,有一个问题,我帮业主写过报告,他问我为什么我说12345678这是很系统的问题,这些因素都会导致这种结果,这种过程中说实话,我也只是改了个报告,我们现在通过神经网络,通过这种算法这是我们给一个能源集团做的,这里面看起来是很大的决策树,我们有25条通路,我们透过不同的通路,不同的算法,我们给客户得出的结论,过去一周七天时间,风电场机组可利用率,和你理论的利用率,94%的情况。只有先得出来这个让我们主机场尽快的去解决我是不是先把这个结冰的问题解决掉,什么问题解决掉,其他的方式来解决,首先第一步先把这个做出来,慢慢的我们全解决掉。
以前我们看叶片用望远镜看,无人机厂家进入这个领域,以前靠我们专家去看,这个东西一但上量,一个人在电脑前看同样的视频一个小时眼睛就花了,我们通过去年一年时间8个月的时候,手动标注了11万张照片,一万八千张故障的照片,用深度学习我们做成了一个系统,现在我们这个系统的准确率大概是98.2%,这个过程中我们现在视频回来直接出一个报告,分几个维度,第一叶片上面总共坏了六各地方,分别长什么样子,第二你故障类型是什么,是裂纹,剥落还是雷击了,这个东西多长,第四我这个在什么位置,拿这份报告直接就去修了,我也跟很多叶片场的同事交流过,我们传统的sCada发现的,五万块钱修完的叶片年年都要修,20年以内永久性的损伤是不可逆的,风机时刻处于一个健康的状态,要提前去发现一些问题。包括实际我们现在在智能制造只做两个行业一个是风能一个是高铁,轨道交通从安全性和可靠性,远比我们风能要高,这是我们给中车的子公司做的,上海地铁十号线的照片,是4个G,我们把它进行采图进行各种各样的分析,一个地铁开过去,拍摄的图片,我们看到这个车里面,螺栓东西是否有掉落,跟中车集团子公司都在深度的合作,和人相关规定的合规的方式在操作,这些东西要我们去考虑的,我们已经做出了大量的实际的案例,
我们讲了这么多的东西,最终我们一个问题,大量的算力,做的所有东西通过我们核心产品一体机来做,有我们核心的软件平台,这里面具备了让大家更好的更简单的去做一些数据分析的基础和工具,目前中车的株洲核心子公司都在用这个东西,核心的目的,希望有一个师傅领进来做一些模型分析也罢,希望自己公司的团队最终能具备这样的能力,让我们的业务专家最终具备这样的能力,需要我们一些产品,随着我们计算的要求,不断地提升,把全国风电场的数据拉回来,全部算完反馈回去,我们需要大量的成本,高铁上面有通过芯片的方式来做,我们公司天数智芯,我们有算力的产品提供给大家。
我们公司成立时间不长两年多的时间,但是我们现在有300多号人马,南京160多人,上海100多好人,硅谷80多人,(英文)也是最核心数据库部门的研发总监,我们300多人的团队,85%以上还是研发的人员,基本上研发人员国内除了清华基本来自全球前30学校的精英,希望这种所谓的数据行业的经营和我们行业专家一起最终把我们风电行业设备健康做得越来越好,让我们的质量损失越来越好,来应对现在巨大的成本损失的压力。
(发言为能见APP整理,未经本人审核)