研究电能计量装置智能诊断的方法

(整期优先)网络出版时间:2019-12-28
/ 3

研究电能计量装置智能诊断的方法

周梁能

桂林阳朔供电局 广西桂林 541900

摘 要:为了推动电能表建设的智能化、准确化,完善整个系统,技术人员提出基于并行化朴素贝叶斯发展处的判断电能表是否存在故障的诊断方法。这种诊断方法充分考虑到电能表需要处理大量数据的特性,构建出能够同时处理大量数据的平台。这项平台将依据电能表所可能产生的异常情况作出具体的分析,做出一系列科学合理的电能表故障处理流程。这项技术将应用Spark并行化朴素贝叶斯算法,进行故障类型的精准判断,为后续的故障诊断提供依据。与此同时,技术人员也会对平台进行反复测试,不断对比实验结果,判断数据平台是否具备准确判断故障类型的能力,尤其是在电能表面临大量待处理数据的情况下,这种技术处理显得尤为重要,具备极强的现实应用价值。

关键词:电能计量装置;故障诊断;朴素贝叶斯

前 言

伴随着电信网络的不断推广发展,所覆盖的范围也就越来越广,伴随而来的是不断增大的用电信息量。在这种发展情形下,大数据的处理能力就显得尤为重要。由此可见,将大数据处理技术应用进电能表装置中是具有极大的现实价值的。为了能够进一步提高电能表的数据处理效率,尽可能降低工作人员的任务量,也就需要电能表具备较为精准的故障判断能力,大数据技术的应用也将极大程度地提高故障诊断的效率。假如电能表发生故障,将降低电能计量效率,为电力企业带来大量的直接经济损失,也给相关技术人员带来大量的工作量。因此,如何提高电力设备的故障判断效率,尽可能快速识别故障并解决,是电力企业应当重点关注的问题。与此同时,为了尽可能提高故障判断的效率与定位的精准程度,技术人员应当选择将Spark并行朴素贝叶斯算法融入进故障判断方法中,为电力企业的发展提供长足的动力。

1计量装置大数据处理技术

1.1计量装置大数据

随着智能电网的飞速发展,采集到的计量装置运行状况信息也越来越多,形成了计量大数据,传统的业务系统不能很好的存储和分析大数据,为了更好的对计量装置进行故障诊断和多维分析,构建计量装置大数据处理平台是十分必要的。电能计量装置的数据具有以下特点:数据量大,数据产生速度快,电能计量装置的数据交互性较强,对计量装置的异常和故障处理时效性要高。构建大数据处理平台,采用Hadoop的分布式文件系统(HDFS)来解决数据分布式存储问题,数据仓库(Hive)实现数据仓库的管理,采用Spark计算架构提升计算速度。这些模块之间相互关联,互相提供服务,计量装置异常信息分析和诊断的大数据处理方案如图1所示。

5e06ca1b17e9c_html_1de35829575927c7.png

1计量装置异常信息分析和诊断方案

计量装置中的数据包括档案数据和设备采集的用电信息,计量装置采集的信息采用定时定量的方式输入信息采集系统。对计量装置进行异常信息分析和诊断时,需要根据装置异常情况建立分析模型,然后再进行智能分析和故障诊断。

Hadoop包括MapReduce和HDFS两个核心部分,MapReduce是采用Map将任务划分给多台计算机进行处理,Reduce是将处理的结果进行汇总,此种处理方式提高了系统的可靠性和处理效率,HDFS为分布式计算的存储提供了支持。HDFS包括NameNode、DataNode和Client3个部分,Namenode用于保存分布式文件的数据信息,DataNode将数据信息保存在本地文件中,Client用于向分布式文件系统发送指令。Hive用于对Client数据的管理,使数据分布式存储于HDFS中。ETL指的是数据的抽取(extract)、转换(transfaormation)、装载(load-ing),ETL影响着数据仓库中数据的质量好坏,ETL过程是在数据库中抽取需要的数据转换成系统所需的数据格式,并导入到数据库当中。Spark是分布式并行处理方法,具有Mapreduce的所有优点,适用于计算量较大的迭代学习和数据挖掘当中。

1.2计量装置异常分析和故障诊断

首先采用ETL方法把电网中的数据导入到大数据处理平台,然后再采用数据分析方法确定装置的异常情况,计量装置大数据处理流程如图2所示。

5e06ca1b17e9c_html_8f0dc9092fbb2e7a.png

2 计量装置大数据处理流程

在总结电能表存在的异常情况时,本文一共概括了六种可能出现的故障类型,这些故障类型包括电量、电压、符合等多种情况下的监测。其中,电量方面的故障情况包括飞走、倒走等各方面的问题。这些故障将以不同的表现形式存在,包括电能表开盖以及分流等问题;而接线异常方面的故障将主要体现在电流流动的方向方面,或者电能表存在的潮湿问题。

2 基于朴素贝叶斯算法的故障诊断

2.1 朴素贝叶斯算法原理

样本集Ω中,某个元素属于B,其还属于A的概率为式(1)。

5e06ca1b17e9c_html_6790a529c1917d9f.gif (1)

式(1)简化为式(2)。

5e06ca1b17e9c_html_ccf67d98645e4b77.gif (2)

其中,P(A∩B)为事件A和B 都发生的概率。

5e06ca1b17e9c_html_edc278ead74794e3.gif (3)

5e06ca1b17e9c_html_99aba6d1c3bda1b9.gif (4)

式(4)为贝叶斯公式。假定A集合包含{a1,a2,a3…,an},且a1,a2,a3…,an相互独立。

5e06ca1b17e9c_html_3361b07acafdc95d.gif (5)

5e06ca1b17e9c_html_278ef64de6496ea.gif (6)

朴素贝叶斯算法是在贝叶斯算法基础上的,其过程为假设X是属性集,Y是类变量,P(Y/X)是Y 的后验概率,P(Y)为先验概率,P(X/Y)为类条件概率。则有:

5e06ca1b17e9c_html_be66fb0c9a9a64e6.gif (7)

朴素贝叶斯理论是求取后验概率,其取值最大的时候,所对应的类就归为相应的类。所以,只需要对比各个Y的后验概率,式(7)中的P(X)是常数,则可忽略。设类标号为y,属性之间相互独立,则:

5e06ca1b17e9c_html_b37f4a0f6c1d3116.gif (8)

式中:X={X1,X2,…Xd},含有d个属性。朴素贝叶斯模型如图3所示。

5e06ca1b17e9c_html_57a6a7dbba3f63f7.png

3 朴素贝叶斯模型

2.2 并行化朴素贝叶斯算法智能诊断

在采用朴素贝叶斯算法对计量装置进行异常分析和诊断的时候,首先要训练算法模型,本文采用50%数据作为训练数据,另外50% 数据作为测试数据,算法在Spark上的流程如图4所示。

5e06ca1b17e9c_html_83fb186a5def2d1e.png

4 朴素贝叶斯算法并行化流程

采用朴素贝叶斯算法进行异常信息分析和故障诊断的流程如下。

(1)从FDFS中提取出具有计量装置异常情况的属性信息到RDD。

(2)数据进行map划分任务,提取50%的数据作为训练数据。

(3)对朴素贝叶斯算法进行训练,生成若干RDD,求取每个异常特征值的概率P。

(4)求取每个特征值的条件概率。

(5)将计算结果保存在HDFS上。

3 算例仿真

3.1 实验对比

将本文电能计量装置异常信息分析和诊断方法在大数据平台上进行算例仿真,搭建由10台PC构成的集群,PC的配置为corii56500,内存8G,硬盘500G。采用的Hadoop为2.9.2,Spark2.10,Hive0.14.0。仿真实验用的样本数据来源于福建省某电力局采集的用电信息及电能计量装置数据信息,计量装置每天采集96个数据的功率和电压值。为了验证本文所提的方法能够实现计量装置异常的判断,采用朴素贝叶斯算法对具有异常情况的计量装置进行检测,测试结果如表1所示。

1 异常值检测结果

异常情况

数据时间/编号

异常数/

耗时/s

验证

电能表突变

2017.06.01/2018060113256…

12

1.215

查询判断为存在异常的电能表编号,均与实际故障情况相符

电能表倒走

2017.06.01/2018060112562…

9

6.356

电能表停走

2018.09.01/2018090103658…

338

3.965

电表总示数与实际不符

2018.09.01/2018090175623…

1

0.185

为了验证朴素贝叶斯算法并行化后诊断电能计量装置的有效性,进行了诊断实验对比分析,选取100条测试数据,分别采用单机和集群进行实验测试,每种方法测试30次,取平均值,实验结果如图5所示。为了对比本文所提方法在运算时间上的优势,分别选取了不同数据量的测试数据进行实验分析,并记录耗时情况,对比曲线如图6所示。为了验证并行化朴素贝叶斯算法的效果,在不同数据量背景下的加速比测试曲线如图7所示,加速比定义为S=t/T,t和T分别表示单机和集群运算时的耗时,S越大表示集群效果越好。

5e06ca1b17e9c_html_c00675e6b60a0fdb.png

5 朴素贝叶斯方法故障测试曲线

5e06ca1b17e9c_html_1731b9a4faa84336.png

6 不同数量下计算耗时

5e06ca1b17e9c_html_1ef5bdbde974e73f.png

7 集群加速比侧视图

3.2 仿真结果分析

通过表1对电能计量装置异常信息分析和诊断的验证可以看出,采用朴素贝叶斯方法诊断出来的电能表故障类型及故障点均与实际情况完全一致,说明采用朴素贝叶斯方法对电能表进行故障诊断的方法可行。通过图5的对比实验结果可以看出,并行化的贝叶斯算法分别在单机和集群情况下进行性能对比,两种情况下算法的性能都较高且相差不大,说明并行化后的朴素贝叶斯算法在电能计量装置诊断上具有较高的准确率,适用于单机与集群时的异常诊断。从图6可以看出,当处理的数据为20MB的时候,单机处理耗时较少,但是随着数据量的增大,单机处理耗时明显高于集群处理结果,且当数据量为1024MB时,单机显示内存不足。原因是数据量较少时,集群处理包含了数据的分配和通讯耗时,所以较单机处理耗时多,当数据量增大之后,大数据的处理优势越来越明显。而且随着数据量增大,Spark的处理效果明显由于传统的Ha-doop处理方法。由于Spark的RDD处理方法避免了HDFS的多次重复读写,提高了数据处理速度,说明Spark方法在计量装置异常分析和诊断中具有较大优势。由图7的加速比测试可以看出,随着集群节点加大,性能也得到了提升,验证了集群更适合处理大规模数据且具有良好的处理效果。

结 语

本文的主要内容包括提出大数据技术在电能表故障检测方面的应用,以及基于Spark方法所做的详尽的原理分析。本文提出设计处理电能表诊断的大数据平台,借助先进的大数据处理技术进行电能表的快速精准诊断,进而提升电厂的经济收益。与此同时,文中作出的对比分析也进一步验证了注重技术的先进性与高效性,之后的工作还需要技术人员进行进一步的处理,以提高大数据平台诊断的精准程度。

参考文献

[1]卢健豪.电能计量装置状态监测技术的研究[D].广东工业大学,2017.

[2]甄啊彪.基于大数据的电能计量装置异常信息多维分析与诊断[D].华北电力大学,2017.

[3]蔡妙妆.基于信息融合技术的电能计量装置状态监测研究[D].广东工业大学,2017.

[4]范洁,陈霄,周玉.基于用电信息采集系统的电能计量装置异常智能分析方法研究[J].电测与仪表,2018,50(11):4-9.