《基于机器学习方法的风电场数据异常点智能判别与还原技术研究.docx》由会员分享,可在线阅读,更多相关《基于机器学习方法的风电场数据异常点智能判别与还原技术研究.docx(6页珍藏版)》请在优知文库上搜索。
1、摘要:本文使用多参数机器学习方法,对风电场实际数据中的异常点进行智能判别与还原,利用此方法可以精准计算风电场损失电量,为风电场相关人员详细分风电利用小时变化原因,提供精确的数据支持与技术支持,达到提升风电场管理水平,从而提高风电场发电量的目的。引言在实际情况中,风电机组在日常运行时会出现故障、电网限电与受自然因素出力受限等出力达不到正常水平的情况,在没有精准的数据分析前提下,风电场在拥有良好的风资源条件时,难以达到应有的发电水平。通常使用的风电机组标准功率曲线有着明显缺点。风电机组标准功率曲线使用数据和曲线拟合方法采用的为实验室数据或模拟数据,环境信息单一且为风电机组在理论条件下的发电数据。在
2、实际情况中,风电机组受温湿压等大气条件影响,实际与理论条件不一致,风电机组排布等因素均可能导致机组出力受到影响。我们希望通过机器学习的方法描述机组实际数据与理论数据之间的关系,减少异常点影响,真实合理地计算风电场损失电量,帮助风电场分析每一台机组的出力情况,从而提高风场发电量的目的。1、风场概况本次测量地点选择西北地区某陆上风场,风场内均为平坦地形,海拔约100Om,无明显植被影响,一天乃至四季温度变化明显,故障多,出力受限明显。风机参数如表Io-1风机概况地形风机型号三三1轮载高度年平均风速陆上-平原UP115-2000联合动力80m5.6ms2、背景技术2.1 背景风能是一种对环境无污染的
3、再生能源,作为未来能源的主要形式,对今后人类的生活方式、生存和发展都具有重要意义。为了有效地利用风能资源,大型风电场的并网运行都需要智能的电量分析系统。精确的电量分析系统需要足量的历史数据与智能算法的支持。本人采用现流行的多参数机器学习算法,结合风电预测实际数据特征,提出了一套针对风能分析的有效算法。由于风电机组受到场内或场外影响,实际功率与可发电功率之间具有差距。这种情况在西北风场尤为严重。在算法中,对出力降容点做出了一些处理,用以提高电量分析的精确度。2.2 模型介绍2.2.1 正态分布(Normaldistribution),最早由棣莫弗(AbrahamdeMoivre)在求二项分布的渐
4、近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。PS拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布。3。准则是建立在正态分布的等精度重复测量基础上而造成奇异数据的干扰或噪声难以满足正态分布。如果一组测量数据中某个测量值的残余误差的绝对值大于3。,则该测量值为坏值,应剔除.通常把等于3。的误差作为极限误差,对于正态分布的随机误差,落在3。以外的概率只有0.27%,它在有限次测量中发生的可能性很小,故存在3。准则。3。准则是最常用的一种判别准则。2.2.2 随机森林(RandomForest),在以决策树为基学习器构建Bagging集成的基础上,进
5、一步在决策树的训练过程中引入了随机属性选择。具体来说,传统决策树在选择划分属性时是在当前结点的属性集合中选择一个最优属性;而在随机森林中,对基决策树的每个结点,先从该结点的属性集合中随机选择一个包含k个属性的子集,然后再从这个子集中选择一个最优属性用于划分。这里的参数k控制了随机性的引入程度:若令k=全部属性个数d,则基决策树的构建与传统决策树相同;若令k=l,则是随机选择一个属性用于划分。随机森林简单、容易实现、计算开销小,可以在恩多现实任务中展现出强大的性能。2.2.3 k-means算法1,k均值算法针对聚类所得族&划分最小化平方误差ENZZk-%心,其中f-/xsC修=61X是簇C;的
6、均值向量,上式在一定程度上刻画了簇内样本围境簇均值向量的紧密程度,E值最小则簇内样本相彳吸越高.最小化上式采用了贪心策略,通过迭代优化来近似求解.3算法概述3.1 模型判别由于受场内或场外受累影响,导致风场历史数据中存在大量的异常点,本文设计实现了一种异常点检测以及还原的算法。该算法综合考虑风电场中功率与数值气象数据、数值环境信息之间的关系、结合本身的数据分布特点,以及各数值项之间的方差以及均值。在拥有足量的历史数据时,通过分组的方式将不同风速区间的数据进行检测判别。3.2 数据还原还原算法以神经网络为基础,利用历史数据训练网络结构。数据判别算法中作为第一步处理,获得异常点数据,之后作为输入,
7、结合气象数据NWD,输入到神经网络训练的机器学习模型,进行数据还原,进而提高电量分析精准度。再根据损失电量的定义,构筑风电场的损失电量分析系统。算法整体流程如图所示。输入历史训练数据进入模型训练输入实时数据输出电量结果风机数据气象数据风电场信息model-1trainingmodel-2training风机数据气象数据电量损失计算结果图1:算法整体流程图表2:算法整生史程表第一步,输入历史数据(1)风机凝据,如历史风速、功率等;(2)数值气象数据,如温度湿度气压等;(3)风电场信息,如风机位置,环境信息等第二步,进入模型训练(1)输入历史数据,通过机器学习算法进行模型判别,采用的方法有多绘数模
8、型判Sh悟机森林、梯度提升植为等进行福为揉优;(2)送择迭代方式与参数,进行迭代计算;(3)直到历史数据中超过质值百分比的异常点孩选出;(4)得到model-1、model-2输入:悻本隽与聚类转数1 .从D中随机选择k个徉本作为初始均值向里2 .Repeat3 .令C空集Jt)4 .Forj12.jm5,计算样本与各均值向里的距离,根据距高最近的均值向里确定X,的篌标记:,targninl.d将样本X划入相应的簇:C1-C2J(xl);6. Endfor7. Fori三U,k8. 计算新均值向置:为=高ZreCK9. If.Ythen10. 将当前均值同里更新为U.Else保持当前均值向里不
9、变12.输出:族划分结果C第三步,输入实时数据输入风机实时数据与数值气象数据,结合第二步中模型,输出判8U结果第四步,输出电里结果根搠员失电里定义,输出电里损失结果3、数据展示3.1 模型训练历史数据采用一年的风电场风速、功率、数值气象数据和固定的风电场信息数据,以风速、功率为核心,得到不同参数下的风电场风速-功率模型曲线。模型拟合曲线与训练数据模型散点图如下图3、图4所示。图3:训练数据模型散点图3.2 模型测试计算测试集选择风电场近一个月的实际数据进行计算,基于实际数据的实际参数,带入不同的模型model-i中,得到原始数据与还原数据的数据集合与散点图。图4:数据还原图示33模型结果根据数据智能还原结果,得知该风电场在近一个月数据中应发30047MWh,实发27881MWh,由于各项原因,共损失电量为2165MWh,折合标准单位为2,165,OOOKWh,各项损失共占比7.2%04、结论本文提出一种风电场异常数据智能判别与还原方法,通过展示算法概述及数据处理结果,表明了通过机器学习方法,可以达到对风电场历史或实时电量的智能判别和还原的目标。基于实际数据,结果显示此方法的提出,提供了一种电量计算的智能化自动化方法,大大减少减轻人工的工作量,提升工作效率,为风电场相关人员详细分风电利用小时变化原因,提供精确的数据支持与技术支持。