《自适应控制3.ppt》由会员分享,可在线阅读,更多相关《自适应控制3.ppt(66页珍藏版)》请在优知文库上搜索。
1、第三章LQG自校正器 最小方差自校正器:目标函数是系统的输出误差,需已知被控过程的时延,需对过程的极点或零点加以限定,适用范围有限 线性二次高斯自校正器:可用于时变、开环不稳定以及逆不稳定过程,且可达到无条件均值最小,主要缺点是计算量较大,对阶次比较敏感 3.1 线性二次最优控制线性二次最优控制LQ的设计的设计 线性二次最优控制:系统方程是线性的确定的,其性能指标是二次的,其控制目的为使性能指标为最小的条件下,使系统在任意初始条件下的状态转移到原点,它是LQG最优控制的基础3.1.1 状态调节器状态调节器的状态调节问题,就是使系统初始状态,在花费最小的控制能量下,转移到原点(或平衡点)上的控制
2、问题。0)0(XX)()()1(kBUkAXkX系统方程:(3.1)0)0(xX)()()(kXkKkU1003)()()()()()(NiTTTiRUiUiQXiXNXQNXJ0Q假定初始条件已知,希望寻求一个线性状态反馈控制律:(3.2)使下列目标函数最小(3.3)式中,加权矩阵和Q为半正定矩阵,R为正定矩阵,它们由设计者选定3J)()(0NXQNXT10)()(NiTiQXiX10)()(NiTiRUiU中第一项表示与稳定有关的指标,第二项表示与过渡过程有关的指标。第三项表示与控制能量有关的指标图3.1 被控过程结构图 u(k)x(k)A+I-1zBx(k+1)函数和等式约束条件的拉格朗
3、日函数:1,.,1,0,0)1()()(NkkXkBUkAX用拉格朗日(Lagrange)乘子和变分法来求解LQ问题:将(3.1)式变为下列等式约束条件:(3.4)借助拉格朗日乘子,构造一个联系目标在等式约束条件(3.4)下,使式(3.3)最小的问题等价于求(3.5)式无条件下的极值问题,这个问题有解的必要条件为:)0()()(2)()()(2)()()1()()()1(2)()()()()()(11010100HiXiiHNXNNXQNXiXiBUiAXiiRUiUiQXiXNXQNXJNiTTTNiTNiTTTlBUAXkRUUQXXkHTTT)1(2)(3.5)式中哈米尔顿(Hamilt
4、on)算子序列为:(3.6)0)1(2)(2)(2)1(0)1(2)(2)(0)(2)1(2)(2)(kXkBUkAXkJkBkRUkUJkkAkQXkXJlTlTl0)(2)(2)(0NNXQNXJl)()(0NXQN(3.7a)特别地对应于终值也应满足:(3.7b)由(3.7b)可得(3.8)1()(1kBRkUT)1()()(kAkQXkT)1()()1(1kBBRkAXkXT由(3.7a)可得下列控制律和伴随律:(3.9)将(3.9)式代入(3.1)式可得:(3.10)(3.11)式(3.10)和(3.11)称为欧拉-拉格朗日(Euler-Lagrange)方程,这个方程状态空间表达式
5、为:)()()1()1(11kkXAQAABBRQABBRAkkXTTTTTT)(k)(kX)()()(kXkSk)(k)1()1()()()(kXkSAkQXkXkST)()1()1(11kAXkSBBRIkXT(3.12)假定和存在下列变换关系:(3.13)将(3.13)式代入(3.10)和(3.11)式中,消去,得:(3.14)和)()1()1()()()(11kAXkSBBRIkSAkQXkXkSTT0,1,.,2-,1-NNk AkSBBRIkSAQkSTT11)1()1()()()()()(0NXQNXNSNNk 将(3.15)式代入(3.14)式得:因为上式对一切X(k)均成立,
6、所以可得对于有:(3.16)在终步时,考虑到(3.8)式和(3.13)式,得:此外,由(3.9)、(3.10)和(3.13)式和可得控制律为:0)(QNSNk)(NS)0(S)()()(1kXQkSABRkUTT即:(3.17)式(3.16)称为黎卡蒂(Riccati)差分方程,由后退递归,即可求出黎卡蒂方程中的到的每个值。(3.18)这就是所需要的状态调节器QkSABRKTT)(1将此式与(3.2)式相比较可得反馈增益:(3.19)图3.2 状态调节器结构图u(k)x(k)A+I-1zBx(k+1)-R B A S(k)-QT-T-13.1.2状态调节器的设计步骤状态调节器的设计步骤)0(X
7、0)(QNSAkSBBRIkSAQkSTT11)1()1()()(kKQkSABRkKTT)()(11)已知,A、B,选定Q0、R和Q值2)读取状态3)根据(3.17)和(3.16)式计算:4)根据(3.19)式计算:6)输出U(k),转2)LQ调节器的优点:能应用于时变多变量系统,且只要改变加权矩阵中的数值,就能兼顾初始状态的恢复速度和所需控制信号幅值的要求 )()()(kXkKkU5)计算控制律:3.1.3 输出调节器输出调节器)()()()()1(kCXkykBUkAXkX104)()()()()()(NiTTTiRUiUiyiyNyNyJ考察系统(3.20)的输出调节问题,即寻求一个容
8、许控制律,使目标函数(3.21)最小的问题式中的J3就转化成为J4,可见,输出调节器问题实质上是状态调节器问题的一个特殊情况。因此状态调节器的结论也适用于输出调节器。CCQQT0如果在(3.3)式中选用,则(3.3)3.2 状态观测器状态观测器带状态观测器的系统u(k)x(k)x(k+1)A+I-1zA+I-1zCCHBB+-x(k+1)x(k)y(k)y(k)将此值乘上一个权矩阵H项,即产生一个状态的校正项)()()(*1kykyky状态观测器:重构过程中不可直接测量的状态变量X(k)过程和观测器之间的输出差为:)1(*kX)()()()()()()()()()()1(*kHykBUkXHC
9、AkCXkyHkBUkAXkyHkBUkAXkX)1(*kX)1()1()1(*kXkXkX)()1(*kXHCAkX状态的预期估计值(3.22)引入状态预测估计误差(3.23)结合(3.20和(3.22)式,可得:(3.24)只要合理选择H,使(A-HC)稳定,可使此状态估计为无偏估计3.3 LQG自校正器 一个实际的动态系统通常都具有一定程度的不确定性,最常见的有以下三类:1)随机扰动的输入 2)传感器测量噪声的影响 3)系统模型参数的不确定性 线性、二次、高斯LQG:研究对具有高斯分布的随机扰动和噪声的系统,采用二次性能指标对于随机系统,控制器设计任务分为两步:第一,通过采用滤波器将随机
10、扰动和测量噪声消 除,进行状态预测和估计 第二,根据所估计的状态进行最优控制器的设计3.3.1 卡尔曼滤波器卡尔曼滤波器,.1,0),()()()()()()1(kknkCXkykLvkBUkAXkX)(,)(knkv0)()(knEkvE)0()0(XXEijTijTNknknEVkvkvE)()()()(考虑系统方程和量测方程:(3.25)其中,是零均值高斯白噪声序列,并有:jijiij01)(,)(knkv)0(Xu(k)A+I-1zx(k+1)BLv(k)x(k)Cx(0)(k)n(k)y(k)+其中:和之间线性无关。被干扰的被控过程)(ky)(kX)(kXTkXkXkXkXEkP)(
11、)()()()()(kX卡尔曼滤波器:基于测量输出信号,在消除干扰和扰动的同时,估计状态变量,被估计的状态用表示,被估计状态的协方差定义为:(3.26)即状态变量的估计值是在使此协方差为最小的名义下获得的。)0(X)0(P下面假定已知:a)过程系数A、B和Cb)输入随机扰动矩阵L,以及噪声互相关矩阵V和Nc)估计状态变量和协方差矩阵的初始值和状态变量X(k)的循环估计的算法如下:)(kX)1(*kX)()()1(*kBUkXAkX)1()1()1(*kXkXEkPT)()()()()()1()1()1(*kLvkXAkXAkLvkAXkXkXkX1)基于最后一次估计的状态,确定系统在无干扰和噪
12、声情况下状态的预测值:(3.27)2)计算预测状态的误差的方差:而3)计算估计状态值。估计状态由它的预测值(不含扰动和噪声)加上在k时刻测量的过程输出所决定的校正矩阵来确定:TTLVLAkPAkP)()1(*)()()()()(*kCXkykKkXkXf结合(3.26)式,可得:(3.28)预测状态的方差与干扰和噪声有关,并与估计方差有关(3.29)(kKf)()()()()()()()()()()()(*knkXCkKkXkCXkykKkXkXkXkXkXff)(kKf)()()(kXkXEkPTfK4)滤波增益矩阵的算法由滤波估计误差:是通过令估计误差的方差为最小所得,即求为最小时的值。T
13、fTffTfTTfTTTfTTfTfTTTTTfTTfKfKNCCPKCPKKCPPKnnCXXCKXnXXCKKnCXXXXEKnXCXnXCKXEkPJ)()(*0)(22*NCCPKCPKJTfTfKf1*)()()(NCkCPCkPkKTTf令:求得:(3.30)(kP)(kKf*)()()()()(PCKIkXkXEkPkPfTk)(kKffK1*NCPCCPKTTf5)最后一步计算滤波估计误差的方差由步骤4)的推导过程,当代入所求的值后可得:(3.31)在实际应用中,常常采用卡尔曼滤波器的稳态结果,即用当 时,矩阵将变为常数的值:(3.32)由此可得带有滤波器的系统方程为:*PTT
14、TTkAPCNCPCCIPALVLkPP*1*)1(lim)()()()()()()()1(*kUkBCkXkyKkXAkBUkXAkXf是黎卡蒂方程的定常矩阵:(3.33)图3.5 带有卡尔曼滤波器的系统方框图u(k)x(k+1)A+I-1zA+I-1zCBBx(k)y(k)Lv(k)x(k)Cx(0)(k)n(k)y(k)+-Kf+x(k+1)*x(k)*y(k)*卡尔曼滤波器具有以下特点:5)卡尔曼滤波估计可以做到最小二乘估计fK)1(*kP)(kP)1(*kP)(kP)(kP)(kKf1)滤波器估计状态的算法以“预测一校正”的方式进行递推,不要求储存任何观测数据,便于实时计算2)增益矩
15、阵和误差方差矩阵及与观测数据无关,可事先算好存贮起来,从而可加速实时处理 3)由 和可以获知有关滤波的性能4)估计误差方差及增益矩阵和N紧密相关 与V3.3.2 滤波器与状态观测器的关系分析滤波器与状态观测器的关系分析图3.6 带滤波器系统的另一种结构图u(k)x(k+1)A+I-1zA+I-1zCBBx(k)y(k)Lv(k)x(k)Cx(0)(k)n(k)y(k)+-x(k+1)*x(k)*y(k)*AKfKf+和校正两部分组成,预测目的是为了滤掉(消)(ky)(kX 将图3.6与图3.3相比较,就输出而言,状态 观测器对应于具有预测状态的卡尔曼滤波器 稳态卡尔曼滤波器:基于观测量值来估计
16、状态,称为现时估计器,由预测除)扰动和噪声的影响,而校正的目的是为了使状态估计能够收敛到真值,它是从系统的扰动和噪声中估计了系统的状态 状态观测器中的反馈矩阵H,对应于卡尔曼滤波器中的AKf,即如果有H=AKf,卡尔曼滤波器就等效于一个状态观测器 对确定系统用卡尔曼滤波器进行状态估计的好处:所得到状态是用k时刻的观测值得到k时刻的状态估计,而不是k时刻的预测值,有利于对实时控制 3.3.3 LQG系统的分离特性系统的分离特性 分离定理的涵义:对于具有干扰和噪声的系统的控制策略分成两步完成,即最优估计与最优控制 最优估计只决定于系统方程和不确定性V、N及P(0),与控制无关 最优控制只决定于系统方程和性能指标中的加权矩阵Q0、Q和R,与系统的扰动及噪声无关3.3.4 随机系统的最优控制律随机系统的最优控制律)1()1()1(kXkSk)()()(kXkKkUuAkSBBkSBRkKTTu)1()1()(1AkSBBkSBRBIkSAQkSTTT)1()1()1()(1卡尔曼滤波器系统方程由预测状态组成,令,并将此式代入(3.9)和(3.10)式,整理后得状态调节律反馈矩阵为中的其中:k)