您现在的位置:机电论文网>> 电力行业>> 正文内容

学习方法整定电力系统非线性控制器参数

作者: 来源: 发布时间:2018/2/11 16:12:47  点击数:981
中图分类号:tp181;tm71文献标识码:a
文章编号:0258-8013 (2000) 04-0001-05
the adjustment of the parameters of power system
non-linear controller by learning algrithms
zhang cai zhou xiao-xin
(electric power research institute chian,beijing 100085,china)
jiang lin wu qing-hua
(department of electrical engineering and electronics,the university of liverpool, liverpool, l69 3gj, uk)
abstract:in this paper, the iterative and increasing learning algorithms are introduced to the adjustment of the parameters of tcsc nonlinear controller in power systems. according to the characteristics of practical power systems, such as the strong nonlinearity, dynamic process and etc., the learning algorithms are improved: the off-line iterative learning is firstly modified into the on-line equal periodical learning, and then into the on-line unequal periodical learning. by changing the objective function defined in a continuous set into a function in a point, the increasing learning can be on-line. in order to make the learning algorithms process satisfied effectiveness and can learn under large disturbances of the system, the nonlinearity of the system is used in the learning algorithms. the improved learning algorithms are efficient, simple and practical, and provide new methods for the adjustment of the parameters of the controller. the digital simulation shows that under the same conditions, the performance of the unequal periodical learning algorithm is better than that of equal periodical learning , the performance of the increasing learning algorithm is better than that of the unequal periodical learning. the parameters of the controller found by the learning algorithms make the controller possess better dynamical performance,strong adaptability and robustness.
key words:on-line unequal periodical iterative learning algorithm; increasing learning algerithen; tcsc nonlinear controller; the adjustment of parameters; robustness
1 引言
文[1~3]所设计的输电线路可控串补 (tcsc) 及其协调非线性控制器较少依赖或不依赖于被控系统的知识,但却具有良好的控制性能和简单的结构。调整好非线性控制器的参数是使控制器有效、可靠地实现其各项性能指标的前提。学习方法可直接设计控制器,也可作为其它设计方法的辅助工具如确定优化控制器参数等。为克服控制器参数整定的困难,本文将学习方法引入电力系统非线性控制器的参数整定,使控制器具有更好的控制特性,为控制器参数的整定提供了新方法。数字仿真结果表明:在几种运行及故障方式下, 用学习方法整定的控制器参数具有较好的动态性能、较强的智能性、鲁棒性、容错性等,控制器采用学习参数将有更好的品质特性。
2 学习算法
g.n.萨里迪斯[4]将学习定义为:一个系统,如果能对一个过程或其环境的未知特征所固有的信息进行学习,并将得到的经验用于进一步的估计、分类、决策或控制,从而使系统的性能得到改善,那么就称该系统为学习系统。
具有学习功能的算法称为学习算法,学习算法有以下几种类型:(1) 基于模式识别的学习算法[4]: 针对先验知识不完全的对象和环境,将改变量进行分类,确定这种分类的决策,根据不同的决策切换对改变量的作用进行切换选择, 通过对对象性能估计来引导学习过程,从而使系统的性能得到改善;(2) 基于迭代的学习算法[4、5]:针对一类特定的系统但又不依赖系统的精确模型,通过反复训练的方式进行自学习,使系统逐步逼近期望输出;(3) 联结主义学习系统[4、6、7]:具有网络结构的形式(例如人工神经网络),由节点以及节点间的联结弧组成。每个节点可以看作一个简单的处理单元,其中包含若干可调参数。
3 学习算法原理
3.1 迭代学习法
设系统在一时间段[0,t]内以相同起始条件
x(0)=x0重复运行,yd(t)为t∈[0,t]事先给定的期望输出,通过以下重复迭代学习算法得到的控制策略,可使系统在这一时间段的实际输出逼近期望输出[5]:
εk(t)=yd(t)-yk(t) (1)
uk+1(t)=uk(t)+dc(t)εk(t) (2)
式中 t∈[0,t];uk(t)为第k次训练时的输入;yk(t)为第k次训练时的输出;εk(t)为第k次训练时的误差;dc(t)为第k次训练时的加权因子。
当k→∝,即训练次数足够多时,可有εk(t)→0。
式(1)(2)为常用的算法,尽管其稳定性和收敛性条件只适合于一定假设下的非线性系统,但算法所体现的基本策略也能形成对模型和外扰不确定的非线性系统的简单学习算法。
在学习控制系统中u可直接表示控制作用,也可表示控制器参数或受控对象模型的参数。因而式(1)(2)可用于待定变量的学习。 图1描述了这种方法的迭代结构和过程。

图1 迭代学习结构和过程
fig.1 the structure and process of
iterative learning algorithm
3.2 递增式学习法
递增式学习由梯度学习法改进而成。设网络在输入的作用下,目标函数为
(3)
式中 yd(t)为时刻t系统期望输出值;yk(t)为第k次训练时刻t的系统实际输出值;t∈[0,t]。
待定变量p的修正、调整按下式进行:
(4)
式中为目标函数j关于可调变量p的梯度;λ为加权因子,它确定了学习的速率。
以上方法只能用于离线学习,计算量大,效率较低。为提高效率可用在线学习。在线学习时式(3)的目标函数不能直接被利用的,主要问题在于如果可调参数p线性地出现于中,那么应用线性优化技术就可求得最优参数p*。但对于大多数网络,总有某些可调参数p非线性地出现于中,从而不能利用线性优化方法。
为能在线学习,学习系统采用一种“点”目标函数为
(5)
式(5)可看作式(3)的特例。这种以点目标函数取代定义在连续集上的目标函数进行学习的算法被称为“递增式梯度学习算法”。
可以证明,最小均方算法可按均值或均方值收敛,即
(6)
(7)
式(6)表明,当学习经验的个数t→∞时,参数的期望值接近最优参数p*;式(7)表明,当t→∞时,目标函数的期望值(均方误差)也接近一个极限,但不是最优的极小值。如果学习速率系数λ能以一个特定比率逐步减小,参数本身(而非期望值)也收敛于它的最优参数[9]
(8)
尽管最小均方算法的稳定性和收敛性条件只适合于一定假设下的线性网络,但最小均方算法所体现的基本策略也能形成一种非线性网络的简单学习算法。在非线性学习算法中,采用误差的非线性组合来取代,以利用误差的反馈抑制扰动,非线性中存在着功能和效率,误差的非线性反馈比线性反馈好,使被控系统的输出对期望输出的误差最小。在这种条件下参数调整规律为
δp=λ。g(ε) (9)
式中 ε(t)=yd(t)-y(t)
g(。)为非线性函数。
式(9)表示了在线学习的非线性递增式梯度算法。
3.3 学习方法整定控制器参数原理
以tcsc 非线性pid控制器为例说明学习法整定控制器参数原理。其结构如图2所示。

图2 tcsc非线性pid控制器结构图
fig.2 the structure of tcsc nonlinear pid
非线性pid控制器的输入量为

式中 fal为非线性函数;ε为误差信号;δ决定了函数fal(ε,α,δ)线性区间的大小;而α决定了该函数的非线性形状;α1、α2、α3、δ1、δ2、δ3、β1、β2和β3为需整定的参数,其中β1、β2和β3为比例系数,较难选取,因而采用以上方法进行β1、β2、β3的学习:对被控系统加入一定幅度的扰动,在α1、α2、α3、δ1、δ2、δ3选定后,在线学习β1、β2、β3。
3.3.1迭代学习法
由于迭代的学习算法简单实用,将其用于非线性控制器的参数整定。但如照搬原算法只能进行离线学习,计算量大。为了提高效率而在线学习,可将电力系统看作周期性运动的系统:发电机功角的一个摇摆看作一个周期性;将第k次重复训练的学习看作是对第k个重复周期“间断”的重复自学习,且前者的训练时间等于后者的重复周期,在运动过程中基于控制器参数的重复作用,使系统的实际输出逼近期望输出。
在具体训练过程中设第k个周期训练时期望输出与实际输出的误差为
εk(t)=yd(t)-yk(t),t∈[(k-1)t,kt] (10)
第k+1个周期训练的变量pk+1(t)则为第k个周期训练的变量pk(t)与输出误差εk(t)的加权和
pk+1(t)=pk(t)+λεk(t) (11)
当k→∝,即训练周期足够多时,εk(t)→0,实际输出逼近期望输出。记忆功能由周期重复参数体现。
对于实际电力系统,施加控制能改变系统的特性,包括某些变量的振荡频率。在采用的控制规律的作用下,其功角特性的振荡频率有可能不是一个严格固定值,因为采用迭代学习按等周期修正收敛较慢,且从抑制功角振荡来说,如果按周期修正,会延长振荡衰减的时间。选择合适的控制可不按周期修正从而可更快的抑制振荡。因此,应用以上算法时,不能简单按等周期的时间对应关系来进行,而应该为本周期的参数修正采用上一周期中与该点最相近点的信息来修正。
对于nlpid,采用如下几式在线学习β1、β2、β3
(12)
式中 β1k+1(t)、β2k+1(t)、β3k+1(t)分别为发电机功角第k+1个摇摆周期训练时时刻t的值;β1k(t1)、β2k(t1)、β3k(t1)分别为在发电机功角第k个摇摆周期训练时时刻t1的值,即与第k+1个摇摆周期训练时时刻t的误差最接近的点;εk(t1)为在发电机功角第k个摇摆周期训练时时刻t1的误差;λ1、λ2、λ3为加权因子,在学习过程中为幅度较小的值。
在实际应用中这种方法存在着以下问题:
(1)施加的扰动幅度必须较小,以保证系统的稳定性。
(2)在小扰动下学习的参数虽可保证与β1、β2、β3在t=0时刻的值无关,但在系统遭受大扰动时采用该方法学习的控制器参数,效果不理想。
(3)为了使学习参数在系统遭受大扰动时有满意效果,应在大扰动下进行参数的学习,但是系统不易维持稳定。
为了解决以上存在的问题并将以上方法推广应用至具有强非线性、遭受较大的不确定性扰动、难以获得其模型的不确定对象,将以上学习过程中的误差改为相应误差的非线性函数从而得出
(13)
各量的物理意义如前所述。
3.3.2 递增学习法
对被控系统加入一定幅度的扰动, 在α1、α2、α3、δ1、δ2和δ3选定后,采用式(14)在线学习β1、β2、β3
(14)
式中 ε(t)为系统误差在时刻t的值;β1(t)、
β2(t)、β3(t)及β1(t+1)、β2(t+1)、β3(t+1)分别为β1、β2、β3在时刻t及t+1的值。
应用以上学习方法时为保证学习参数有较好的鲁棒性,可选择严重、恶劣的运行工况学习,然后确定合适的参数。
学习法整定控制器参数原理如图3所示。图中k为第k次迭代或时刻k的参数值。

图3 学习法整定控制器参数原理
fig.3 the principle of the adjustment of the parameters
of the controller found by learning algorithm
4 数字仿真
为验证以上所述学习方法的可行性和有效性,并将学习参数与初始参数的控制性能、各种学习方法的性能进行比较,采用学习法整定tcsc非线性pid控制器的β1、β2、β3参数。其系统为9机41节点的电力系统。为便于互相比较、校验,在学习中各学习法的学习参数均采用同一严重、恶劣的工况过程,同样的参数初值、加权因子、扰动和运行方式。
为考核学习参数的鲁棒性,分别进行两种不同工况下系统受相同扰动时采用学习参数的非线性pid控制器的动态性能比较。工况1为双回线输送功率为1 945 mw,xc0为-0.022,故障点靠近母线1;工况2为双回线输送功率为1 945 mw,xc0为
-0.015,故障点靠近母线2;
设扰动为:tcsc系统中双回线中的一回0.1 s三相永久接地短路,0.2 s故障线路三相跳开。
4.1 迭代学习法
初始参数ip:β1=0.010 000, β2=0.000 000,
β3=0.000 000,
其它参数:α1=α2=α3=1.5, δ1=δ2=δ3=0.000 5,
加权因子:λ1=0.000 01, λ2=0.000 001,
λ3=0.000 010。
采用等周期学习得到的参数lp如下:
β1=0.010 200,β2=0.000 020,β3=0.000 200
图4给出了在工况1时采用以上等周期学习参数和初始参数的动态性能比较。其中ip为学习前的控制器初始参数,lp为学习结束时的控制器参数。

图4 迭代学习法中的等周期学习
fig.4 equal periodical learning in the iterative learning
采用非等周期学习得到的参数lp如下:
β1=0.011 300,β2=0.000 131,β3=0.001 300。
图5给出了运行工况1和运行工况2时采用非等周期学习参数lp和初始参数ip的动态性能比较。

(a)工况1时的控制性能

(b)工况2时的控制性能
图5 迭代学习中的非等周期学习
fig.5 unequal periodical learning
in the iterative leavning
4.2 递增式学习法
初始参数ip:β1=0.010 0, β2=0.000 0,
β3=0.000 0,
其它参数:α1=α2=α3=1.5
δ1=δ2=δ3=0.000 5,
加权因子:λ1=0.000 010, λ2=0.000 001,
λ3=0.000 010
学习得到的参数lp如下:
β1=0.015 0, β2=0.000 50,β3=0.005 0
图6给出了在工况1和工况2时采用递增式学习法及以上学习参数lp和初始参数ip的动态性能比较。

(a)工况1时的控制性能

(b)工况1时的控制性能
图6 递增式学习
fig.6 increasing learning
比较以上两种学习方法可以看出:在同样的计算条件下,非等周期迭代学习方法优于等周期学习方法,递增式学习方法优于非等周期迭代学习方法。
5 结论
本文将学习方法引入电力系统非线性控制器的参数整定,使控制器具有更好的控制特性。数字仿真结果表明:在几种运行及故障方式下, 用学习法整定的控制器参数具有较好的动态性能、较强的鲁棒性,控制器采用学习参数将有更好的品质特性。
基金项目:国家自然科学基金(59637050)、电力工业部、东北电力集团联合资助。
作者简介:张采(1965-),女,福建人,博士,工程师,从事电力系统非线性稳定控制研究工作;
周孝信(1940-),男,山东蓬莱人,中科院院士,总工程师,从事电力系统分析与控制、计算机在电力系统中的应用工作;
蒋林,男,博士研究生,从事电力系统非线性稳定控制研究工作;
吴清华,男,教授,从事智能工程、电力系统非线性稳定控制研究工作。
张采(中国电力科学研究院,北京 100085)
周孝信(中国电力科学研究院,北京 100085)
蒋林(英国利物浦大学 电力工程与电子学系 l69 3gj)
吴青华(英国利物浦大学 电力工程与电子学系 l69 3gj)
参考文献:
[1] zhang c,zhou x x.the auto-disturbances rejection control of tcsc[j].submitted to control engineering practice, a journal of ifac.1999,7:195~199.
[2] zhang c,zhou x x,jiang l,et al.coordinate nonlinear control of tcsc and svc in power systems[c].proc powercon'98, beijing, china, august18-21,1998:338~343.
[3] 张采,周孝信,蒋林,等.可控串补非线性pid控制器[j].电网技术,1999,10:14~18.
[4] 孙增圻,等.智能控制理论与技术[m].北京:清华大学出版社,1996.
[5] toshiharu sugie, thoshiro ono.an iterative learning control law for dynamical systems[j].automatica,1991,27(4):729~732.
[6] rumelhart d e,hinton g e,williams r j.learning representations by backpropagating errors[j].nature,1986,323:533~536.
[7] hertz j,krogh a,et al.nonlinear backpropagation:doing backpropagation without derivatives of the activation function[j].ieee trans on neural networks,1997,8(6):1321~1327.
[8] haykin s.adaptive filter theory[m].2nd ed.prentice-hall, 1991.
[9] anderson b d o,moore j b.linear optimal control[m].prentice-hall, 1971.

更多
字体:【】-【】-【】【关闭此页

上一篇:低压限流断路器背后击穿现象的数值模拟'   下一篇:样条配点法在汽轮机转子矫直分析中的应'


特别声明:机电之家(http://www.jdzj.com )所共享的机电类资料,机电论文、机电类文章、机电企业类管理制度、机电类软件都来自网上收集,其版权归作者本人所有,如果有任何侵犯您权益的地方,请联系我们,我们将马上进行处理。购买的论文都出自原创,保证作者的原创的版权的转让,任何纠纷由法律解决。