環(huán)境試驗設(shè)備系統(tǒng)的辨識器是改進(jìn)了的Elman 神經(jīng)網(wǎng)絡(luò),它用來動態(tài)的辨識被控對象的正向模型,為控制器提供誤差及其梯度信息。由于Elman 神經(jīng)網(wǎng)絡(luò)屬于局部反饋網(wǎng)絡(luò),其本質(zhì)是動態(tài)的神經(jīng)網(wǎng)絡(luò),所以可以隨被控對象模型的變化而變化,最終收斂到穩(wěn)定點(diǎn),而不是被控對象模型靜態(tài)關(guān)系的描述。
通過對被控對象動態(tài)辨識,我們可以根據(jù)辨識的結(jié)果構(gòu)造一步預(yù)測控制器,使得系統(tǒng)得到更好的動態(tài)品質(zhì)。系統(tǒng)的控制器是一個增強(qiáng)型的模糊神經(jīng)網(wǎng)絡(luò)。因此,系統(tǒng)的本質(zhì)仍然是模糊控制。不過,運(yùn)用神經(jīng)網(wǎng)絡(luò)來表達(dá)模糊推理從而構(gòu)成的模糊神經(jīng)網(wǎng)絡(luò)具有單純模糊控制不可比擬的優(yōu)勢。因為,模糊神經(jīng)網(wǎng)絡(luò)所表達(dá)的模糊推理蘊(yùn)涵在神經(jīng)網(wǎng)絡(luò)權(quán)值中,網(wǎng)絡(luò)通過自學(xué)習(xí)不斷調(diào)整權(quán)值的同時也就達(dá)到了優(yōu)化模糊規(guī)則和專家控制經(jīng)的目的,最終得到全局收斂控制信號,實(shí)現(xiàn)全局較優(yōu)控制。從系統(tǒng)辨識角度上看,由于有了神經(jīng)網(wǎng)絡(luò)對未知結(jié)構(gòu)的非線性系統(tǒng)參數(shù)進(jìn)行辨識,放松了以往傳統(tǒng)辨識方法中要求系統(tǒng)線性、定常、結(jié)構(gòu)已知的限制條件。

從控制角度上看,采用神經(jīng)網(wǎng)絡(luò)在線實(shí)時辨識與另一個神經(jīng)網(wǎng)絡(luò)控制器共同作用的方式,構(gòu)成一種間接神經(jīng)網(wǎng)絡(luò)控制結(jié)構(gòu)這種結(jié)構(gòu)相當(dāng)于一種內(nèi)模控制。從理論上說,如果存在一個收斂的神經(jīng)網(wǎng)絡(luò)辨識權(quán)值WI 和神經(jīng)網(wǎng)絡(luò)控制器權(quán)值WC,能夠保證系統(tǒng)均方差收斂或L2 收斂,那么當(dāng)辨識網(wǎng)絡(luò)收斂到WI,控制器網(wǎng)絡(luò)收斂到WC 時,系統(tǒng)控制收斂。
但在實(shí)際工程中,這僅僅是控制系統(tǒng)收斂的一個充分條件而非必要條件。實(shí)際情況是,當(dāng)系統(tǒng)控制收斂時,辨識網(wǎng)絡(luò)和控制網(wǎng)絡(luò)權(quán)值收斂,但并非惟一。因為收斂結(jié)果與網(wǎng)絡(luò)初始權(quán)值的選擇,控制信號的形式息息相關(guān)。這一點(diǎn)與傳統(tǒng)辨識意義上的參數(shù)惟一收斂不同。我們知道,控制的目的是保證系統(tǒng)輸出收斂,而非辨識網(wǎng)絡(luò)和控制網(wǎng)絡(luò)權(quán)值收斂。只是后者能夠保證控制系統(tǒng)收斂到一個較好的程度,且可能具有較強(qiáng)的泛化能力。
此外,實(shí)際控制系統(tǒng)輸出收斂的要求也好似因控制對象而異,只要滿足一定條件即可,一味追求零誤差既不現(xiàn)實(shí)也沒有必要。在工程上,神經(jīng)網(wǎng)絡(luò)在線辨識由于受到采樣時間的限制,辨識網(wǎng)絡(luò)很難在一個采樣周期內(nèi)產(chǎn)生收斂。通常解決辦法是選擇合適的網(wǎng)絡(luò)和學(xué)習(xí)算法,保證系統(tǒng)辨識沿時間軸收斂,即在每個采樣周期內(nèi),給定循環(huán)訓(xùn)練次數(shù),使網(wǎng)絡(luò)逐步向收斂狀態(tài)逼近。雖然此時根據(jù)可能還未收斂的辨識網(wǎng)絡(luò)求得的控制量不能保證系統(tǒng)“立即”達(dá)到期望軌跡,但理論上只要辨識最終收斂,控制也會最終收斂。
http://www.dgzhenghang.cn