版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
PAGEPAGE13PAGEPAGE10課后習(xí)題解答第1章 智能控制概述1-1在自動(dòng)控制發(fā)展過程中出現(xiàn)了什么挑戰(zhàn)?為什么要提出智能控制?解:傳統(tǒng)控制存在的問題:實(shí)生活中,往往很難獲得精確的數(shù)學(xué)模型,因而傳統(tǒng)控制難以取得理想效果。經(jīng)確定,不再改變,當(dāng)對象參數(shù)或環(huán)境發(fā)生變化時(shí),控制系統(tǒng)的性能隨之下降。本提高、可靠性下降。智能控制系統(tǒng)具有自學(xué)習(xí)、自適應(yīng)和組織的功能。以找出故障位置甚至實(shí)現(xiàn)自修復(fù),體現(xiàn)出更強(qiáng)的自適應(yīng)功能。3)智能控制系統(tǒng)對于復(fù)雜的控制任務(wù)和多傳感信息具有自組織和協(xié)調(diào)的功能。在智能控制發(fā)展過程中,哪些思想、事件和人物起到了重要作用?解:智能控制發(fā)展過程中的一些典型人物及其重要思想:1)1868年,英國物理學(xué)家Maxwell用線性微分方程來研究蒸汽機(jī)調(diào)速系統(tǒng)的穩(wěn)定性問題他指出只有當(dāng)微分方程的特征根為負(fù)實(shí)根或具有負(fù)實(shí)部的復(fù)根時(shí)系統(tǒng)才穩(wěn)定。RouthHurwitzRouthHurwitz判據(jù)。3)1892年,俄國Lyapunov發(fā)表博士論文“論運(yùn)動(dòng)穩(wěn)定性的一般問題”,對于對任意階非線性系統(tǒng)和時(shí)變系統(tǒng),運(yùn)用Lyapunov第二方法可以不必求解系統(tǒng)狀態(tài)方程而直接判定穩(wěn)定性,是更為一般的穩(wěn)定性分析方法。41932Nyquist提出了根據(jù)系統(tǒng)開環(huán)頻率特性來判別閉環(huán)系統(tǒng)穩(wěn)定性的方法,Nyquist穩(wěn)定性判據(jù)。5)1940年,美國Bode引入了半對數(shù)坐標(biāo)系,把復(fù)數(shù)運(yùn)算轉(zhuǎn)換成代數(shù)運(yùn)算,大大地簡化頻率特性的分析。1942年,Harris引入了傳遞函數(shù)的概念。1948年,美國Evans提出根軌跡法。……智能控制分為哪幾類?其主要原理是什么?解:模糊控制、神經(jīng)網(wǎng)絡(luò)控制、專家控制系統(tǒng)、分級遞階、學(xué)習(xí)控制等。模糊控制:把人類專家對特定的被控對象或過程的控制策略總結(jié)成一系列以“IF(條件THE(作用象或過程。神經(jīng)網(wǎng)絡(luò)控制:利用人腦的某些結(jié)構(gòu)機(jī)理以及人的知識(shí)和經(jīng)驗(yàn)對系統(tǒng)的控制??刂茊栴}視為模式識(shí)別問題,被識(shí)別的模式是關(guān)于受控的狀態(tài)、輸出或某個(gè)性能評價(jià)函數(shù)的變化信號。這些信號經(jīng)神經(jīng)網(wǎng)絡(luò)映射成控制信號。專家系統(tǒng):一個(gè)智能計(jì)算機(jī)程序系統(tǒng),其內(nèi)部含有某個(gè)領(lǐng)域大量的專家水平的知識(shí)與經(jīng)驗(yàn),能夠利用這些知識(shí)與經(jīng)驗(yàn)來處理該領(lǐng)域的高水平難題。專家控制系統(tǒng):應(yīng)用專家系統(tǒng)技術(shù)而建造的控制系統(tǒng)。第2章 神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)2-1RBF神經(jīng)網(wǎng)絡(luò)輸入層、隱含層和輸出層的表達(dá)式?RBF神經(jīng)網(wǎng)的主要特點(diǎn)是什么?同BP神經(jīng)網(wǎng)相對比有什么優(yōu)點(diǎn)?解:徑向基函數(shù)(RBF)網(wǎng)絡(luò)是三層前饋網(wǎng)絡(luò),其結(jié)構(gòu)如圖所示,三層表達(dá)式分別為:輸入層:i iyIui i隱含層采用高斯函數(shù):
u1111y0111y01wiijjwjhhyh0ly0mnmjyHj
e
(yc)
ui其中cij為神經(jīng)元中心,j為神經(jīng)元半徑。輸出層:hyOh
lj1l
OH uwynjhjwynRBF神經(jīng)網(wǎng)的主要特點(diǎn)是只有輸出層有連接權(quán)值,隱含層不具有連接權(quán)值,但隱層神經(jīng)元非線性函數(shù)具有中心值和半徑寬度值,用于對輸入層的輸入值進(jìn)行和分類。如果RBF神經(jīng)網(wǎng)隱層神經(jīng)元的中心值和半徑寬度可以提前設(shè)置,則其神經(jīng)網(wǎng)絡(luò)的權(quán)值只有輸出層權(quán)值,整體權(quán)值要比BP神經(jīng)網(wǎng)絡(luò)的權(quán)值訓(xùn)練少很多,提高了計(jì)算速度。111yO111yO1wiij wjjhhyhOthlyOm解:BP神經(jīng)網(wǎng)絡(luò):基于誤差反向傳播學(xué)習(xí)算法的多層前饋神經(jīng)網(wǎng)絡(luò),它能夠逼近任意非BP神經(jīng)網(wǎng)絡(luò)一般分為三層,輸入層、隱含層和輸出層。其輸入層到隱含層具有權(quán)值、隱含層到輸出層具有權(quán)值,網(wǎng)絡(luò)的結(jié)構(gòu)主要由隱含層的神經(jīng)元的個(gè)數(shù)、不同層之間的權(quán)值所決定。權(quán)先計(jì)算輸出層權(quán)值,再計(jì)算輸入層權(quán)值。誤差準(zhǔn)則函數(shù)以期望輸出即有教師的輸出
u1uiunn mBP神經(jīng)網(wǎng)絡(luò)示意圖與網(wǎng)絡(luò)的輸出的差值為核心,構(gòu)成二次平方函數(shù)并求和。1Q q O q2
1Qm
q O q22F(w) t2q1
y(u)
thyh(u)2q1h12瞬時(shí)誤差準(zhǔn)則函數(shù):1 O 2 1m O 2F(w) t(k)y((k) th(k)h(k)2 2h1權(quán)值的計(jì)算采用梯度下降法計(jì)算,首先計(jì)算輸出層權(quán)值,F(xiàn)(w)wOjhww(k)wO(kwO(k) wO(k)F(w)wOjhww(k)jh jh jh h j然后再計(jì)算隱含層權(quán)值,wH(kwH(k)
=wH(k)H(k)u(k)FF(w)wHijww(k)判斷是否滿足終止條件,1m 1O 22F((k) th(k)h(k)2h1
或kc若滿足,則學(xué)習(xí)結(jié)束;否則,k=k+1,回到梯度下降運(yùn)算。對于如下仿射非線性離散時(shí)間系統(tǒng):y(k)0.5y(ky(ku(k1exp[0.25y(k試明確神經(jīng)網(wǎng)絡(luò)輸入輸出,并設(shè)計(jì)RBF網(wǎng)絡(luò),實(shí)現(xiàn)上述動(dòng)態(tài)系統(tǒng)建模。解:網(wǎng)絡(luò)輸入為x[u(k),y(k)],輸出為y(k1)RBF網(wǎng)絡(luò)結(jié)構(gòu)設(shè)置為2-5-1。取控制輸入u(k)sint,tkts,其采樣時(shí)間t0.001。根據(jù)網(wǎng)絡(luò)輸入范圍,高斯函數(shù)參數(shù)為c
3 2
1 01 2 3,s i 3 2 1 01 2 3 bi1.5,初始權(quán)值取0.10,學(xué)習(xí)參數(shù)設(shè)置為0.50,0.05。訓(xùn)練樣本數(shù)取NS3000,測試樣本數(shù)量為NT3000,進(jìn)行模型訓(xùn)練和測試。第3章 模糊控制系統(tǒng)為什么要用取大運(yùn)算求并集,用取小運(yùn)算求交集?解AB的并集ABABAB所包含的“最大”模糊集合。若用取大運(yùn)算,那么求得的模糊集合一定是包含A和B的“最小”的模糊集合。證明AB(x(xB(xAB(xA(xAB(xB(xABAB。現(xiàn)在假設(shè)C是任意一個(gè)包含A和B的模糊集合,則有(x)A(x) (x)B(x)從而(x(xB(x)]CAB(xB(xABABAB所包含的“最大”模糊集合。:給定模糊集合
B0.10.40.71.00.70.32 3 4 5 6 7試用加權(quán)平均法求其清晰值。N解:按照加權(quán)平均法去模糊化,其清晰值為:N(yii(yi)) 20.130.440.751.060.770.3y*i1 4.84NNi1
i(yi)
0.10.40.71.00.70.3:倒立擺如下圖所示,數(shù)學(xué)模型為:mgsincsfml/1802sin p
180(4/3)mlmplcos2 控制任務(wù)是產(chǎn)生合適的力f,使倒立擺保持直立狀態(tài),即設(shè)計(jì)合理的模糊控制器,使得0。f圖3-13倒立擺示意圖解:模糊控制器設(shè)計(jì)主要涉及以下五個(gè)方面1)建立模糊集對于:“負(fù)大NL)隸屬度為1,在時(shí)隸屬度為0;“負(fù)小NS)時(shí)隸屬度為1,到時(shí)線性減小到0;“零(Z)時(shí)隸屬度為1,在時(shí)線性減小到0;“正小(PS)時(shí)隸屬度為1,到時(shí)線性減小到0;“正大(PL)時(shí)隸屬度為1,隨后隨著減小,時(shí)線性減小到0。對于:“負(fù)大NL)/s時(shí),隸屬度為1,到/s時(shí)線性減小到0;“負(fù)小NS)/s時(shí)隸屬度為1,到/s時(shí)線性減小到;“零(Z)/s時(shí)隸屬度為1,在/s時(shí)線性減小到0;“正小(PS)/s時(shí)隸屬度為1,到/s時(shí)線性減小到0;“正大(PL)/s時(shí),隸屬度為1,/s時(shí)線性減小到0。f:“負(fù)大NL)f0N時(shí),隸屬度為1,到fN時(shí)線性減小到0;“負(fù)小NS)fN時(shí)隸屬度為1,到f0N時(shí)線性減小到0;“零”(Z)f0N時(shí)隸屬度為1,到fN時(shí)線性減小到0;“正小(PS)fN時(shí)隸屬度為1,在fN時(shí)線性減小到0;“正大(PL)fN時(shí)隸屬度為1,從fN到fN時(shí)線性減小到0。2)確定隸屬度函數(shù)以三角形隸屬函數(shù)為例,對于的“負(fù)大(NL)”模糊集,其隸屬函數(shù)可以表示為:1,NL 15(30))NL 15(30),
30301515同樣可以寫出其他模糊集的隸屬函數(shù)表達(dá)式。對于和f的隸屬函數(shù)也采用類似的三角形形式,根據(jù)上述定義的區(qū)間和隸屬度變化情況進(jìn)行確定。3)建立模糊規(guī)則庫基于對倒立擺系統(tǒng)的物理特性和控制目標(biāo)的理解,建立以下模糊規(guī)則(部分示例)IFsNLandsZ,thenfsNL;ifisNSandisZ,thenfisNS;ifisNSandisPS,thenfisZ;ifisZandisNL,thenfisNL;ifisZandisNS,thenfisNS;ifisZandisZ,thenfisZ;ifisZandisPS,thenfisPS;ifisZandisPL,thenfisPL;ifisPSandisNS,thenfisZ;ifisPSandisZ,thenfisPS;ifisPLandisZ,thenfisPL。規(guī)則庫應(yīng)盡可能全面地涵蓋各種可能的輸入組合情況,以保證控制器在不同狀態(tài)下都能做出合理的控制決策。4)模糊推理假設(shè)當(dāng)前時(shí)刻倒立擺的角度20,角速度10/s。對于20,根據(jù)隸屬函數(shù)計(jì)算其在各個(gè)模糊集中的隸屬度:(20)1 (20)1 (20)0(20)0 (20)0NL 3 NS 3 Z PS PL對于10/s,根據(jù)隸屬函數(shù)計(jì)算其在各個(gè)模糊集中的隸屬度:(10/s)0(10/s)2
(10/s)1
(10/s)0 (10/s)0NL NS
3 Z 3
PS PL再根據(jù)對應(yīng)的規(guī)則來求出對應(yīng)的激活強(qiáng)度即可,根據(jù)激活強(qiáng)度,對輸出模糊集進(jìn)行加權(quán)平均,得到輸出控制力f在各個(gè)模糊集中的隸屬度。5)清晰化采用重心法進(jìn)行清晰化,假設(shè)經(jīng)過模糊推理后,輸出控制力f在“負(fù)大(NL)”模糊集中的隸屬度為NL(f),在“正大(PL)”模糊集中的隸屬度為PL(f)等。則清晰化后的控制力f的值為:fifii(f)ii(f)其中fi是各個(gè)模糊集的中心值,通過計(jì)算得到一個(gè)具體的控制力數(shù)值,用于控制倒立擺。第4章 專家控制系統(tǒng)什么是專家系統(tǒng)?什么是專家控制系統(tǒng)?兩者有何關(guān)系與相似之處?解:專家系統(tǒng)是一個(gè)計(jì)算機(jī)程序系統(tǒng),其內(nèi)部存有領(lǐng)域?qū)<宜降拇罅恐R(shí)與經(jīng)驗(yàn),能夠利用人類專家的知識(shí)和解決問題的技術(shù)方法來處理該領(lǐng)域相關(guān)問題。即,專家系統(tǒng)是一個(gè)存有大量的專門知識(shí)與經(jīng)驗(yàn)的計(jì)算機(jī)程序系統(tǒng),它應(yīng)用人工智能技術(shù)和計(jì)算機(jī)技術(shù),根據(jù)某領(lǐng)域一個(gè)或多個(gè)專家提供的知識(shí)和經(jīng)驗(yàn),進(jìn)行推理和判斷,模擬人類專家的決策過程,從而解決需要人類專家處理的復(fù)雜問題。專家系統(tǒng)是一種模擬人類專家解決領(lǐng)域問題的計(jì)算機(jī)程序系統(tǒng)。專家控制系統(tǒng)是一種將專家知識(shí)和經(jīng)驗(yàn)與控制技術(shù)相結(jié)合的先進(jìn)控制系統(tǒng)。主要包含知識(shí)庫與推理機(jī)。其中知識(shí)庫用來存儲(chǔ)著大量的專家知識(shí)、經(jīng)驗(yàn)、規(guī)則和模型等,是系統(tǒng)進(jìn)行決策的基礎(chǔ)。推理機(jī)依據(jù)知識(shí)庫中的內(nèi)容進(jìn)行邏輯推理和判斷,以生成控制策略。專家控制系統(tǒng)是專家系統(tǒng)在控制領(lǐng)域的應(yīng)用。專家系統(tǒng)提供了知識(shí)表示和推理的基礎(chǔ)框架,專家控制系統(tǒng)利用這個(gè)框架,并結(jié)合控制理論和實(shí)際控制需求,實(shí)現(xiàn)對被控對象的控制??梢哉f專家控制系統(tǒng)是專家系統(tǒng)的一個(gè)具體應(yīng)用方向。專家系統(tǒng)和專家控制系統(tǒng)都依賴知識(shí)庫來存儲(chǔ)和表示知識(shí),并且都通過推理機(jī)制來利用這些知識(shí)解決問題;都體現(xiàn)了一定的智能特性;都有一定的解釋功能。專家系統(tǒng)通常以離線方式進(jìn)行工作,只對專門領(lǐng)域的問題完成咨詢作用,協(xié)助用戶進(jìn)行工作。專家系統(tǒng)的推理是以知識(shí)為基礎(chǔ)的,其推理結(jié)果為知識(shí)項(xiàng)、新知識(shí)項(xiàng)或?qū)υR(shí)項(xiàng)的變更知識(shí)項(xiàng)。然而,專家控制系統(tǒng)需要獲取在線動(dòng)態(tài)信息,并對系統(tǒng)進(jìn)行實(shí)時(shí)控制,需要獨(dú)立和自動(dòng)地對控制作用做出決策,其推理結(jié)果可為變更的知識(shí)項(xiàng),或?yàn)閱?dòng)(執(zhí)行)的某些解析算法。專家系統(tǒng)由哪些部分組成?各部分作用如何?解:專家系統(tǒng)由于不同的系統(tǒng)分類,組成部分也不盡相同。專家系統(tǒng)的簡化結(jié)構(gòu)由知識(shí)庫和推理機(jī)兩部分組成。知識(shí)庫主要用于知識(shí)存儲(chǔ)、共享與傳播、積累與更新并且用于支持推理決策;推理機(jī)主要用于知識(shí)運(yùn)用與推理、解決復(fù)雜問題、動(dòng)態(tài)決策支持與解釋推理過程。專家系統(tǒng)有哪些類型?各個(gè)專家系統(tǒng)的任務(wù)和特點(diǎn)為何?解:專家系統(tǒng)包括有基于規(guī)則的專家系統(tǒng)、基于框架的專家系統(tǒng)、基于模型的專家系統(tǒng)、基于web的專家系統(tǒng)等。利用基于規(guī)則的專家系統(tǒng)用來知識(shí)表示、問題求解與解釋生成;基于規(guī)則的專家系統(tǒng)的主要特點(diǎn)是知識(shí)直觀、推理靈活、容易擴(kuò)展與解釋性強(qiáng)。利用基于框架的專家系統(tǒng)用來知識(shí)表示、知識(shí)存儲(chǔ)與組織與推理與問題求解;基于框架的專家系統(tǒng)的主要特點(diǎn)是知識(shí)結(jié)構(gòu)化程度高、繼承性優(yōu)勢明顯、具有直觀性并且推理靈活性與復(fù)雜性并存。利用基于模型的專家系統(tǒng)用來建立模型、模擬與分析并進(jìn)行優(yōu)化與決策支持;基于模型的專家系統(tǒng)的主要特點(diǎn)是準(zhǔn)確性高、具有通用性和可擴(kuò)展性、能處理復(fù)雜因果關(guān)系與對數(shù)據(jù)和知識(shí)要求高。利用基于web的專家系統(tǒng)用來提供廣泛的在線服務(wù)、知識(shí)共享與傳播、數(shù)據(jù)收集與分析、輔助決策與問題解決;基于web的專家系統(tǒng)的主要特點(diǎn)是跨平臺(tái)訪問性好、交互性強(qiáng)、易于維護(hù)和更新、安全性要求高等。第5章 智能PID控制PIDKpKiKd對系統(tǒng)性能的影響。解Kp增大KpKp過小時(shí),會(huì)降低響應(yīng)速度,延長調(diào)節(jié)過程。積分環(huán)節(jié)與系統(tǒng)靜態(tài)特性有關(guān),用于消除系統(tǒng)的穩(wěn)態(tài)誤差,提高系統(tǒng)的控制精度。增KiKi和現(xiàn)象,進(jìn)而產(chǎn)生較大超調(diào)。Kd會(huì)使系統(tǒng)對噪聲過于靈敏,放大噪聲的影響。PID控制器的組成結(jié)構(gòu)及工作原理。解:專家PID控制基于增量式傳統(tǒng)PID算法,根據(jù)被控對象的特點(diǎn)及實(shí)際工況,直接運(yùn)用專家經(jīng)驗(yàn)設(shè)計(jì)控制規(guī)則,優(yōu)化調(diào)整PID算法,進(jìn)而實(shí)現(xiàn)控制目標(biāo)。通常同時(shí)考慮誤差e(ke(ke(ke(k來設(shè)計(jì)控制規(guī)則??刂埔?guī)則設(shè)計(jì)原理簡述如下:當(dāng)誤差足夠大時(shí),可采用數(shù)值較大的定值輸入來使響應(yīng)迅速收斂。當(dāng)誤差較大時(shí),結(jié)合誤差的變化情況考慮。如果誤差絕對值在逐漸變大或誤差保持不變,施加較強(qiáng)的控制輸入。當(dāng)誤差處于極值附近時(shí),僅采用較強(qiáng)的比例控制。誤差絕對值在逐漸變小時(shí),保持控制輸入不變。當(dāng)誤差較小時(shí),同樣結(jié)合誤差的變化情況考慮。如果誤差絕對值在逐漸變大或誤差保持不變,施加較弱的控制輸入。誤差處于極值附近時(shí),僅采用較弱的比例控制。誤差絕對值在逐漸變小或誤差為零時(shí),保持控制輸入不變。當(dāng)誤差足夠小時(shí)采用PI控制消除靜態(tài)誤差。專家PID控制器由規(guī)則庫和控制環(huán)節(jié)組成,根據(jù)上述規(guī)則調(diào)整控制算法,可實(shí)現(xiàn)系統(tǒng)的專家PID控制。規(guī)則庫可根據(jù)實(shí)際情況進(jìn)行調(diào)整改變。第6章 學(xué)習(xí)控制簡述學(xué)習(xí)控制的主要工作原理、主要方法。解:學(xué)習(xí)控制是指通過各種技術(shù)或方法,在系統(tǒng)運(yùn)行過程中能夠?qū)W習(xí)環(huán)境和被控對象的各種未知不確定性信息,然后將學(xué)到的信息作為“經(jīng)驗(yàn)”用于未來決策或控制以改進(jìn)控制性能。學(xué)習(xí)控制的主要方法包括重復(fù)學(xué)習(xí)控制、迭代學(xué)習(xí)控制、強(qiáng)化學(xué)習(xí)控制等。簡述重復(fù)控制與迭代學(xué)習(xí)控制的區(qū)別與聯(lián)系,描述各自適用的應(yīng)用場景。解:重復(fù)控制的整個(gè)過程是連續(xù)的,即前一周期的控制終點(diǎn)是后一周期的控制起點(diǎn)。而迭代學(xué)習(xí)控制中每次控制行為是相互獨(dú)立的。重復(fù)控制的應(yīng)用場景包括磁盤驅(qū)動(dòng)控制、伺服運(yùn)動(dòng)控制等,迭代學(xué)習(xí)控制的應(yīng)用場景包括機(jī)器臂的重復(fù)定位和抓取控制等。AlphaGo為例,描述強(qiáng)化學(xué)習(xí)的主要工作原理。解:AlphaGo是一個(gè)基于強(qiáng)化學(xué)習(xí)的人工智能程序,其主要工作原理可以概括為以下幾個(gè)步驟。1)數(shù)據(jù)準(zhǔn)備:AlphaGo首先需要準(zhǔn)備大量的圍棋歷史數(shù)據(jù),包括人類玩家的棋譜和自己與自己對弈的數(shù)據(jù)。這些數(shù)據(jù)經(jīng)過預(yù)處理后,被用來訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型。2)模型構(gòu)建:AlphaGo采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)來提取棋盤特征,并根據(jù)這些特征預(yù)測下一步棋的勝率。采用遞歸神經(jīng)網(wǎng)絡(luò)(RNN)來建模棋局的時(shí)間序列模型。3)模型訓(xùn)練:AlphaGo采用監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)相結(jié)合的方法來訓(xùn)練模型。4)決策過程:AlphaGo根據(jù)當(dāng)前棋局狀態(tài),使用已經(jīng)訓(xùn)練好的CNN模型提取局面特征,然后使用RNN模型預(yù)測下一步棋的勝率,最好根據(jù)勝率和其他因素(如局面評估、對手水平等)綜合選擇最優(yōu)的行動(dòng)方案。5)蒙特卡洛樹搜索(MCTS:AlphaGo結(jié)合深度神經(jīng)網(wǎng)絡(luò)和蒙特卡洛樹搜索來進(jìn)行決策制定。6)自我對弈學(xué)習(xí)過程:AlphaGo通過自我對弈的方式進(jìn)行學(xué)習(xí),這是一種典型的強(qiáng)化學(xué)習(xí)策略。7)無監(jiān)督學(xué)習(xí):AlphaGo不依賴于標(biāo)記的訓(xùn)練數(shù)據(jù)集,而是通過自我對弈生成數(shù)據(jù),并根據(jù)這些數(shù)據(jù)來不斷地優(yōu)化神經(jīng)網(wǎng)絡(luò)。通過這些步驟,AlphaGo能夠在圍棋游戲中達(dá)到超越人類專家水平的表現(xiàn),并且通過自我對弈方式發(fā)現(xiàn)了圍棋史上從未見過的策略和布局。第7章 基于智能優(yōu)化算法的智能控制智能優(yōu)化算法是如何解決局部最優(yōu)陷阱問題的?解:不同智能優(yōu)化算法解決局部最優(yōu)問題的方法不同,但總體來說都是通過引入一定(如遺傳算法和差分進(jìn)化算法法為在變異階段給種群后代增加一定的隨機(jī)性,通過隨機(jī)變異、物競天擇的方式避免種群陷入局部最優(yōu)。智能優(yōu)化算法是如何實(shí)現(xiàn)并行計(jì)算的?解:智能優(yōu)化算法從算法特性而言天然適合并行計(jì)算,因?yàn)槠浯蠖嗷谌后w迭代的思路,遺傳算法和差分進(jìn)化算法是基于種群基因的迭代優(yōu)化,粒子群算法則是粒子群的迭代優(yōu)化。這種群體迭代的思路使智能優(yōu)化算法可以在每次迭代中并行地評估多個(gè)解的性能指標(biāo)。遺傳算法與差分進(jìn)化算法的本質(zhì)區(qū)別是什么?解:差分進(jìn)化算法是遺傳算法的一個(gè)變種,其在宏觀上依然滿足進(jìn)化類算法的整體框架,但在細(xì)節(jié)上不拘于自然規(guī)律,對變異、交叉和選擇進(jìn)行了超乎自然規(guī)律的改造,具體7.3差分進(jìn)化算法的差分體現(xiàn)在什么地方?解:差分進(jìn)化算法中的差分主要體現(xiàn)在變異操作上,其變異的來源為種群內(nèi)隨機(jī)選擇的另外兩個(gè)個(gè)體的差,具體操作參見公式(7-1。蟻群算法和粒子群中的解空間分別是什么?解:蟻群算法的解空間為初始節(jié)點(diǎn)到目標(biāo)節(jié)點(diǎn)的所有可行路徑的集合,即可行狀態(tài)集合;粒子群算法的解空間為整個(gè)粒子群,每個(gè)粒子都是一個(gè)潛在解。智能優(yōu)化算法是否比傳統(tǒng)優(yōu)化算法更適合解決控制系統(tǒng)中的優(yōu)化問題?解:是的,因?yàn)楹芏嗫刂葡到y(tǒng)的被控對象較難抽象出完美的數(shù)學(xué)模型,且在線控制系統(tǒng)一般對優(yōu)化速度有著較高的要求,智能優(yōu)化算法更適合解決此類問題。但需注意,方法本身并無好壞之分,適合所需解決問題的才是最好的,在實(shí)際應(yīng)用中需要具體問題具體分析。第8章 機(jī)器人智能控制機(jī)器人的控制系統(tǒng)有哪些特點(diǎn)?解:機(jī)器人控制系統(tǒng)具有以下特點(diǎn):1)機(jī)器人的控制與機(jī)構(gòu)運(yùn)動(dòng)學(xué)及動(dòng)力學(xué)密切相關(guān)應(yīng)選擇不同坐標(biāo)系,并做適當(dāng)?shù)淖鴺?biāo)變換,求解機(jī)器人運(yùn)動(dòng)學(xué)的正逆問題,并考慮各關(guān)節(jié)之間的慣性力等影響。2)機(jī)器人控制系統(tǒng)是多變量自動(dòng)控制系統(tǒng):機(jī)器人的自由度較多,簡單的機(jī)器人結(jié)構(gòu)由3~5個(gè)自由度組成,復(fù)雜的機(jī)器人結(jié)構(gòu)有十幾個(gè)自由度。每個(gè)自由度包含一個(gè)伺服機(jī)構(gòu),多個(gè)獨(dú)立的伺服系統(tǒng)需要協(xié)調(diào)運(yùn)動(dòng)才能完成任務(wù)。3)機(jī)器人控制系統(tǒng)是非線性的控制系統(tǒng):描述機(jī)器人狀態(tài)和運(yùn)動(dòng)的數(shù)學(xué)模型是一個(gè)非線性模型,隨狀態(tài)和外力的變化,其參數(shù)也在變化,各變量之間還存在耦合,經(jīng)常使用重力補(bǔ)償、前饋、解耦或自適應(yīng)控制等方法。4)機(jī)器人的動(dòng)作可以通過不同的方法和路徑來完成,因而存在一個(gè)“最優(yōu)”的問題。智能機(jī)器人可以根據(jù)傳感器和模式識(shí)別的方法獲得對象及環(huán)境的工況,自動(dòng)地選擇最佳的控制規(guī)律。機(jī)器人的位置控制與力控制指的是什么?解:機(jī)器人位置控制的目的是讓機(jī)器人各關(guān)節(jié)實(shí)現(xiàn)預(yù)期規(guī)劃的運(yùn)動(dòng),最終保證機(jī)器人末端執(zhí)行器沿預(yù)定的軌跡運(yùn)行。機(jī)器人力控制的目的是控制機(jī)器人各關(guān)節(jié)使其末端表現(xiàn)出一定的力和力矩特性。當(dāng)機(jī)器人在空間跟蹤軌跡運(yùn)動(dòng)時(shí),可采用位置控制,機(jī)器人會(huì)嚴(yán)格按照預(yù)先設(shè)定的位置軌跡進(jìn)行運(yùn)動(dòng)。但是,當(dāng)機(jī)器人在完成一些與環(huán)境存在力作
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年安徽職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫帶答案詳解
- 2026年廣東省肇慶市單招職業(yè)傾向性考試題庫及參考答案詳解1套
- 2026年日照航海工程職業(yè)學(xué)院單招職業(yè)適應(yīng)性考試題庫參考答案詳解
- 2026年杭州職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫及參考答案詳解1套
- 2025廣西玉林市博白縣消防救援大隊(duì)公開招聘政府專職消防員10人考試重點(diǎn)試題及答案解析
- 2026年甘肅省甘南藏族自治州單招職業(yè)適應(yīng)性測試題庫附答案詳解
- 2026河南信陽市羅山縣征兵備考核心題庫及答案解析
- 太平保險(xiǎn)項(xiàng)目經(jīng)理資格考試大綱含答案
- 2026年哈密職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試題庫含答案詳解
- 2026年內(nèi)蒙古烏海市單招職業(yè)適應(yīng)性測試題庫參考答案詳解
- 2025年合肥市蜀山區(qū)城市建設(shè)投資有限責(zé)任公司公開及補(bǔ)充招聘工作人員23人參考筆試題庫及答案解析
- 學(xué)堂在線 雨課堂 學(xué)堂云 自我認(rèn)知與情緒管理 章節(jié)測試答案
- 2025貴州省專業(yè)技術(shù)人員繼續(xù)教育公需科目考試題庫(2025公需課課程)
- 工時(shí)的記錄表
- 金屬材料與熱處理全套ppt課件完整版教程
- 廣州市城市規(guī)劃管理技術(shù)標(biāo)準(zhǔn)與準(zhǔn)則(用地篇)
- 熱拌瀝青混合料路面施工機(jī)械配置計(jì)算(含表格)
- 水利施工CB常用表格
- 心肺復(fù)蘇后昏迷患者預(yù)后評估
- DN800主給水管道下穿鐵路施工方案
- 《鴻門宴》話劇劇本
評論
0/150
提交評論