外文翻譯--機(jī)器人模仿控制論
《外文翻譯--機(jī)器人模仿控制論》由會(huì)員分享,可在線閱讀,更多相關(guān)《外文翻譯--機(jī)器人模仿控制論(10頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
遼寧科技大學(xué)本科生畢業(yè)設(shè)計(jì) 第 1 頁(yè) 4720, 510) 642a of as an to In we of in In we on of on of he of in of in to In we to as of a in an a in to a In 遼寧科技大學(xué)本科生畢業(yè)設(shè)計(jì) 第 2 頁(yè) to a s to by on in c,f(et 1984;et 1988))as of by an In a is by at is to of to to of a of of et 1988;et 1989;992)). in is to an or to an In it’s of et 1984; et 1988)a as in it is at is in My in 987, as a of of a of my My in of he me to At in to be i (1986), 1987) en 1988). In of 遼寧科技大學(xué)本科生畢業(yè)設(shè)計(jì) 第 3 頁(yè) in of on of or it it be at it in of or be of in be a us of in In of to it is to so of In of to be in In in is by in of of a of of of to of on i) In is of in at c,f(i,1987;987;989))of In in is of a is in is as is of a in in is It to us in to in of it to to of an 遼寧科技大學(xué)本科生畢業(yè)設(shè)計(jì) 第 4 頁(yè) by We 990) of so In of we to by in a et 1990). as et 1988; et 1989; et 1990), of be in or in of in in as so et 1988;et 1989),of at of of is by to of at of of so is of a of in a so a of be by or a in a to a of a to a in I on of of to in to of at of do a at in be is at 遼寧科技大學(xué)本科生畢業(yè)設(shè)計(jì) 第 5 頁(yè) of at a be as of to do of in us as an of In a of be in or in of in a of of a a to or of is in it is so to to to to in 987) of so (In an is to in an is by in to of to to in to be et 1991) we a of on in to of to In in of of of of by is in to of of in of in of 遼寧科技大學(xué)本科生畢業(yè)設(shè)計(jì) 第 6 頁(yè) of of of to of it is to of we of in on on of in in 遼寧科技大學(xué)本科生畢業(yè)設(shè)計(jì) 第 7 頁(yè) 機(jī)器人 模仿控制 論 羅伯特霍洛維茨 機(jī)械工程學(xué)系 加州大學(xué)伯克利分校 伯克利分校,加州 94720 ,美國(guó) 電話: ( 510 ) 642子郵箱: 要 模仿 控制涵蓋了一類可編程機(jī)器 的 控制算法,如機(jī)器人 的動(dòng)作 就是 通過一個(gè)互動(dòng)的進(jìn)程, 以及能讓 機(jī)器來執(zhí)行復(fù)雜任務(wù) 的機(jī)動(dòng)馬達(dá)來實(shí)現(xiàn)的 。在本文中,我們討論了 機(jī)器人模仿 控制器功能的識(shí)別和自適應(yīng)控 制算法 的使用 。 我們 還特別 討論 了在積分變換基礎(chǔ)上 改 進(jìn) 模仿 方案 ,重復(fù)控制器和自適應(yīng)模仿 方案 的 異同 , 突出 了在 積分變換 基礎(chǔ)上 自適應(yīng)模仿算法 的 穩(wěn)定性和收斂性 ,并 給 出 了 表明其中 一些特性 的 實(shí)驗(yàn)結(jié)果。 關(guān)鍵詞:模仿控制,自適應(yīng)控制,重復(fù)控制,機(jī)器人 導(dǎo)言 機(jī)器人 技術(shù) 和 模仿 人類 的 人工智能 一直是最難以實(shí)現(xiàn)的追求和目標(biāo)。 雖然關(guān)于 人 類許多方面 的 模仿 仍然沒有得到很好的 實(shí)現(xiàn) , 但是 在模仿 人類如何 獲得 執(zhí)行復(fù)雜的動(dòng) 作所必 需 的運(yùn)動(dòng)技能 上, 機(jī)器人運(yùn)動(dòng)控制已經(jīng)取得了 很大 進(jìn)展。在本文中,我們將參照 模仿控制器類的控制系統(tǒng), 生 成 一個(gè) 以 迭代方式 進(jìn)行的控 制 動(dòng)作,并 運(yùn) 用功能適應(yīng)算法,以執(zhí)行規(guī)定的 動(dòng)作 。在典型的 模仿 控制應(yīng)用 軟件中,測(cè)試系統(tǒng)測(cè)試出錯(cuò)誤信號(hào)后 便 更新控制輸入,而 適應(yīng)算法 也因此不斷地 提高控制系統(tǒng)的性能 ,從而受控制的機(jī)器可以反復(fù) 執(zhí)行規(guī)定的任務(wù) 。 在 研究 機(jī)器人運(yùn)動(dòng)控制 的 領(lǐng)域里 ,模仿控制這一術(shù)語 也許是第一次 為 他的同事們 所 使用 (c,f(et 1984;et 1988))。 模仿控制定義為 通過 迭代 方式 改善進(jìn)程 從而 達(dá)到零誤差漸近跟蹤 的一類 控制算法, 他也把它命名為 模仿。在這個(gè)過程中 , 機(jī)器人總 是從相同的初始條件 開始,在 一個(gè)單一的有限 度的范圍內(nèi)進(jìn)行反復(fù)的任務(wù)追蹤 。 控制動(dòng)作的 每 次測(cè)試 結(jié)果 相當(dāng)于控制動(dòng)作的 前 一次測(cè)試結(jié)果 再加上加上 條 件 比例跟蹤誤差及其時(shí)間導(dǎo)數(shù)。 遼寧科技大學(xué)本科生畢業(yè)設(shè)計(jì) 第 8 頁(yè) 與 模仿和改善控制 方案 并行發(fā)展的是 ,大量的研究已經(jīng) 直接 針對(duì)機(jī)器人軌跡跟蹤重復(fù)控制算法的應(yīng)用和其他運(yùn)動(dòng)控制問題 (et 1988;et 1989;992))。重復(fù)控制的基本目標(biāo)是 消 除 不明 周期 干擾或 跟蹤 未知定期參考軌跡。在它最簡(jiǎn)單的形式 中 ,許多重復(fù)控制算法 的 定期信號(hào)發(fā)生器 與 改善模仿 規(guī)律很 相似 (et 1984; et 1988)。然而,在模仿過程中的行為改善控制器有 時(shí)間界限 ,該行為不斷重復(fù)控制器 上調(diào)節(jié) 器 的動(dòng)作 。此外, 對(duì)于 模仿 改善 的方法,假定 機(jī)器人 在 每一 次 模仿 試驗(yàn) 中 總是 從相同的初始條件開始執(zhí)行任務(wù) 的 ,但是這不是重復(fù)控制方法那種情況 。 我 在 模仿和重復(fù)控制 方面的興趣開始于 1987 年, 是因?yàn)槟菚r(shí)我和 我的 校友及 同事起 學(xué)習(xí)研究了 一類 有關(guān) 機(jī)器人 自適應(yīng)和重復(fù)控制器穩(wěn)定 性 的知識(shí) 。我的同事和朋友 重復(fù)控制 這塊領(lǐng)域里 一直 都 非常積極地 去 研究 , 也是 他 把 我 引入 了這個(gè) 課 題。當(dāng)時(shí)機(jī)器人 技術(shù) 和控制 領(lǐng)域里有很多人都積極的為 機(jī)器人 尋找 能 漸近穩(wěn)定的 自適應(yīng)控制算法 ,所以 這些算法 都必須通過嚴(yán)格的 證 明 。 最近, i(1986), 987 以及 988)已經(jīng)通過運(yùn) 用鈍性解決了這個(gè)問題。 與此相反 的是 , 在那 一時(shí)期大部分模仿和重復(fù)控制的的穩(wěn)定 性 成果 都是建立在 幾個(gè)不現(xiàn)實(shí)的假設(shè) 之上的,或者 是動(dòng)態(tài)的機(jī)器人線性假定,或者 是 被認(rèn)為可能是至少部分線性反饋控制。此外, 還 有人認(rèn)為在大多數(shù)工程 中 ,即使 是 短暫的模仿 , 機(jī)器人 的 實(shí)際反應(yīng) 也 是定期或重復(fù)的,并 且還 可直接 測(cè)量出 聯(lián)合加速度 。 最近我 和 們的自適應(yīng)控制研究 中 已 證明了這種說法 ,并得出結(jié)論 ,我們 認(rèn)為模仿控制器 可 使用類似的做法 進(jìn)行 合成和分析。 我們覺得,模仿和控制器的主要優(yōu)點(diǎn) 在于它的簡(jiǎn)單和直接。在 機(jī)器人軌跡控制 的其他方法中 , 還 包括參數(shù)自適應(yīng)控制, 但是 有必要計(jì)算 一下 所謂的 機(jī)器人 逆動(dòng)力學(xué)方程。在許多 類似 的 方法中, 這些方程必須 以 實(shí)際 時(shí)間 計(jì)算 。 相反,在改善模仿和重復(fù)控制 的方法中 , 動(dòng)作的控制是由 簡(jiǎn)單功能 的自 適應(yīng) 算法相關(guān) 產(chǎn)生的 。此外 , 由于 在工業(yè) 應(yīng)用 的 大多數(shù)機(jī)器人涉及重復(fù)執(zhí)行同樣的任務(wù), 那么 實(shí)現(xiàn) 一個(gè) 不需要任何一個(gè) 有 經(jīng)驗(yàn)或者具備一定 知識(shí)結(jié)構(gòu)的機(jī)器人運(yùn)動(dòng)方程 而僅 通過實(shí)踐 “ 模仿 ” 的 控制算法 的想法 ,也非常 具有吸引力 成模仿控制器的 方法 根 據(jù)如下見解:一)在模仿控制 方面 ,電機(jī)靈巧 度 不是通過使用獲得的反饋 來實(shí)現(xiàn)的 。這是 當(dāng)時(shí)大部分 自適應(yīng)控制器采用的 方法 (c,f(i,1987; 987;989))。在這些自適應(yīng) 的方法中, 非線性控制 規(guī) 律和參數(shù)調(diào)整算法的 遞減都是 實(shí) 遼寧科技大學(xué)本科生畢業(yè)設(shè)計(jì) 第 9 頁(yè) 際機(jī)器人關(guān)節(jié)坐 標(biāo)和速度 的性 能 。二)與此相反,在模仿控制算法 中 ,機(jī)動(dòng)靈活 的 獲得是 通過使用一種前饋控制 的動(dòng)作 ,這是存儲(chǔ)在內(nèi)存 中的,當(dāng)執(zhí)行任務(wù)時(shí)便可以檢索出來。但是 模仿 的 過程中 要 涉及 到 調(diào)整前饋 動(dòng)作后 功能 的適應(yīng)性 。三) 反饋信息在使 系統(tǒng) 穩(wěn)定和保證前饋功能誤差和跟蹤誤差 之間映射的 嚴(yán)格被動(dòng) 中發(fā)揮著基礎(chǔ)性的作用 。因此,很明顯,我們認(rèn) 為 為了 在 模仿和反復(fù)算法綜合和分析 中的 自適應(yīng)控制結(jié)果 的基礎(chǔ)上使用被動(dòng) ,有必要 計(jì)算 和證明自適應(yīng)控制法的穩(wěn)定, 即能 實(shí)現(xiàn)機(jī)器人動(dòng)態(tài)線性的前饋控制,而不是 反饋控制 。我們 把 這些結(jié)果 寫 在 ( 990)并有 所謂的期望補(bǔ)償自適應(yīng)律( 的介紹 。在這 個(gè)自適應(yīng) 方案 中, 非線性控制律和參數(shù)自適應(yīng)算法 遞減都是改變后 運(yùn)動(dòng)軌跡和速度 的性能 。后來我們就可以 通過 運(yùn) 用 重復(fù)控制法 (et 1990)代替 自適應(yīng)法的 合成重復(fù)控制器的機(jī)器人手臂 了 。 不幸的是, 正如在 (et 1988; et 1989; et 1990)討論的一樣 ,漸近收斂的基 礎(chǔ)的重復(fù)控制 系統(tǒng) 只有在機(jī)械 動(dòng)態(tài)或 局限性 干擾信號(hào) 的嚴(yán)格限 制性條件下才能保證。這些條件一 般 不適合 應(yīng)用在機(jī)器人 的 控制中。 大 多數(shù)情況下,更新 方案 后有相應(yīng)的修改 ,如所謂的 Q 濾波器修改 (et 1988;et 1989), 可以 增強(qiáng)重復(fù)控制器 強(qiáng)度 , 但是要 以犧牲限制其跟蹤性能 為代價(jià) 。同樣,就 機(jī)器人開始時(shí)的每一個(gè)模仿 實(shí)驗(yàn)的初始條件而言,在合理的假設(shè)下, 融合改善模仿 方案 已經(jīng)得到證明 。到目前為止 ,我們討論的 改善模仿和重復(fù)控制 方案 的 另一個(gè)缺點(diǎn) ,就是這些算法是為單一任務(wù)的迭代模仿而提出的 。在這些領(lǐng)域 里 沒有任何研究工作 可 提供拓展 模仿 工序的 一個(gè) 這樣的 機(jī)制, 它能使機(jī)器同時(shí)模仿大量 家務(wù)工作 ,或提 是 供一個(gè)系統(tǒng)的機(jī)制, 即運(yùn)用通過模仿特殊任務(wù)獲得的靈活性 去 執(zhí)行 稍微 有點(diǎn)不同 但具有類似性質(zhì)的工作 。 在 教員 后 ,我 和 這些問題 進(jìn)行了研究 。 我們的研究表明,本 質(zhì)改變 和重復(fù)控制 規(guī)律的巨大局限性 和 這些用來模仿多樣任務(wù)的算法的失效在某種程度上 源于一個(gè)事實(shí), 即 所有這些 方案 都是 使用點(diǎn)對(duì)點(diǎn)功能適應(yīng) 算法。這些 算法 僅僅只更新了 控制輸入在當(dāng)前即時(shí)的時(shí)間 內(nèi)的實(shí)用性,但并 沒有提供一種可以在相鄰時(shí)間內(nèi) 更新控制輸入 的 機(jī)制。然而,大多數(shù)應(yīng)用中的必須查明 的 控制功能,通常至少 是 分段連續(xù) 的 。因此,在某一特定點(diǎn) 上控制的實(shí)用性 將 和附近的點(diǎn)的實(shí)用性幾乎一樣 ,而 點(diǎn)對(duì)點(diǎn) 的 功能更新 規(guī) 律不 能 充分利用這種情況。這個(gè) 焦點(diǎn) 已 經(jīng) 更廣泛 地 影響模仿 問題 和可尋址 內(nèi)容 存儲(chǔ)器 的問題 。讓我們考慮 把機(jī)器人的多 任務(wù)模仿控制算法 的情 遼寧科技大學(xué)本科生畢業(yè)設(shè)計(jì) 第 10 頁(yè) 況 作為一個(gè)例子。在此應(yīng)用程序 中 , 幾個(gè)功能變量必須確定,即機(jī)器人的逆動(dòng)力學(xué) 參數(shù) 。在有限的時(shí)間 內(nèi)用于訓(xùn)練 改善控制 的 軌道不能訪問 到主函數(shù) 每一個(gè)點(diǎn)(或載體)。因此,在用 點(diǎn)至點(diǎn)更新的 規(guī) 律 時(shí),執(zhí)行一次 任務(wù) 中 控制輸入功能 的精確識(shí)別 將不會(huì)提供生成控制輸入任務(wù) 的 任何信息,除非其他類似的軌道相 交,或 者使用了 某種插值 。類似地, 在可 尋址內(nèi)容存儲(chǔ)器 中 ,可取的做法是模仿算法 應(yīng) 有一個(gè) “ 插值 “ 的 性能 ,因此,輸入向量是類似以前的經(jīng)驗(yàn) 輸入向量, 但對(duì)系統(tǒng)來說還是新的向量 ,輸出向量 還是 類似以前的經(jīng)驗(yàn) 輸出載體。 在 機(jī)器人模仿控制 的 插值 問題上, ( 987)一書 提出 了 利用所謂的 “ 小腦模型算術(shù)計(jì)算機(jī) ” (解決辦法 。 在 該算法 中,一個(gè) 輸入向量 被 映射到 在 中間記憶的幾個(gè)點(diǎn)上,而 輸出向量 是由總結(jié)存儲(chǔ)在輸入向量被映射到的所有點(diǎn)的值算出的 。輸入向量的 映射有一個(gè)特性就是在中間記憶中彼此靠近的輸入向量將映射在重疊的區(qū) 域, 這能 導(dǎo)致插值 的 自動(dòng) 進(jìn) 行。 在 (et 1991)中 ,我們介紹了 基于 積分變換 的 模仿控制系統(tǒng) 的 一類功能識(shí)別算法,以便處理 在上文提到的 點(diǎn)對(duì)點(diǎn) 的 重復(fù)性和模仿改善控制器的 強(qiáng)度 和插值問題。在這種自適應(yīng)模仿算法 中, 未知函數(shù) 是以 第一類積分方程 的形式 定義 的,這種積分方程由 已知的和未知的 核心 功能影響 函數(shù)組成 。模仿過程中涉及 到通過估計(jì)影響函數(shù)對(duì)未知函數(shù)的間接估計(jì) 。整個(gè)影響函數(shù)被 調(diào)整 成 與每一個(gè)點(diǎn)的核心值成 比例。因此,在更新影響 函數(shù)和發(fā)生函數(shù) 的估計(jì) 中核心值的使用為 這些算法提供了理想 的 插值和平滑 的性能 ,并且 克 服 了前面點(diǎn)對(duì)點(diǎn)改善和重復(fù) 控制 方案 的有關(guān)多變函數(shù) 估計(jì)中 的 限制 問題 。此外,積分變換 的運(yùn) 用 使得這些模仿算法表現(xiàn)出強(qiáng)大的穩(wěn)定性和收斂性 成為可能 。 需要提醒的是,在 我們討論的 研究報(bào)告中 使用的機(jī)器人 環(huán)境 跟蹤模仿控制方面, 以及 強(qiáng)調(diào) 的 改善模仿 方案 和 重復(fù)控制 方案 及 模仿 方案 異同的 基礎(chǔ) 都是 積分變換。在這一領(lǐng)域一些未 得到解 決的問題 的 結(jié)論和思 考 將在后續(xù)介紹 。- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
6 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 外文 翻譯 機(jī)器人 模仿 控制論
鏈接地址:http://zhongcaozhi.com.cn/p-30309.html