人工智能 第二章_第1頁
人工智能 第二章_第2頁
人工智能 第二章_第3頁
人工智能 第二章_第4頁
人工智能 第二章_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第二章 智能Agent,內(nèi)容提要,Agents和環(huán)境 理性Agent 環(huán)境的性質(zhì) Agent的類型與結(jié)構(gòu),Agent,Agent通過感知器感知環(huán)境并通過執(zhí)行器對所處的環(huán)境產(chǎn)生影響 人類Agent 眼睛,耳朵為感知器 手,腳,聲道為執(zhí)行器 機(jī)器人Agent 攝像頭,紅外距測儀為感知器 馬達(dá)為執(zhí)行器,Agent和環(huán)境,Agent函數(shù)將任何感知?dú)v史數(shù)據(jù)映射為行為: Agent程序通過在物理系統(tǒng)上運(yùn)行來實(shí)現(xiàn)Agent函數(shù) Agent = 體系結(jié)構(gòu) + 程序,真空吸塵器世界,感知器:地點(diǎn)和內(nèi)容(eg. A,Dirty) 行為:向左,向右,洗塵,無操作,真空吸塵器世界,理性Agent,理性agent:對于

2、每一可能的感知數(shù)據(jù)序列,一個(gè)理性的agent應(yīng)該采取一個(gè)行為以達(dá)到最大的性能。 理性判斷的4個(gè)因素 性能度量 先驗(yàn)知識 可以完成的行動 截至到此刻的感知序列,理性Agent,一個(gè)Agent應(yīng)該根據(jù)它感知的信息和它能夠進(jìn)行的行為而做正確的事情 正確的行為將使得Agent能夠取得最大的成功 性能度量:一個(gè)客觀的標(biāo)準(zhǔn)來評價(jià)Agent的行為的成功性 Eg.真空器agent的性能度量可以是它清洗區(qū)域的數(shù)量,花費(fèi)的時(shí)間,消耗的能量,產(chǎn)生的噪音等等 Eg.真空洗塵器8個(gè)小時(shí)內(nèi)清理的灰塵總量來度量性能? 以行為來度量性能不如以結(jié)果來度量性能,理性Agent,全知:明確知道它的行動產(chǎn)生的實(shí)際結(jié)果并且作出相應(yīng)的動

3、作 理性不等同于全知(已知的知識都是有限的) 理性不等于完美: 理性是使期望的性能最大化 完美是使實(shí)際的性能最大化,理性Agent,理性agent能夠進(jìn)行信息收集。 理性的agent應(yīng)該具有自主性,能夠進(jìn)行學(xué)習(xí) 從環(huán)境的感知信息中根據(jù)歷史經(jīng)驗(yàn)來學(xué)習(xí),任務(wù)環(huán)境,任務(wù)環(huán)境:包括性能(Performance),環(huán)境(Environment),agent的執(zhí)行器(Actuators)和傳感器(Sensors),英文縮寫為PEAS 對于每一個(gè)智能agent,必須說明其PEAS參數(shù) Eg.自動駕駛出租車 性能度量 環(huán)境 執(zhí)行器 傳感器,任務(wù)環(huán)境,Eg.自動駕駛出租車 性能度量:安全性,快速性,交通違規(guī),舒

4、適度,利潤 環(huán)境:馬路,其他交通工具,行人,乘客 執(zhí)行器:方向盤,加速油門,剎車,語音合成器 傳感器:攝像頭,紅外或聲納,速度表,GPS,鍵盤,麥克風(fēng),任務(wù)環(huán)境, Environment: Patient, hospital, staff Actuators: Screen display (questions, tests, diagnoses, treatments, referrals) Sensors: Keyboard (entry of symptoms, findings, patients answers),Eg.醫(yī)療診斷系統(tǒng) 性能度量:病人的健康性,病人花費(fèi) 環(huán)境:病人,醫(yī)院

5、,工作人員 執(zhí)行器:顯示屏(詢問,測試,診斷,治療方案) 傳感器:鍵盤(輸入癥狀,現(xiàn)場檢測,病人的回答),任務(wù)環(huán)境,14,Eg.挑揀零件機(jī)器人 性能度量:正確挑揀的零件所占的百分比 環(huán)境:零件傳送帶,容器 執(zhí)行器:機(jī)器人手臂和手 傳感器:攝像頭,關(guān)節(jié)感知器,任務(wù)環(huán)境,15,Eg.交互式英語教學(xué)者 性能度量:最大化學(xué)生成績 環(huán)境:學(xué)生 執(zhí)行器:顯示屏(練習(xí)題,建議,正確答案) 傳感器:鍵盤,環(huán)境的性質(zhì),16,完全可觀察的 vs.部分可觀察的 一個(gè)agent的傳感器在每個(gè)時(shí)間點(diǎn)上都能獲取環(huán)境的完整狀態(tài) 一個(gè)agent的傳感器在每個(gè)時(shí)間點(diǎn)上都能獲取環(huán)境的部分狀態(tài) 真空洗塵器?自動駕駛汽車? 單age

6、nt vs.多agent 單agent獨(dú)自運(yùn)行 eg.字謎游戲 多agent同時(shí)運(yùn)行 eg.國際象棋 國際象棋 vs. 駕駛出租車?,環(huán)境的性質(zhì),確定的 vs.隨機(jī)的 環(huán)境的下一個(gè)狀態(tài)完全取決于當(dāng)前狀態(tài)和agent執(zhí)行的動作 部分可觀察? 出租車駕駛?真空吸塵器? 片段式的 vs. 延續(xù)式的 agent的經(jīng)歷被分成一個(gè)個(gè)原子片段,在每個(gè)片段中agent感知信息并完成單個(gè)行動,下一個(gè)片段不依賴于以前的片段 檢查次品零件的機(jī)器人?國際象棋?,環(huán)境的性質(zhì),18,靜態(tài)的 vs. 動態(tài)的 環(huán)境在agent計(jì)算的時(shí)候不會變化(vs.會變化) 半動態(tài)的:環(huán)境本身不變化但agent的性能評價(jià)隨時(shí)間變化 出租車

7、,國際象棋,填字游戲? 離散的 vs.連續(xù)的 環(huán)境的狀態(tài),時(shí)間的處理方式以及agent的感知信息和行動都有離散/連續(xù)之分 國際象棋,出租車駕駛?,環(huán)境的性質(zhì),環(huán)境的性質(zhì)決定了agent的設(shè)計(jì) 最難處理的情況: 部分可觀察的,隨機(jī)的,連續(xù)的,動態(tài)的,延續(xù)式的,多agent的,Agent函數(shù)和程序,一個(gè)agent用agent函數(shù)來表示 agent函數(shù)將感知數(shù)據(jù)序列映射為行為 Agent程序 以傳感器得到的當(dāng)前感知信息為輸入 以執(zhí)行器的行動為輸出 僅僅以當(dāng)前感知為輸入而不是以整個(gè)歷史感知為輸入,Agent的表驅(qū)動方法,缺點(diǎn) 表太大 創(chuàng)建表時(shí)間長 非自主性,需人工填寫 即使能夠?qū)W習(xí),也需要很長的時(shí)間,

8、Agent的類型,四種基本的類型 簡單反射agent 基于模型的反射agent 基于目標(biāo)的agent 基于效用的agent,真空吸塵器的Agent程序,簡單反射的agent,基于當(dāng)前的感知選擇行動,不關(guān)注感知?dú)v史,簡單反射的agent,環(huán)境是完全可觀察的還是部分可觀察的?,Eg. 真空吸塵器問題,剎車問題,基于模型的反射agent,Agent根據(jù)感知?dú)v史維持內(nèi)部狀態(tài) Agent隨時(shí)更新內(nèi)部狀態(tài)信息,基于模型的反射agent,基于目標(biāo)的agent,除了根據(jù)感知信息之外,還要根據(jù)目標(biāo)信息來選擇行動 效率比較低,需要推理 搜索和規(guī)劃算法,基于目標(biāo)的agent,基于效用的agent,當(dāng)達(dá)到目標(biāo)的行為有很多種的時(shí)候,需要考慮效率 環(huán)境是部分可觀察的和隨機(jī)的,不確定下的決策過程可以通過基于效用的agent來實(shí)現(xiàn)。 效用的作用 多目標(biāo)相沖突時(shí) 多目標(biāo)在不確定環(huán)境中 一個(gè)目標(biāo)有多種行為可以達(dá)到時(shí),基于效用的agent,學(xué)習(xí)agent

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論