人工智能通識導論 課件 王萬良 第5-9章 連接主義:深度學習與大語言模型-電子游戲中的人工智能_第1頁
人工智能通識導論 課件 王萬良 第5-9章 連接主義:深度學習與大語言模型-電子游戲中的人工智能_第2頁
人工智能通識導論 課件 王萬良 第5-9章 連接主義:深度學習與大語言模型-電子游戲中的人工智能_第3頁
人工智能通識導論 課件 王萬良 第5-9章 連接主義:深度學習與大語言模型-電子游戲中的人工智能_第4頁
人工智能通識導論 課件 王萬良 第5-9章 連接主義:深度學習與大語言模型-電子游戲中的人工智能_第5頁
已閱讀5頁,還剩166頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第5章連接主義:深度學習與大語言模型2第5章連接主義:深度學習與大語言模型深度學習算法能夠發(fā)現(xiàn)大數(shù)據(jù)中的復雜結構,掀起了人工智能大語言模型的研究與應用熱潮。本章首先介紹淺層學習的局限性、動物視覺機理和深度學習的提出,簡要介紹大語言模型的應用,然后介紹目前廣泛應用的卷積神經(jīng)網(wǎng)絡及其應用。最后介紹基于深度學習的計算機視覺、人臉識別、虹膜識別以及機器翻譯、語音識別等中的應用。第8章機器學習與深度學習5.1動物視覺機理與深度學習大模型5.2卷積神經(jīng)網(wǎng)絡及其應用5.3深度學習的應用5.4計算機視覺5.5機器翻譯5.6語音識別35.1.1淺層學習的局限性淺層學習算法人工神經(jīng)網(wǎng)絡(BP算法)●雖被稱作多層感知機,但實際是一種只含有一層隱層節(jié)點的淺層模型。SVM(SupportVectorMachines)、Boosting、最大熵方法(如LogisticRegression)等。●帶有一層隱層節(jié)點(如SVM、Boosting),或沒有隱層節(jié)點(如LogisticRegression)的淺層模型。局限性:有限樣本和有限計算單元情況下對復雜函數(shù)的表示能力有限,針對復雜分類問題其泛化能力受到一定制約。45.1.1淺層學習的局限性模式識別:5獲取數(shù)據(jù)預處理特征提取特征選擇推理、預測、識別特征表達良好的特征表達,是識別成功的關鍵;識別系統(tǒng)的計算和測試工作耗時主要集中在特征表達部分;傳統(tǒng)的方法是手工設計良好的特征提取器,這需要大量的工程技術和專業(yè)領域知識。能否自動地學習特征呢?深度學習!機器學習5.1.2動物視覺機理1968年諾貝爾醫(yī)學獎獲得者美國神經(jīng)生物學家DavidHubel和TorstenWiesel發(fā)現(xiàn):人的視覺系統(tǒng)的信息處理是分級的。高層的特征是低層特征的組合,從低層到高層的特征表示越來越抽象,越來越能表現(xiàn)語義或者意圖抽象層面越高,存在的可能猜測就越少,就越利于分類65.1.3深度學習的提出71980年日本福島邦彥提出帶卷積和池化的新知機,但沒有用BP算法。1989年YannLeCun(楊立坤)等將BP算法引入卷積神經(jīng)網(wǎng)絡訓練。1998年YannLeCun(楊立坤)等設計了7層卷積神經(jīng)網(wǎng)絡LeNet-5。●2006年,Hinton教授等在著名學術刊物《科學》上發(fā)表深度神經(jīng)網(wǎng)絡學習算法?!?011年Hinton等人提出用ReLU激活函數(shù)取代Sigmod函數(shù),有效解決深度學習梯度消失的問題?!?011年后,微軟首次將DNN(深層神經(jīng)網(wǎng)絡)應用到語音識別,獲得的重大突破。●2012年,Hinton教授研究組為了證明卷積神經(jīng)網(wǎng)絡的效果,帶領他的兩位學生組成多倫多大學小組參加ImageNet圖像識別大賽(ILSVRC),取得巨大成功?!裆疃葘W習的提出得益于高性能計算和大數(shù)據(jù)技術的快速發(fā)展。5.1.4大語言模型8●大語言模型(LargeLanguageModel,LLM)簡稱大模型(LargeModel),是指參數(shù)量非常大的人工神經(jīng)網(wǎng)絡模型,能夠在大量的文本數(shù)據(jù)上進行訓練,能夠學習到數(shù)據(jù)的復雜特征。●2013年之前的提出的CNN/RNN/LSTM是大模型的基礎?!?017年Google提出的Transformer引入了自注意力機制和位置編碼,改進了RNN和LSTM不可并行計算的缺陷?!?018年Google推出基于Transformer架構的具有3.4億個參數(shù)的預訓練語言模型表征模型BERT等出現(xiàn)。5.1.4大語言模型9●2018年6月OpenAI發(fā)布GPT-1模型,1.1億個參數(shù)。●2018年11月OpenAI發(fā)布GPT-2模型,15億個參數(shù)。●2019年6月10日OpenAI發(fā)布GPT-3模型,1750億個參數(shù),并向部分合作伙伴提供了訪問權限。●2019年9月OpenAI開放了GPT-2的全部代碼和數(shù)據(jù),并發(fā)布了更大版本?!?020年5月OpenAI宣布推出GPT-3模型的beta版本,該模型擁有1750億個參數(shù),是迄今為止最大的自然語言處理模型。●2022年11月30日OpenAI通過GPT-3.5系列大型語音模型微調(diào)而成的全新對話式通用人工智能模型ChatGPT正式發(fā)布,將大模型的發(fā)展推向高潮。5.1.4大語言模型10●2023年3月15日OpenAI震撼推出了大型多模態(tài)模型GPT-4,不僅能夠閱讀文字,還能識別圖像,并生成文本結果,現(xiàn)已接入人工智能聊天機器人ChatGPT向Plus用戶開放?!馛hatGPT的技術關鍵是使用了“人類反饋強化學習”RLHF進行訓練。它可以理解人類輸入的文字,并根據(jù)文字的提問和指令,以文字的方式輸出答案和反饋,從而實現(xiàn)借助自然語言的多輪次的人機對話?!?023年11月OpenAI公司發(fā)布處理速度更快、費用更低的GPT-4Turbo模型。●2024年月OpenAI公司發(fā)布文生視頻大模型Sora,能準確理解用戶指令表達的需求,以視頻的形式展示。其中包含高度詳細場景、復雜攝像機運動以及充滿活力的多個角色。5.1.4大語言模型11●2024.5.14OpenAI發(fā)布“Magic(魔法)”包括:ChatGPT新UI、桌面版GPT、以及GPT-4o?!馟PT-4o是全能多模態(tài)大模型,可以接收文本、音頻和圖像的任意組合作為輸入,并實時生成文本、音頻和圖像的任意組合輸出?!馟PT-4o對音頻輸入最短為232毫秒,平均320毫秒,實現(xiàn)近乎自然的語音交互,以往產(chǎn)品2秒以上。●GPT-4o能夠與人類共情,即能夠識別人類感情,并作出有感情的反應?!馟PT-4o可以應用于各種場所,如智能客服、在線教育、醫(yī)療咨詢、智慧康養(yǎng)等。5.1.5大語言模型的應用12●大模型更能捕捉到數(shù)據(jù)的細節(jié)及其復雜的特征,因此大模型能夠解決更加復雜和具有挑戰(zhàn)性的任務,應用更加廣泛。●自然語言處理:用于機器翻譯、文本生成、對話系統(tǒng)等。BERT、GPT等大模型在文本的語義理解、情感分析、機器翻譯等任務?!裾Z音識別:用于語音識別、語音合成、語音轉換等任務?!駡D像處理:用于圖像分類、目標檢測、圖像生成等任務。ResNet、InceptionV3等大模型在圖像分類、對象檢測等。●利用AIGC可以生成具有一定創(chuàng)意和質(zhì)量的作品,涵蓋文字、圖像、音頻、視頻等多個領域?!裢扑]系統(tǒng):對用戶行為數(shù)據(jù)分析和學習,更好地理解用戶的喜好和行為模式,對用戶的興趣和需求進行更準確的推薦?!裉崾驹~工程:對于大模型的生成結果和質(zhì)量具有重要影響,選擇合適的提示詞被稱為提示工程。5.1.6國內(nèi)外大模型平臺13●ChatGPT:(/)是由OpenAI開發(fā)的基于GPT的聊天機器人程序,于2022年11月30日發(fā)布廣泛?!袢A為盤古:(/)是面向企業(yè)市場的分布式存儲系統(tǒng),用于企業(yè)數(shù)據(jù)中心、云計算平臺、分布式存儲集群、數(shù)據(jù)倉庫和分析等應用場景,助力企業(yè)應對日益增長的存儲挑戰(zhàn)?!癜⒗镌仆x千問:(/qianwen/)是面向企業(yè)級應用的深度學習平臺,用于語音識別、語音合成、語音轉換等任務?!耱v訊混元:(/)是一套面向企業(yè)級應用的混合云解決方案,幫助企業(yè)實現(xiàn)靈活、高效的云計算部署。第8章機器學習與深度學習5.1動物視覺機理與深度學習大模型5.2卷積神經(jīng)網(wǎng)絡及其應用5.3深度學習的應用5.4計算機視覺5.5機器翻譯5.6語音識別14155.2.1卷積神經(jīng)網(wǎng)絡的結構15卷積神經(jīng)網(wǎng)絡(ConvolutionalNeuralNetworks,CNN)是一種多層神經(jīng)網(wǎng)絡,每層由多個二維平面組成,而每個平面由多個獨立神經(jīng)元組成。16165.2.1卷積神經(jīng)網(wǎng)絡的結構特征提取層(卷積層)——C層(Convolutionlayer)大部分的特征提取都依賴于卷積運算利用卷積算子對圖像進行濾波,可以得到顯著的邊緣特征。17175.2.1卷積神經(jīng)網(wǎng)絡的結構特征映射層(下采樣層)——S層(Subsamplinglayer)CNN中的每一個特征提取層(C)都緊跟著一個用來求局部平均與二次提取的計算層(S)。這種特有的兩次特征提取結構能夠容許識別過程中輸入樣本有較嚴重的畸變。5.2.2卷積的物理、生物與生態(tài)學等意義18卷積(Convolutional)源自拉丁文“convolvere”,其含義就是“卷在一起(rolltogether)”,是數(shù)學上的一個重要的運算,由于其具有豐富的物理、生物、生態(tài)等意義。1.卷積的物理意義●在一根鐵絲某處不停地彎曲,彎曲處溫度是發(fā)熱函數(shù)和散熱函數(shù)的卷積?!褚粋€特定環(huán)境下的回聲是源聲函數(shù)和反射效應函數(shù)的卷積?!袼型妒a(chǎn)生水波,當前的水波是所有石塊激起水波到目前為止的投石作為沖擊函數(shù)和水面反射效應函數(shù)的卷積?!褚粋€線性系統(tǒng),這個系統(tǒng)的輸出函數(shù)是輸入函數(shù)和脈沖響應函數(shù)的卷積。5.2.2卷積的物理、生物與生態(tài)學等意義192.卷積的生物學意義●記憶也可視為一種卷積的結果。人腦中記憶函數(shù)是認知函數(shù)和遺忘函數(shù)的卷積。

●靜脈滴注是注射的離散化,一滴藥液在人體血液里以動力學形態(tài)衰減。要與病毒或細菌打持久戰(zhàn),多次滴注或連續(xù)給藥。注射的累積效應是給藥函數(shù)衰減函數(shù)的卷積。●一個人胃里現(xiàn)有的食物量是吃進食物的函數(shù)核消化吸收的函數(shù)的卷積。3.卷積的生態(tài)學意義

●一個地區(qū)的現(xiàn)有的樹木是栽樹函數(shù)和伐木函數(shù)的卷積?!褚粋€地區(qū)的生態(tài)函數(shù)是污染函數(shù)核治污函數(shù)的卷積

。5.2.3卷積神經(jīng)網(wǎng)絡的卷積運算205.2.3卷積神經(jīng)網(wǎng)絡的卷積運算2122225.2.4卷積神經(jīng)網(wǎng)絡的關鍵技術卷積神經(jīng)網(wǎng)絡的4個關鍵技術:局部連接權值共享多卷積核池化卷積神經(jīng)網(wǎng)絡的局部連接23(a)全連接神經(jīng)網(wǎng)絡

(b)局部連接神經(jīng)網(wǎng)絡局部連接:每個神經(jīng)元無需對全局圖像進行感知,而只需對局部進行感知,然后在更高層將局部的信息綜合起來得到全局信息。卷積神經(jīng)網(wǎng)絡的權值共享24設為相同,即權值共享,也即每個神經(jīng)元用同一個卷積核去卷積圖像。2525卷積神經(jīng)網(wǎng)絡的多卷積核下圖中不同顏色表示不同的卷積核,每個卷積核都會將圖像生成為另一幅特征映射圖(即:一個卷積核提取一種特征)。為了使特征提取更充分,我們可以添加多個卷積核(濾波器)以提取不同的特征。2626卷積神經(jīng)網(wǎng)絡的池化計算圖像一個區(qū)域上的某個特定特征的平均值(或最大值),這種聚合操作就叫做池化(pooling),有時采用平均池化或者最大池化方法。這些概要統(tǒng)計特征不僅具有低得多的維度

(相比使用所有提取得到的特征),同時還會改善結果(不容易過擬合)。27275.2.5卷積神經(jīng)網(wǎng)絡的應用一種典型的用來識別數(shù)字的卷積網(wǎng)絡是LeNet-5。美國大多數(shù)銀行當年用它識別支票上面的手寫數(shù)字,達到了商用地步,說明該算法具有很高的準確性。28手寫數(shù)字識別系統(tǒng)的卷積網(wǎng)絡:YannLeCun于1998年提出的LeNet-5。美國大多數(shù)銀行當年用它識別支票上面的手寫數(shù)字,達到了商用地步5.2.5卷積神經(jīng)網(wǎng)絡的應用295.3深度學習的應用●DeepMind與威尼斯卡福斯卡里大學人文系、牛津大學古典系、雅典經(jīng)濟與商業(yè)大學信息學系合作,開發(fā)的深度神經(jīng)網(wǎng)絡Ithaca,能從受損文物中破譯古希臘文字?!駵蚀_率達62%,原始位置準確率達71%,古文字年代鎖定在其真實日期的30年內(nèi)。AI讀懂兩千年前文字305.3深度學習的應用●微軟亞洲研究院與首都師范大學甲骨文研究中心莫伯峰團隊合作開發(fā)的甲骨文校重助手Diviner,將自監(jiān)督AI模型引入到甲骨文“校重”工作中?!窦坠切V匦枰獌蓛杀葘?8萬張數(shù)據(jù)庫中的所有拓片。AI甲骨文“校重”整理助手Diviner315.3深度學習的應用●公元79年維蘇威火山爆發(fā)將珍藏古老的紙莎草卷軸的圖書館埋葬?!裰钡?8世紀才被挖出,卻早已成為炭焦的木塊?!?024.1,21歲的LukeFarritor等三人用AI從圖像裂縫中破譯近5%的內(nèi)容。AI破譯2000年前「上古卷軸」5.4計算機視覺計算機視覺是一類類似于人眼的新型檢測方法,將采集的圖片或視頻進行處理以獲得相應場景的三維信息,具有非常廣闊的應用。例如:車牌識別、指紋識別、人臉識別、視頻監(jiān)控、自動駕駛、人體動作的視覺識別系統(tǒng)、工業(yè)視覺檢測識別系統(tǒng)、智能移動機器人、增強現(xiàn)實系統(tǒng)、生物醫(yī)學影像檢測和識別系統(tǒng)等。325.4.1計算機視覺概述計算機視覺的比較嚴謹?shù)亩x:(1)對圖像中的客觀對象構建明確而有意義的描述(Ballard&Brown,1982)。(2)從一個或多個數(shù)字圖像中計算三維世界的特性(Trucco&Verri,1998)(3)基于感知圖像做出對客觀對象和場景有用的決策(Sockman&Shapiro,2001)335.4.1計算機視覺概述計算機視覺的內(nèi)容:(1)目標檢測、跟蹤和定位。(2)前背景分割和物體分割(3)目標分類和識別(4)場景分類與識別(5)場景文字檢測與識別。(6)事件檢測與識別(7)距離估計(8)圖像自動生成標題345.4.2數(shù)字圖像與計算機視覺的進展計算機接受到的數(shù)字圖像是由稱為像素(pixel)的點組成。主要有下列幾種數(shù)字圖像:(1)灰度圖像(2)彩色圖像(3)RGBD圖像(4)紅外、紫外、X-光等圖像35計算機視覺一直是人工智能研究的重點,直到2012年,深度學習掀起了計算機視覺領域應用熱潮,目標檢測正確率大大提升。CNN成為計算機視覺和視覺跟蹤的主流深度模型。5.4.3基于深度學習的計算機視覺直到2012年,深度學習掀起了計算機視覺領域應用熱潮,目標檢測正確率大大提升。目標檢測是計算機視覺中一個基礎問題,其定義某些感興趣的特定類別組成前景,其他類別為背景。設計一個目標檢測器,它可以在輸入圖像中找到所有前景物體的位置以及他們所屬的具體類別。區(qū)域卷積神經(jīng)網(wǎng)絡(Region-CNN,R-CNN)是第一個成功將深度學習應用到目標檢測上的算法。卷積神經(jīng)網(wǎng)絡已成為計算機視覺和視覺跟蹤的主流深度模型。365.4.3基于深度學習的計算機視覺計算機視覺的應用:(1)安防監(jiān)控。(2)自動駕駛。(3)工業(yè)制造。(4)農(nóng)業(yè)領域。(5)醫(yī)療診斷。(6)其他。零售與物流(商品識別和庫存管理)、游戲和娛樂(運動追蹤、手勢識別和面部表情識別等)。37基于計算機視覺的生物特征識別生物特征識別一直是人們研究與應用的重要內(nèi)容。生物特征識別(BIOMETRICS)技術,是指通過計算機利用人體所固有的生理特征(指紋、虹膜、面相、DNA等)或行為特征(步態(tài)、擊鍵習慣等)來進行個人身份鑒定的技術。目前,基于計算機視覺的生物特征識別技術成為人工智能最重要的研究與應用領域。如:人臉識別、指紋識別、虹膜識別、掌紋識別、指靜脈識別等。385.4.4人臉識別人臉識別的本質(zhì)是對兩張照片中人臉相似度的計算。人臉識別系統(tǒng)主要包括6個部分:(1)人臉檢測:給出人臉的位置和大小。(2)特征點定位:在矩形框內(nèi)找到眼睛中心、鼻尖和嘴角等關鍵特征點,以便進行后續(xù)的預處理操作。(3)預處理:完成人臉子圖的歸一化。(4)特征提?。哼@是人臉識別的核心。當前,主要是采用深度學習方法自動提取特征。(5)特征比對:對提取的特征進行相似度計算。(6)判斷:相似程度超過設定閾值判斷為相同人。395.4.5虹膜識別人眼睛的外觀圖由鞏膜、虹膜、瞳孔三部分構成。虹膜是人眼瞳孔和鞏膜之間的環(huán)狀區(qū)域,占據(jù)65%。人體基因表達決定了虹膜的形態(tài)、生理、顏色和總的外觀。沒有任何兩個虹膜是一樣的。虹膜的高度獨特性、穩(wěn)定性及不可更改的特點,是虹膜可用作身份鑒別的物質(zhì)基礎。405.4.5虹膜識別虹膜識別主要步驟:(1)虹膜圖像獲取。使用特定的攝像器材對人的整個眼部進行拍攝。(2)虹膜定位。確定內(nèi)圓、外圓和二次曲線在圖像中的位置。(3)虹膜圖像歸一化。(4)圖像增強。(5)特征提取。(6)特征匹配。與數(shù)據(jù)庫中的虹膜圖像特征編碼逐一匹配,判斷是否為相同虹膜。41425.5機器翻譯1949年5月31日,《紐約時報》興奮地發(fā)布了一條新聞:加州大學的國家標準實驗室研制成功一種新型的電子大腦不僅可以進行復雜的數(shù)學運算,而且可以翻譯外文??茖W家們說,他們將實現(xiàn)覆蓋《韋伯大學詞典》6萬個單詞的3種語言的翻譯能力。機器翻譯在當時遇到各種技術問題,最后只能無果而終。一個真正的機器翻譯系統(tǒng)直到1954年1月才在美國喬治城大學開發(fā)成功。它雖然只包含了6條語法規(guī)則和250個單詞,但能夠把幾十個俄文句子成功地翻譯成了英文,這在歷史上還是第一次。5.5.1自然語言理解的概念微觀角度:從自然語言到機器內(nèi)部的一個映射。宏觀角度:使機器能夠執(zhí)行人類所期望的某種語言功能。

43(1)回答問題:計算機正確地回答用自然語言輸入的有關問題。(2)文摘生成:機器能產(chǎn)生輸入文本的摘要。

(3)釋義:機器能用不同的詞語和句型來復述輸入的自然語言信息。(4)翻譯:機器能把一種語言翻譯成另外一種語言。

比爾·蓋茨曾說過,“語言理解是人工智能皇冠上的明珠”。計算機能夠理解、處理自然語言,是計算機技術的一項重大突破,具有重大的意義。5.5.2機器翻譯方法發(fā)展歷程:直接型間接型中間語言型轉換型4445

●1.直譯式機器翻譯系統(tǒng)

通過快速的分析和雙語詞典,將原文譯出?!?/p>

2.基于規(guī)則的機器翻譯系統(tǒng)

先分析原文內(nèi)容,產(chǎn)生原文的句法結構,再轉換成譯文的句法結構,最后再生成譯文。

5.5.2機器翻譯方法46

●3.中間語言式機器翻譯系統(tǒng)

先生成一種中介的表達方式,而非特定語言的結構;再由中介的表達式,轉換成譯文。基于規(guī)則的翻譯中介語式的翻譯5.5.2機器翻譯方法47●

4.基于知識庫的機器翻譯系統(tǒng)

翻譯經(jīng)常需要除了詞匯之外的各種知識,使用知識獲取工具(knowledgeacquisition),以充實知識庫的內(nèi)容。

●5.基于統(tǒng)計式的機器翻譯系統(tǒng)

1994年,IBM公司A.Berger等用統(tǒng)計方法和各種不同的對齊技術,給出了統(tǒng)計式機器翻譯系統(tǒng)Candide。統(tǒng)計機器翻譯是目前非限定領域機器翻譯中性能較佳的一種方法。統(tǒng)計機器翻譯基本思想是通過對大量的平行語料進行統(tǒng)計分析,構建統(tǒng)計翻譯模型,進而使用此模型進行翻譯。5.5.2機器翻譯方法概述48●

6.基于范例的機器翻譯系統(tǒng)

將過去的翻譯結果,當成范例,產(chǎn)生一個范例庫。

5.5.2機器翻譯方法概述●7.翻譯記憶:用戶利用已有的原文和譯文,建立起一個或多個翻譯記憶庫,在翻譯過程中,系統(tǒng)將自動搜索翻譯記憶庫中相同或相似的翻譯資源(如句子、段落等),給出參考譯文,使用戶避免重復勞動,只專注于新內(nèi)容的翻譯。翻譯記憶庫同時在后臺不斷學習和自動儲存新的譯文,變得越來越“聰明”?!?/p>

德國塔多思(TRADOS)公司的翻譯記憶軟件基于UNICODE(統(tǒng)一字符編碼),支持55種語言。

49●

8.神經(jīng)機器翻譯神經(jīng)機器翻譯是模擬人腦的翻譯過程,目前已遠超過統(tǒng)計機器翻譯,成為機器翻譯的主流技術。長短期記憶神經(jīng)網(wǎng)絡(LSTM)是一種對序列數(shù)據(jù)建模的神經(jīng)網(wǎng)絡,適合處理和預測序列數(shù)據(jù)。而且,LSTM使用“累加”的形式計算狀態(tài),這種累加形式導致導數(shù)也是累加形式,避免了梯度消失,因此在神經(jīng)機器翻譯中得到了廣泛應用。目前,神經(jīng)機器翻譯領域主要研究如何提升訓練效率、編解碼能力以及雙語對照的大規(guī)模數(shù)據(jù)集。5.5.2機器翻譯方法概述5.6語言識別50●語音識別用語音作為輸入,口語對話與語音信號中語言提取的不同:(1)上下文猜測(2)肢體語言傳達信息

●機器翻譯用印刷文本作為輸入,能清楚地區(qū)分單個單詞和單詞串

。5.6.1語言識別的概念5.6.2語音識別的深度學習方法51目前,基于人工神經(jīng)網(wǎng)絡的語音識別方法是語音識別的主流技術和研究熱點。特別是深度學習方法近年來在智能語音領域得到了廣泛應用,取得了突出效果。目前用于語音識別研究的比較典型的深度神經(jīng)網(wǎng)絡包括:受限玻爾茲曼機、深度置信神經(jīng)網(wǎng)絡、長短時記憶遞歸神經(jīng)網(wǎng)絡、深度卷積神經(jīng)網(wǎng)絡等。THEEND52IntroductionofArtificialIntelligence第6章連接主義:生成式人工智能與應用教材:

王萬良《人工智能通識導論》高等教育出版社,202554第6章連接主義:生成式人工智能與應用人工神經(jīng)網(wǎng)絡模型可大致分為判別模型和生成模型。以前人工神經(jīng)網(wǎng)絡取得的成果主要集中在判別模型。近年來,隨著生成對抗網(wǎng)絡結構的提出,生成式人工智能取得突飛猛進的進展,成為當前最富有成效的研究領域,特別是眾多大模型的問世,把生成式人工智能推向了更高的高潮。本章簡要介紹生成式人工智能結構、學習的基本原理及其改進,然后分別介紹生成式人工智能在圖像、語言、視頻等生成中的應用。6.1生成對抗網(wǎng)絡的原理6.2生成式人工智能在圖像生成中的應用6.3生成式人工智能在語言生成中的應用6.4生成式人工智能在視頻生成中的應用55第6章連接主義:生成式人工智能與應用566.1.1生成對抗網(wǎng)絡的提出人工神經(jīng)網(wǎng)絡模型可大致分為判別式模型和生成式模型。以前人工神經(jīng)網(wǎng)絡取得的成果主要集中在判別式模型。生成式模型是一個極具挑戰(zhàn)的機器學習問題:首先,對真實世界進行建模需要大量先驗知識,建模的好壞直接影響生成式模型的性能;其次,真實世界的數(shù)據(jù)往往非常復雜,擬合模型所需計算量往往非常龐大,甚至難以承受。Goodfellow于2014年提出生成對抗網(wǎng)絡(GAN,generativeadversarialnetwork),使用對抗訓練機制對兩個神經(jīng)網(wǎng)絡進行訓練。57假幣制作與識別:6.1.2生成對抗網(wǎng)絡的結構586.1.2生成對抗網(wǎng)絡的結構596.1.2生成對抗網(wǎng)絡的結構●生成對抗網(wǎng)絡GAN的核心思想源于博弈論的納什均衡(Nashequilibrium)?!馟AN的框架中包含一對相互對抗的模型:生成器:生成器的目的是使生成的數(shù)據(jù)的分布盡可能逼近真實數(shù)據(jù)的潛在分布。判別器:判別器的目的則是正確區(qū)分真實數(shù)據(jù)和生成數(shù)據(jù),從而最大化判別準確率?!裆蓪咕W(wǎng)絡結構中的生成模型和判別模型,可以是具有生成和判別功能的各種神經(jīng)網(wǎng)絡,例如BP神經(jīng)網(wǎng)絡,通常采用深度卷積神經(jīng)網(wǎng)絡等。60GAN的兩個相互交替訓練階段:●固定生成網(wǎng)絡,訓練判別網(wǎng)絡●固定判別網(wǎng)絡,訓練生成網(wǎng)絡兩個網(wǎng)絡相互對抗的過程,就是各自網(wǎng)絡參數(shù)不斷調(diào)整的過程,即學習過程。6.1.3生成對抗網(wǎng)絡的訓練6161GAN在訓練中容易出現(xiàn)一些問題,訓練過程具有強烈的不穩(wěn)定性,實驗結果隨機,具體表現(xiàn):●訓練難以收斂,經(jīng)常出現(xiàn)震蕩;●訓練收斂,但出現(xiàn)模式崩潰。●訓練收斂,但還會生成一些沒有意義或者現(xiàn)實中不可能出現(xiàn)的圖片。生成對抗網(wǎng)絡因為其內(nèi)部對抗訓練的機制,可以解決一些傳統(tǒng)的機器學習面臨的數(shù)據(jù)不足的問題,因此可以應用在半監(jiān)督學習、無監(jiān)督學習、多視角、多任務學習的任務中。6.1.4生成對抗網(wǎng)絡的改進6.1生成對抗網(wǎng)絡的原理6.2生成式人工智能在圖像生成中的應用6.3生成式人工智能在語言生成中的應用6.4生成式人工智能在視頻生成中的應用62第6章連接主義:生成式人工智能與應用636.2生成式人工智能在圖像生成中的應用圖像修復

64圖像風格遷移

6.2生成式人工智能在圖像生成中的應用65圖像風格遷移

6.2生成式人工智能在圖像生成中的應用6666圖像風格遷移

6.2生成式人工智能在圖像生成中的應用676719世紀英國畫家特納的《沉船》另一種風格的《沉船》德國小鎮(zhèn)圖像風格遷移

6.2生成式人工智能在圖像生成中的應用6868地圖生成航拍圖像輪廓圖像生成照片白天圖像生成對應夜景多模態(tài)圖像翻譯圖像翻譯

6.2生成式人工智能在圖像生成中的應用6969這朵花有著長長的粉色花瓣和朝上的橘黃色雄蕊。這只小鳥有著小小的鳥喙、脛骨和雙足,藍色的冠部和覆羽,以及黑色的臉頰。將文本翻譯成圖像

6.2生成式人工智能在圖像生成中的應用7070通過GAN的生成器和判別器分別進行文本到圖像、圖像到文本的轉換,二者經(jīng)過對抗訓練后能夠生成以假亂真的圖像。將GPT生成的提示語言貼到Midjourney進行繪圖。根據(jù)提示詞生成圖像

6.2生成式人工智能在圖像生成中的應用用Midjourney生成阿房宮7171根據(jù)提示詞生成圖像

6.2生成式人工智能在圖像生成中的應用用Midjourney生成四大名著里經(jīng)典人物6.1生成對抗網(wǎng)絡的原理6.2生成式人工智能在圖像生成中的應用6.3生成式人工智能在語言生成中的應用6.4生成式人工智能在視頻生成中的應用72第6章連接主義:生成式人工智能與應用7373人工智能新聞系統(tǒng)

●2014年3月17日清晨,《洛杉磯時報》地震新聞報道?!?011年,思科公司的工程師羅比.艾倫創(chuàng)辦AutomatedInsights,專門開發(fā)寫作程序,用機器自動撰寫新聞稿件?!?013年,機器自動撰寫的新聞稿件已達3億篇,超過所有主要新聞機構的稿件產(chǎn)出量。2014年,超過10億篇。●2014年,AutomatedInsights公司為美國和加拿大的上市公司撰寫營收業(yè)績報告。目前,自動撰寫的營收業(yè)績報告近3700篇,是同時段手工數(shù)量的12倍?!?016年,美聯(lián)社將自動新聞擴展到體育領域,報道美國職業(yè)棒球聯(lián)盟的賽事。6.3生成式人工智能在語言生成中的應用7474人工智能寫作系統(tǒng)

●中國教育報社《ChatGPT與名師同寫作文》。●作文題目:閱讀下面的材料,根據(jù)要求寫作。沖浪是沖浪者站在沖浪板上駕馭海浪的水上運動,已被列為2024年巴黎奧運會的正式比賽項目。在驚濤駭浪之上翱翔,需要具備以下條件:海浪夠高夠大,且在沖浪者可駕馭的范圍內(nèi);沖浪板尺寸合適,能被沖浪者靈活操控;沖浪者有足夠的勇氣,也有良好的身體素質(zhì)。當今世界正經(jīng)歷百年未有之大變局,我國正處于實現(xiàn)中華民族偉大復興的關鍵時期。在時代的浪潮中,我們應該如何做好一名沖浪者?●請結合材料寫一篇文章,體現(xiàn)你的感悟與思考。要求:選準角度,確定立意,明確文體,自擬標題;不要套作,不得抄襲;不得泄露個人信息;不少于800字。6.3生成式人工智能在語言生成中的應用7575人工智能詩歌創(chuàng)作系統(tǒng)

2017年清華孫茂松團隊的計算機古詩作詩系統(tǒng)檢驗現(xiàn)有神經(jīng)網(wǎng)絡深度學習主流模型的能力九歌6.3生成式人工智能在語言生成中的應用6.1生成對抗網(wǎng)絡的原理6.2生成式人工智能在圖像生成中的應用6.3生成式人工智能在語言生成中的應用6.4生成式人工智能在視頻生成中的應用76第6章連接主義:生成式人工智能與應用7777●換臉:以GAN為代表的AI換臉術●南加州大學的Pinscreen團隊的實時3D變臉技術。●美國國防部AI偵測工具,以AI攻AI,反換臉精度99%。實時3D變臉術

6.4生成式人工智能在視頻生成中的應用7878●2018年11月7-9日,在烏鎮(zhèn)第五屆世界互聯(lián)網(wǎng)大會上,新華社對外宣布:中國首個“人工智能主持人”正式上崗。人工智能主持人

6.4生成式人工智能在視頻生成中的應用79792019.2.19新華社發(fā)布站立式合成主播邱浩——新小浩屈萌——新小萌6.4生成式人工智能在視頻生成中的應用8080●2024.2.16OpenAI發(fā)布視頻生成模型Sora,通過用戶提出要求,Sora可以創(chuàng)建長達60秒的文生視頻。視頻生成大模型

6.4生成式人工智能在視頻生成中的應用THEEND81IntroductionofArtificialIntelligence第7章行為主義:智能機器人教材:

王萬良《人工智能通識導論》高等教育出版社,202583第7章行為主義:智能機器人以人工智能技術為基礎的智能機器人,擁有各種各樣的傳感器、靈活的構架以及應用程序,不論是從形體上還是從智力上,智能機器人都具備了某種程度的“社會人”的概念。本章從整體上介紹智能機器人的基本概念、智能機器人關鍵技術、智能機器人控制策略、智能機器人在各領域的應用情況等方面的內(nèi)容。第7章行為主義:智能機器人7.1機器人的產(chǎn)生與發(fā)展7.2機器人中的人工智能技術7.3智能機器人的應用7.4智能機器人技術展望7.5智能機器人倫理問題847.1機器人的產(chǎn)生與發(fā)展世界上第一臺真正意義上機器人是誰發(fā)明的呢?1954年,美國人喬治·德沃爾制造出世界上第一臺可編程的機器人,并申請了專利。1962年,美國AMF公司推出VERSATRAN和UNIMATION公司推出UNIMATE是采用示教再現(xiàn)。857.1機器人的產(chǎn)生與發(fā)展機器人(Robot)泛指一切模擬人類或者其他生物行為的機械,是集機械、材料、電子、控制、計算機、傳感器、人工智能等多學科及前沿技術于一體的高端裝備。(1)程序控制機器人(第一代)(2)自適應機器人(第二代)(3)智能機器人(第三代)86智能機器人是在傳統(tǒng)的機械機器人的基礎上,應用人工智能技術,使得機器人具備一些與人或生物相似的智能能力,如感知、規(guī)劃、協(xié)同能力等。7.1機器人的產(chǎn)生與發(fā)展智能機器人具備各種傳感器,包括視覺傳感器、聽覺傳感器、觸覺傳感器等。智能機器人能理解人類語言,還可以用人類語言與人類進行對話。機器人不是必須具備人的外在形態(tài)。例如,自動駕駛機器人作為輪式機器人,已經(jīng)開始走向實用化。如特斯拉、谷歌等廠商,已經(jīng)實現(xiàn)小規(guī)模量產(chǎn)。人工智能、物聯(lián)網(wǎng)、大數(shù)據(jù)、云計算等信息技術促進智能機器人迅速發(fā)展,應用領域也不斷地擴大。87第7章行為主義:智能機器人7.1機器人的產(chǎn)生與發(fā)展7.2機器人中的人工智能技術7.3智能機器人的應用7.4智能機器人技術展望7.5智能機器人倫理問題887.2機器人中的人工智能技術897.2.1機器人智能感知1.機器人“視覺”2.機器人“觸覺”3.機器人“聽覺”4.多傳感器信息融合(1)“動態(tài)”的多模態(tài)數(shù)據(jù)(2)“污染”的多模態(tài)數(shù)據(jù)(3)“失配”的多模態(tài)數(shù)據(jù)907.2.2機器人智能導航智能機器人的導航是指機器人根據(jù)自身傳感系統(tǒng)對內(nèi)部姿態(tài)和外部環(huán)境進行感知,通過對環(huán)境信息的識別、存儲、搜索等找出最優(yōu)路徑或近似最優(yōu)的路徑,實現(xiàn)與障礙物無碰撞的安全運動。(1)慣性導航。用加速度計和陀螺儀等慣性傳感器測量機器人的方位角和加速率,從而推知機器人的當前位置和下一步目的地。(2)視覺導航。機器人利用自身裝配的攝像機拍攝周圍環(huán)境的局部圖像,然后根據(jù)圖像處理技術將外部環(huán)境的相關信息存儲起來,為機器人進行自身定位以及下一步動作的規(guī)劃。(3)衛(wèi)星導航。機器人通過安裝衛(wèi)星信號接收裝置在室內(nèi)或者在室外實現(xiàn)自身定位。917.2.3機器人路徑智能規(guī)劃路徑規(guī)劃技術主要是指用最優(yōu)路徑規(guī)劃算法,找到一條從起點到終點可以有效避開障礙物的最優(yōu)路徑。機器人的路徑規(guī)劃分為:基于地圖的全局路徑規(guī)劃、基于傳感器的局部路徑規(guī)劃和基于地圖、傳感器的混合路徑規(guī)劃。智能路徑規(guī)劃的核心是實現(xiàn)自動避碰。機器人自動避碰系統(tǒng)由數(shù)據(jù)庫、知識庫、機器學習和推理機等構成。927.2.3機器人路徑智能規(guī)劃自動避碰的基本過程包括:(1)確定:靜態(tài)參數(shù):機器人本體長、寬以及負載等參數(shù);動態(tài)參數(shù):機器人速度及方向,在全速情況下至停止所需時間及前進距離,在全速情況下至全速倒車所需時間及前進距離,機器人第一次避碰時機等;相對位置參數(shù):機器人本體與障礙之間的相對速度、相對速度方向、相對方位等。(2)根據(jù)障礙物參數(shù)分析機器人本體的運動態(tài)勢,判斷哪些障礙物與機器人本體存在碰撞危險,并對危險目標進行識別。(3)根據(jù)機器人與障礙物會遇局面分析結果調(diào)用相應的知識模塊求解機器人避碰規(guī)劃方式及目標避碰參數(shù),并對避碰規(guī)劃進行驗證。937.2.4機器人運動智能控制隨著傳感技術以及人工智能技術的發(fā)展,智能運動控制和智能操作已成為機器人控制的主流。(1)PID控制算法控制結構簡單,參數(shù)容易調(diào)整,易于實現(xiàn),而且具有較強的魯棒性,因此,被廣泛應用于機器人控制。(2)神經(jīng)網(wǎng)絡控制是基于人工神經(jīng)網(wǎng)絡的控制方法。它具有較強的自學習能力和非線性映射能力,它不依賴于比較精確的數(shù)學模型,能夠解決數(shù)學模型難以描述或無法處理的控制系統(tǒng),非常適用于智能機器人這種具有復雜、不確定、多變量、非線性系統(tǒng)的控制。(3)模糊控制的關鍵是模糊控制器,它主要由模糊化、模糊推理、模糊規(guī)則及逆模糊化。947.2.5機器人智能交互通過人機智能交互使得人們可以用語言、表情、動作或者一些可穿戴設備等與機器人進行自由的信息交流與理解。(1)利用虛擬現(xiàn)實技術創(chuàng)建智能機器人的工作環(huán)境。(2)基于可穿戴設備的人機交互也正在逐漸改變著人類的生產(chǎn)生活,實現(xiàn)人機和諧統(tǒng)一,將會是未來的發(fā)展趨勢。(3)機器人通過對動態(tài)情境充分理解,完成動態(tài)態(tài)勢感知,理解并預測協(xié)作任務,實現(xiàn)人-機器人互適應自主協(xié)作功能。(4)機器人對人的行為姿態(tài)進行理解和預測,繼而理解人的意圖,為人機交互與協(xié)作提供充分的信息。95第7章行為主義:智能機器人7.1機器人的產(chǎn)生與發(fā)展7.2機器人中的人工智能技術7.3智能機器人的應用7.4智能機器人技術展望7.5智能機器人倫理問題967.3智能機器人的應用智能機器人應用:掃地機器人,軍用機器人,無人機,工業(yè)機器人,農(nóng)業(yè)機器人等。智能機器人的發(fā)展將加入更多的先進技術,例如大數(shù)據(jù)、云計算、多傳感器融合等技術。智能機器人還將實現(xiàn)多種算法的融合,例如模糊算法、神經(jīng)網(wǎng)絡算法等。大數(shù)據(jù)使智能機器人具有更豐富的知識儲備;云計算實現(xiàn)機器人的思維聯(lián)網(wǎng);物聯(lián)網(wǎng)實現(xiàn)智能機器人之間的交流。977.3.1工業(yè)機器人國際標準化組織(ISO)定義:工業(yè)機器人是一種多用途的、可重復編程的自動控制操作機,具有三個或更多可編程的軸,用于工業(yè)自動化領域。(1)裝配機器人(2)焊接機器人987.3.1工業(yè)機器人(3)搬運機器人997.3.2農(nóng)業(yè)機器人(1)采摘機器人1007.3.2農(nóng)業(yè)機器人(2)除草和施肥機器人1017.3.2農(nóng)業(yè)機器人(3)畜牧機器人1027.3.3服務機器人(1)護士助手機器人(2)迎賓咨詢服務機器人(3)家用服務機器人103超高像素廣角攝像頭:室內(nèi)監(jiān)控和人臉識別。6陣列麥克風:降噪收音,聲源定位??蓜雨P節(jié):多處可動,肢體語言,更加人性化。選裝配件:應用于不同場景選裝配件,如標簽打印機等。超聲波傳感器:確保行走安全,高效停障防碰撞。激光雷達:高精度,高效的導航定位和避障繞障技術。高平衡底盤:行走更加平穩(wěn)。高清觸摸屏:顯示交互信息,增強人機互動。超萌眼睛:閃動雙眼,擬人化設計,親和力。7.3.4醫(yī)用機器人

醫(yī)用機器人是用于醫(yī)院、診所的醫(yī)療或輔助醫(yī)療的智能機器人。醫(yī)用機器人種類很多,按照其用途不同,有臨床醫(yī)療用機器人、護理機器人、醫(yī)用教學機器人和為殘疾人服務機器人等。1047.3.5軍用機器人105第7章行為主義:智能機器人7.1機器人的產(chǎn)生與發(fā)展7.2機器人中的人工智能技術7.3智能機器人的應用7.4智能機器人技術展望7.5智能機器人倫理問題1067.4智能機器人技術展望1.基于物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)、云計算的智能機器人技術云計算和大數(shù)據(jù)為智能機器人的發(fā)展提供了基礎和動力,能適應復雜環(huán)境。2.具有高級智能的智能機器人技術機器人機器人采用視覺、聲覺、力覺、觸覺等多傳感器的融合技術與所處環(huán)境進行交互。3.智能機器人的廣泛應用機器人應用無限制,既可完成人能完成的工作,還可完成人不能完成的工作。107第7章行為主義:智能機器人7.1機器人的產(chǎn)生與發(fā)展7.2機器人中的人工智能技術7.3智能機器人的應用7.4智能機器人技術展望7.5智能機器人倫理問題1087.5智能機器人倫理問題1942年,美國科幻作家艾薩克·阿西莫夫(IsaacAsimov)提出“機器人三定律”:第一定律:機器人不得傷害人類,且確保人類不受傷害;第二定律:在不違背第一法則的前提下,機器人必須服從人類的命令;第三定律:在不違背第一及第二法則的前提下,機器人必須保護自己。1097.5智能機器人倫理問題隨著機器人越來越復雜,專家及學者越來越重視機器人的倫理、道德及法律問題。2002年,“國際機器人倫理學研討會”,首次使用了“機器人倫理學”(robotethics)這一術語。機器人倫理學是人類設計、建造、使用和對待機器人的道德。機器人倫理學以人類為中心,關注人類如何在設計和使用操作階段與這些機器進行聯(lián)系和交互。1107.5智能機器人倫理問題機器人倫理重點關注與貫徹安全性原則、主體性原則以及建設性原則等3條基本原則。1.安全性原則阿爾法狗在圍棋、生命科學等方面的成就,預示著具有自主學習能力的強人工智能、超級人工智能的機器人越來越有可能出現(xiàn),引發(fā)的人工智能安全性問題的討論越來越強烈。有很多學者對機器人技術的安全性深表憂慮。比如,霍金警告我們,人類創(chuàng)造智能機器的努力將威脅人類自身的存在。

機器人倫理需要超前于現(xiàn)有的技術,提前為將來可能出現(xiàn)的問題作好理論準備,防患于未然。1117.5智能機器人倫理問題2.主體性原則人與技術的關系:人是主體,技術是客體;人是目的,技術是手段。隨著人類的體力與腦力勞動越來越多地被機器人取代,人的主體性地位也隨之降低。在機器人倫理中需要強調(diào)人的主體性地位,也就是強調(diào)人的能動性、個體差異性與選擇性。主體性原則要求人類能夠很好地控制機器人,這也是實現(xiàn)安全性原則的前提。機器人倫理研究的根本目標:如何在確保人類主體性地位的前提下,規(guī)范人類與機器人的行為。1127.5智能機器人倫理問題3.建設性原則機器人倫理研究不僅僅是抽象的理論研究,除了宏觀的理論思辨之外,更重要的是進行有針對性的具體情景與案例研究,得出的策略與結論需要有很強的現(xiàn)實性,對機器人的設計、使用應該有建設性的啟發(fā)和指導意義??萍紓惱韺W不是要阻礙科技進步,它只是提醒人們要對科技進行反思,以避免其盲目發(fā)展導致不良社會后果?!駴]有剎車機制汽車不能開行一樣,科技的發(fā)展也必須設置必要的剎車機制??萍紓惱韺W就是為了提供這樣的機制。113THEEND114IntroductionofArtificialIntelligence人工智能通識導論教材:

王萬良《人工智能通識導論》高等教育出版社,2025116第8章人工智能倫理人工智能通識導論教材:

王萬良《人工智能通識導論》高等教育出版社,2025117第8章人工智能倫理近年來,人工智能出現(xiàn)一系列倫理問題,如個人隱私和尊嚴的重大威脅,大規(guī)模監(jiān)控風險激增等,特別是未來人工智能技術對人類造成潛在風險。人工智能倫理已經(jīng)成為世界各國政府、組織機構以及大型科技企業(yè)的人工智能政策的核心內(nèi)容之一。本章簡要介紹人工智能倫理,包括:人工智能倫理的提出與發(fā)展、人工智能倫理的典型案例與成因分析、人工智能倫理的治理原則。最后討論人工智能是否會使許多人失業(yè)這個熱點問題。第8章人工智能倫理1188.1人工智能倫理的提出與發(fā)展8.2人工智能倫理的典型案例與成因分析8.3人工智能倫理的治理原則8.4人工智能倫理的治理措施8.5人工智能會使許多人失業(yè)嗎119在

AI發(fā)達以后,同樣不能忽視倫理的約束,這樣人類才能在更多地享受到技術革新益處的同時,讓冰冷的科技亦呈現(xiàn)溫暖的底色,創(chuàng)造有溫度的未來。人工智能倫理學(theEthicsofArtificialIntelligence)是專門針對人工智能系統(tǒng)的應用倫理學的一個分支。人工智能倫理涉及人類設計、制造、使用和對待人工智能系統(tǒng)的道德,機器倫理中的機器行為,以及超級人工智能的奇點問題。8.1人工智能倫理的提出與發(fā)展120國際電氣和電子工程師協(xié)會于2016年4月啟動了IEEE標準協(xié)會發(fā)布“人工智能設計的倫理準則”白皮書。國際化標準化組織(ISO)于2017年成立人工智能委員會。牛津大學、劍橋大學和OpenAI公司等7家機構于2018年共同發(fā)布《人工智能的惡意使用:預測、預防和緩解》。2021年11月24日,第41屆聯(lián)合國教科文組織大會真實通過《人工智能倫理建議書》。人工智能倫理的首份全球性規(guī)范文書,是全球人工智能發(fā)展的共同綱領。提出發(fā)展和應用人工智能首先要體現(xiàn)出四大價值,規(guī)范人工智能技術的10大原則和11個行動領域。8.1人工智能倫理的提出與發(fā)展121中國政府高度重視人工智能發(fā)展中的倫理問題。2017年7月國務院發(fā)布的《新一代人工智能發(fā)展規(guī)劃》中,提出要制定促進人工智能發(fā)展的法律法規(guī)和倫理規(guī)范;開展人工智能行為科學和倫理等問題研究;制定人工智能產(chǎn)品研發(fā)設計人員的道德規(guī)范和行為守則。2018年9月17日,習近平致信祝賀2018世界人工智能大會指出,處理好人工智能在法律、安全、就業(yè)、道德倫理和政府治理等方面提出的新課題,需要各國深化合作、共同探討。2019年2月,中國國家新一代人工智能治理專業(yè)委員會成立,發(fā)布《新一代人工智能治理原則——發(fā)展負責任的人工智能》。8.1人工智能倫理的提出與發(fā)展第8章人工智能倫理1228.1人工智能倫理的提出與發(fā)展8.2人工智能倫理的典型案例與成因分析8.3人工智能倫理的治理原則8.4人工智能倫理的治理措施8.5人工智能會使許多人失業(yè)嗎123案例1:加州禁止執(zhí)法人員使用面部識別技術。2019年9月12日,美國加利福尼亞州議會禁止州和地方執(zhí)法機構使用面部識別技術。該議案已于2020年1月1日生效。舊金山和奧克蘭也已全面禁止面部識別技術的使用。俄勒岡州和新罕布什爾州等也有類似的禁令。許多執(zhí)法團體認為面部識別技術在追蹤嫌疑人以及尋找失蹤兒童等很多方面都具有重要作用。加州警察局長協(xié)會主席羅恩·勞倫斯表示:“這是未來的破案方式,我們需要擁抱而不是逃避技術?!?.2.1人工智能倫理的典型案例124案例2:“監(jiān)測頭環(huán)”進校園惹爭議。2019年11月,某小學戴“監(jiān)測頭環(huán)”的視頻引起廣泛的關注與爭議。這些頭環(huán)通過傳感器上的三個電極,可檢測佩戴者的腦電波,從而評判學生是否集中注意力并進行打分:上課專注亮紅燈,上課走神亮藍燈。許多人擔憂侵犯學生隱私,以及讓學生產(chǎn)生逆反心理。腦機接口技術是一種新興技術,會不容易被人理解,必須慎之又慎地使用。對“腦機接口”的使用應完全出于個人意愿,相關數(shù)據(jù)也絕對地屬于個人。意識是個人領地,他人無權侵犯。8.2.1人工智能倫理的典型案例125案例3:AI換臉應用引發(fā)隱私爭議。2019年9月,一款AI換臉軟件引發(fā)嚴重的隱私爭議。用戶只需提供一張正面人臉照片上傳到換臉軟件,就可以把選定視頻中的明星面部替換掉,生成以自己為主角的視頻片段。該軟件被指涉嫌非法收集進而可能濫用用戶面部信息。2019年11月底,國家網(wǎng)信辦、文旅部和廣電總局等三部門聯(lián)合發(fā)布了《網(wǎng)絡音視頻信息服務管理規(guī)定》:“利用基于深度學習、虛擬現(xiàn)實等的虛假圖像、音視頻生成技術制作、發(fā)布、傳播謠言的……應當及時采取相應的辟謠措施”。8.2.1人工智能倫理的典型案例126案例4:自動駕駛安全事故問責。2019年3月,50歲的班納駕駛電動車以每小時109公里的速度與一輛牽引車拖車相撞而身亡;2018年12月10日,該品牌電動汽車在美國康涅狄格州95號州際公路上追尾了一輛停放在路邊的警車;事故發(fā)生時這些汽車的自動駕駛系統(tǒng)都處于開啟狀態(tài)。德國最新修訂的《道路交通法》明文規(guī)定自動駕駛事故責任劃分:在行駛途中系統(tǒng)不可以完全取代駕駛人,須要有人類司機隨時接管車輛,同時其最終責任主要落在駕駛人身上。8.2.1人工智能倫理的典型案例127案例5:OpenAI

開發(fā)出假新聞編寫軟件。2019年2月15日,OpenAI開發(fā)的GPT-2軟件,能編寫逼真的假新聞。例如給軟件提供信息:“一節(jié)裝載受控核材料的火車車廂今天在Cincinnati被盜,下落不明。”GPT-2可以寫出由7個段落組成的假新聞,甚至還引述政府官員的話語。雖然GPT-2已經(jīng)被訓練來預測從800萬個網(wǎng)頁中提取的文本中的下一個單詞,但可信度仍相對較低,特別是它生成的文本并不總是一致的,可能包括重復的結構、突然的主題切換和違背常識。例如,GPT-2可以記錄發(fā)生在水下的火災,或者某人是他們父親的父親等。8.2.1人工智能倫理的典型案例128根據(jù)人工智能倫理問題的特征和產(chǎn)生方式的不同,可從技術、數(shù)據(jù)和應用三個層面來分析人工智能倫理的成因。技術層面:包括算法及系統(tǒng)的安全問題、可解釋性問題、算法歧視問題和算法決策問題。算法及系統(tǒng)的安全問題:算法或系統(tǒng)的漏洞被攻擊和惡意利用的情形;可解釋性問題:關注人類的知情利益和主體地位;算法歧視問題:算法研究人員的認知偏見或者訓練數(shù)據(jù)集不完美導致的歧視性的決策結果;算法決策問題:人工智能自學習導致的不可預見性結果。8.2.2人工智能倫理的成因分析129數(shù)據(jù)層面:人工智能技術在許多領域獲得重大進展依賴于大數(shù)據(jù)驅動。而隨著人工智能技術的快速發(fā)展以及大量應用案例實施,提供了豐富的個人信息收集場景、范圍和數(shù)量,數(shù)據(jù)采集日益成為引發(fā)人工智能倫理問題的重要原因之一。應用層面:人工智能算法的濫用和誤用,人們在社會活動時容易出現(xiàn)使用目的、方式、范圍等偏差,從而導致不良的影響和后果,引發(fā)的人工智能倫理問題。例如:利用人臉識別算法可以提高追查犯罪嫌疑人的效率,但也可能用于跟蹤某人的行蹤、識別某人的情感,并用于商業(yè)行為。8.2.2人工智能倫理的成因分析130人工智能的發(fā)展應遵循以下基本原則:人類根本利益原則、責任原則。8.3.1人類根本利益原則人工智能以實現(xiàn)人類根本利益為最終目標,體現(xiàn)對人權的尊重,降低技術風險和負面影響價值選擇。選擇人工智能系統(tǒng)和人工智能方法是否合理的依據(jù):①選擇的人工智能方法對于實現(xiàn)特定合法目標應是適當?shù)模虎谶x擇的人工智能方法不得違背基本價值觀,特別是不得侵犯或踐踏人權,不得用于社會評分或大規(guī)模監(jiān)控目的;③在所涉決定具有不可逆轉或難以逆轉的影響或者在涉及生死抉擇的情況下,應由人類作出最終決定。8.3人工智能倫理的治理原則1318.3.2責任原則隨著人工智能的發(fā)展,需要建立明確的責任體系,也就是責任原則?;谪熑卧瓌t,人工智能系統(tǒng)遇到與人類倫理或法律發(fā)生沖突時,可以從技術層面對人工智能技術應用部門進行問責。在責任原則下,人工智能技術的開發(fā)和應用應分別遵循透明度原則和權責一致原則。在人工智能系統(tǒng)的整個生命周期內(nèi)都需要努力提高人工智能系統(tǒng)的透明度和可解釋性。人工智能系統(tǒng)的可解釋性也指各個算法模塊的輸入、輸出和性能的可解釋性及其如何促成系統(tǒng)結果。8.3人工智能倫理的治理原則1328.4.1技術改進人工智能的許多倫理風險可以通過技術改進予以解決。例如,算法可解釋性和透明性涉及人類的知情利益和主體地位,是人工智能倫理的重要命題之一。要逐步形成算法開發(fā)者和使用者信息披露的技術慣例,對算法進行監(jiān)管,接受公眾的審查和質(zhì)詢。逐步推進人工智能標準化進程,進而推動人工智能應用領域的不斷拓展。推動人工智能企業(yè)建立倫理委員會,明確扮演人工智能技術落地執(zhí)行者角色的企業(yè)的倫理意識和社會責任。8.4人工智能倫理的治理措施1338.4.2道德規(guī)范我國《新一代人工智能發(fā)展規(guī)劃》:未來重點開展人工智能行為科學和倫理等問題研究,探索倫理道德多層次判斷結構及人機協(xié)作的倫理框架。通過教育和社會輿論進行適當?shù)匾龑?,倡導正確的價值觀,推動人工智能倫理共識的形成,有效地避免一些違背倫理道德卻未違反現(xiàn)行法律的惡性事件發(fā)生。推動科研機構和企業(yè)對人工智能倫理風險的認知和實踐,通過發(fā)布倫理風險分析報告等形式,討論人工智能倫理風險的應對措施。8.4人工智能倫理的治理措施1348.4.3政策指引通過國家政策指引更體現(xiàn)差異化和順應創(chuàng)新趨勢。例如:①支持自然資源的保護、監(jiān)測和管理。②支持與氣候有關問題的預測、預防、控制和減緩。③支持更加高效和可持續(xù)的糧食生態(tài)系統(tǒng)。④支持可持續(xù)能源的加速獲取和大規(guī)模采用。⑤促成并推動旨在促進可持續(xù)發(fā)展的可持續(xù)基礎設施、可持續(xù)商業(yè)模式和可持續(xù)金融主流化。⑥檢測污染物或預測污染程度,協(xié)助相關利益方確定、規(guī)劃并實施有針對性的干預措施,防止并減少污染及曝露風險。8.4人工智能倫理的治理措施1358.4.4法律法規(guī)在AI法律法規(guī)中,要在促進發(fā)展與風險控制之間探求最佳平衡點,尤其需要把握公權力干預和產(chǎn)業(yè)自治之間的平衡。在實踐相對成熟、已有一定普遍共識的部分,可嘗試立法規(guī)制,如針對各領域AI應用中均較為普遍的對于個人隱私等人格利益侵犯的風險問題,通過立法的方式進行保障;在行業(yè)發(fā)展需要明確責任的領域啟動立法研究,如對自動駕駛等發(fā)展相對成熟、迫切需要明確責任的領域,在現(xiàn)行法律之下嘗試地方性、試驗性的立法,為推進AI立法進程提供經(jīng)驗。在實踐不足以立法規(guī)制的領域,可以通過行業(yè)自律、政策引導等方式進行倫理風險控制。8.4人工智能倫理的治理措施1368.4.5人工智能倫理教育將AI倫理列入教學、培訓等方面教育,促進AI技術技能教育與AI教育的人文、倫理和社會方面的交叉協(xié)作,以減輕AI倫理帶來的挑戰(zhàn)和風險。對AI研究開發(fā)人員進行AI倫理培訓,要求他們將倫理考量納入設計、產(chǎn)品和出版物中,特別是在分析其使用的數(shù)據(jù)集、數(shù)據(jù)集的標注方法以及可能投入應用的成果的質(zhì)量和范圍方面。AI應依照相關的個人數(shù)據(jù)保護標準支持學習過程,既不降低認知能力,也不提取敏感信息。在學習者與AI系統(tǒng)互動過程中收集到的為獲取知識而提交的數(shù)據(jù),不得被濫用、挪用或用于犯罪,包括用于商業(yè)目的。8.4人工智能倫理的治理措施13718世紀蒸汽機開創(chuàng)機器動力時代:大大增加了城市產(chǎn)業(yè)個人,導致人力資源不足。19世紀電氣時代:電氣、化學、石油等新興產(chǎn)業(yè)增加了大量就業(yè)機會,需要更高層次的人才。20世紀信息時代:創(chuàng)造大量的新崗位。例如僅軟件開發(fā)目前全球就有2000多萬程序員?,F(xiàn)在人工智能時代:催生了大量產(chǎn)業(yè)和人才需求渴求,各大公司重金招聘精通調(diào)參的深度學習工程師。未來被淘汰的不是工作,而是技能。8.5人工智能會使許多人失業(yè)嗎THEEND138IntroductionofArtificialIntelligence第9章電子游戲中的人工智能教材:

王萬良《人工智能通識導論》高等教育出版社,2025140第9章電子游戲中的人工智能人工智能游戲的快速發(fā)展,為計算機游戲產(chǎn)業(yè)提供了新的機遇,目前人工智能技術已經(jīng)成為優(yōu)秀計算機游戲開發(fā)中不可缺少的部分。本章首先從介紹史上最著名的人機游戲大戰(zhàn),給出人工智能游戲取得的輝煌成就,也說明游戲成為人工智能研究中的“果蠅”作用,然后介紹人工智能游戲和游戲人工智能的概念、分類、使用的基本人工智能技術,最后簡單介紹掃雷機智能游戲開發(fā)和人工智能游戲的現(xiàn)狀與未來。第9章電子游戲中的人工智能1419.1史上最著名的人機游戲大戰(zhàn)9.2人工智能游戲9.3游戲人工智能

9.4掃雷機智能游戲開發(fā)9.5人工智能游戲的現(xiàn)狀與未來

2.機器感知

此后的十年里,人類與機器在國際象棋比賽上互有勝負,直到2006年棋王姆尼克被國際象棋軟件深弗里茨擊敗后,人類再也沒有擊敗過電腦。1429.1.1深藍戰(zhàn)勝國際象棋棋王卡斯帕羅夫

2.機器感知

阿爾法狗與深藍等最本質(zhì)的差異:阿爾法狗不需要師傅,能根據(jù)以往的經(jīng)驗來不斷優(yōu)化算法,梳理決策模式,吸取比賽經(jīng)驗,并通過與自己下棋來強化學習。1439.1.2AlphaGo無師自通橫掃世界圍棋大師

2.機器感知機器博弈是人工智能研究中的最好試驗場

一是博弈問題非常復雜,能夠讓人工智能大顯身手。二是人工智能算法在博弈問題中容易實現(xiàn),特別是人工智能算法產(chǎn)生錯誤不會產(chǎn)生重大損失。1449.1.3人工智能研究中的果第9章電子游戲中的人工智能1459.1史上最著名的人機游戲大戰(zhàn)9.2人工智能游戲

9.3游戲人工智能

9.4掃雷機智能游戲開發(fā)9.5人工智能游戲的現(xiàn)狀與未來

1469.2人工智能游戲人工智能游戲(AIGame)為計算機游戲業(yè)提供了新機遇,目前已經(jīng)形成了數(shù)十億美圓的產(chǎn)業(yè)。人工智能技術已經(jīng)是優(yōu)秀電腦游戲開發(fā)中不可缺少的部分,是游戲產(chǎn)品暢銷與否的一個決定性因素。應用人工智能技術設計的游戲稱為人工智能游戲(AIGame),或簡稱為智能游戲。1479.2人工智能游戲正如經(jīng)典游戲“小精靈”里的魔鬼、“Unreal”第一人稱射擊游戲(FPS)里的虛擬戰(zhàn)友,以及其他游戲角色,看起來都是具有智慧的生命,這種游戲可以認為是有智能的。有人將游戲中的路徑搜索、碰撞檢測等,也列入游戲智能的范疇。在游戲中包括角色從簡單的追逐、閃躲、移動到復雜的神經(jīng)網(wǎng)絡和遺傳算法應用等,體現(xiàn)角色行動的“自主性”,則說明游戲具有智能性。幾種游戲的智能性的觀點:1489.2人工智能游戲人工智能游戲并不是特別關心智能體是否表現(xiàn)得像人類一樣,而是更加關心游戲人工智能的智能極限——能否戰(zhàn)勝人類的領域專家,如:Waston在智能問答方面戰(zhàn)勝了Jeopardy!超級明星KenJennings和BradRutter;AlphaGo在圍棋上戰(zhàn)勝了歐洲冠軍樊麾。目前最有影響的AI游戲比賽是國際機器人圖靈測試比賽。從商業(yè)角度,游戲產(chǎn)業(yè)主要關心的是采用新技術所帶來的效益。人工智能技術將成為游戲革新的新驅動力,帶來新風格的游戲,為主流玩家提供令人興奮的效果,提供有助于市場競爭的新的計算機游戲產(chǎn)品。第9章電子游戲中的人工智能1499.1史上最著名的人機游戲大戰(zhàn)9.2人工智能游戲

9.3游戲人工智能

9.4掃雷機智能游戲開發(fā)9.5人工智能游戲的現(xiàn)狀與未來

1509.3游戲人工智能適合游戲開發(fā)的人工智能技術稱為游戲人工智能(GameAI)。游戲人工智能算法不一定要滿足通用性,只要能夠使角色的行為在某些場合內(nèi)合理就行了。游戲中的活動對象分為兩類:一類是背景中的活動對象,如天上飄著的云、飛過的鳥等。需要掌握2D或者3D圖形、動畫技術,和藝術修養(yǎng)。但它們在游戲中無須人工干預,變化也不多,控制的邏輯比較簡單。另一類活動對象是游戲中的各種角色,或者稱為游戲代理,如虛擬的人、獸、怪物、機器人等。所有角色扮演類游戲都需要智能。1519.3.2游戲人工智能的分類定性技術是游戲AI的基礎。用這些技術設計的角色行為是特定的、可預測的。這種技術實現(xiàn)容易,理解方便,也便于游戲軟件的調(diào)試和測試。在設計游戲時,游戲開發(fā)者必須考慮所有的可預測行為,而且無法幫助非玩家角色的學習或演化。在這種游戲中,玩家只要重復玩幾次游戲,便可知道NPC的定性行為,這樣,玩家就會失去游戲的興趣,從而影響游戲軟件的“生命”。游戲人工智能分為定性和非定性兩類。152非定性技術是定性技術的一種提高。用這些技術設計的角色行為具有某種程序的不確定性和不可預測性。在這種游戲中,NPC能夠學習到玩家的作戰(zhàn)行為,并推出新行為,甚至引發(fā)突現(xiàn)行為,也就是沒有明確指示而出現(xiàn)的行為。由于非定性的不可預測性,會給游戲軟件的調(diào)試和測試帶來一定的難度,但也增加玩家對游戲的興趣,延長游戲軟件的“生命”。游戲人工智能分為定性和非定性兩類。9.3.2游戲人工智能的分類153未來的游戲AI越來越注重非定性技術的研究與應用。非玩家角色的行為從玩家那里學習,使玩家難以預測游戲行為,使游戲更具挑戰(zhàn)性。主流游戲Creatures,Black&White,Battlecruiser3000AD,DirtTrackRacing,F(xiàn)ieldsofBattle,HeavyGear等,都采用了非定性技術,并具有一定的學習功能。游戲人工智能分為定性和非定性兩類。9.3.2游戲人工智能的分類154使用定性技術,解決軟件的一部分調(diào)試和測試問題;使用非定性技術,增強軟件的智能性,賦予軟件更強的生命力和挑戰(zhàn)性。在使用非定性技術時,恰當?shù)倪\用定性技術,對軟件開發(fā)的周期、軟件質(zhì)量等環(huán)節(jié)都是非常有益的。目前,在人工智能技術中,采用神經(jīng)網(wǎng)絡、貝葉斯技術、遺傳算法、有限狀態(tài)機等用來實現(xiàn)游戲中的非定性行為。成功的游戲軟件采用定性和非定性技術相結合的方法。9.3.2游戲人工智能的分類1559.3.3基本的游戲人工智能技術神經(jīng)網(wǎng)絡是基于生物大腦和神經(jīng)系統(tǒng)中的神經(jīng)連接結構的一系列機器學習算法的總和。在具體使用中,通過反復調(diào)節(jié)神經(jīng)網(wǎng)絡中互連結點之間的參數(shù)值(權重)來獲得針對不同學習任務的最優(yōu)和近似最優(yōu)反饋值。GoogleDeepMind的AlphaGo使用值網(wǎng)絡用來評價棋局形式,使用策略網(wǎng)絡用來選擇棋盤著法,使用蒙特卡洛樹用來預測和前瞻棋局,試圖沖破人類智能最后的堡壘。神經(jīng)網(wǎng)絡156機器學習9.3.3基本的游戲人工智能技術1956阿瑟·塞繆爾的西洋跳棋程序僅通過強化學習算法自己和自己對戰(zhàn)就可以戰(zhàn)勝康涅狄格州的西洋跳棋冠軍。分類是有監(jiān)督學習方法,旨在具有標簽的數(shù)據(jù)中挖掘出類別的分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論