《工業(yè)大數(shù)據(jù)與人工智能》 課件 第4章 工業(yè)中的感知智能_第1頁
《工業(yè)大數(shù)據(jù)與人工智能》 課件 第4章 工業(yè)中的感知智能_第2頁
《工業(yè)大數(shù)據(jù)與人工智能》 課件 第4章 工業(yè)中的感知智能_第3頁
《工業(yè)大數(shù)據(jù)與人工智能》 課件 第4章 工業(yè)中的感知智能_第4頁
《工業(yè)大數(shù)據(jù)與人工智能》 課件 第4章 工業(yè)中的感知智能_第5頁
已閱讀5頁,還剩181頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

工業(yè)大數(shù)據(jù)與人工智能HFUT1教材簡介2工業(yè)智能傳感與感知工業(yè)機器視覺第四章

工業(yè)中的感知智能

工業(yè)機器聽覺人機交互多源信息融合智能傳感器

3工業(yè)智能傳感與感知智能傳感器具有實時處理、高精度、自校準和通信能力等特點,相比傳統(tǒng)傳感器,它更小巧高效,其內(nèi)部配備了先進處理器,可以實時分析環(huán)境參數(shù),并通過通信技術與其他設備互動,彌補了傳統(tǒng)傳感器感知范圍有限和數(shù)據(jù)處理能力不足的問題智能傳感器功能4工業(yè)智能傳感與感知智能傳感器分類

5工業(yè)智能傳感與感知智能傳感器信號處理技術6工業(yè)智能傳感與感知采樣技術濾波技術時頻域分析技術7工業(yè)智能傳感與感知采樣技術-奈奎斯特定理核心思想:采樣頻率≥2×信號最高頻率避免混疊(aliasing)定義:對于帶限信號:采樣頻率≥2×最高頻率保證信號無失真重建混疊:采樣頻率過低導致高頻成分被誤解為低頻引起信號失真8工業(yè)智能傳感與感知濾波技術目的:從含有干擾的信號中提取有用信號分類:模擬濾波器使用電容、電感、電阻等模擬電子元件處理連續(xù)時間模擬信號可處理無限帶寬信號精度受限,易受噪聲影響數(shù)字濾波器通過數(shù)字信號處理器(DSP)或軟件實現(xiàn)處理數(shù)字信號具有靈活性和可編程性可以實現(xiàn)復雜算法9工業(yè)智能傳感與感知時頻域分析技術時域分析直接考察信號隨時間變化的過程,通過觀察信號的波形、幅度、相位等時域特性來理解信號的本質(zhì)。時域分析主要包括計算信號的均值、方差、自相關函數(shù)等統(tǒng)計量以描述信號的集中趨勢和波動情況。頻域分析將信號從時域轉(zhuǎn)換到頻率域,通過分析信號的頻譜特性來揭示信號的組成成分及其頻率分布。時頻域分析結(jié)合時域與頻域信息,能夠同時揭示信號的頻率成分隨時間變化的情況,特別適用于非平穩(wěn)信號的分析。10工業(yè)機器視覺11工業(yè)機器視覺工業(yè)圖像信號采集技術工業(yè)相機鏡頭光源

12工業(yè)機器視覺工業(yè)圖像處理技術圖像增強圖像特征提取13工業(yè)機器視覺目標檢測傳統(tǒng)目標檢測基于深度學習的目標檢測14工業(yè)機器視覺自動定位應用:工業(yè)自動化機器人技術智能監(jiān)控醫(yī)療影像功能:定位目標物體的位置和姿態(tài)15工業(yè)機器聽覺目標:使計算機系統(tǒng)具備類似人類聽覺的能力過程:從捕獲聲音信號到對其進行深入分析和理解發(fā)展歷程早期研究:音頻信號的基礎處理現(xiàn)代進展:利用深度學習提高性能關鍵技術:深度神經(jīng)網(wǎng)絡用于語音識別和生成技術基礎聲音信號:語音、音樂、環(huán)境噪音傳感器:聲音傳感器信號處理:特征提?。ɡ鏜el頻率倒譜系數(shù))數(shù)字化:將聲音信號轉(zhuǎn)換為數(shù)字表示16工業(yè)機器聽覺工業(yè)音頻信號采集17工業(yè)機器聽覺音頻信號特征Mel頻率倒譜系數(shù)(MFCCs)感知線性預測系數(shù)(PLPs)濾波器組分析(Filter-bank,FBank)語譜圖描繪(Spectrogram)常數(shù)Q倒譜系數(shù)(Constant-QCepstralCoefficients,CQCCs)18工業(yè)機器聽覺語音識別高斯混合模型-隱馬爾可夫模型深度神經(jīng)網(wǎng)絡-隱馬爾可夫模型注意力模型19工業(yè)機器聽覺語音合成理論基礎1960年代:瑞典語言學家提出了線性預測編碼(LPC),這是一種基于聲道模型的理論,為后續(xù)的語音合成技術奠定了基礎。技術進步1980年代:這一時期的技術進步包括:混合型共振峰合成器(FormantSynthesis),它可以調(diào)整共振峰的位置來改變發(fā)音。PSOLA(Pitch-SynchronousOverlapandAdd)算法,它允許在保持音高和時長的同時對語音信號進行修改,使得合成語音更加流暢自然。基于語料庫的方法1990年代:隨著計算能力的提高,基于語料庫的語音合成(Corpus-basedSpeechSynthesis)開始出現(xiàn),這種方法使用大量的錄音樣本作為合成的基礎,通過波形拼接來構(gòu)建合成語音。統(tǒng)計建模與機器學習20世紀末:統(tǒng)計建模和機器學習被引入到語音合成領域,這使得系統(tǒng)能夠更好地適應不同的環(huán)境和用戶需求。深度學習時代隨著深度學習技術的興起,語音合成技術取得了重大進展,特別是使用深度神經(jīng)網(wǎng)絡(DNN)和端到端模型,如Tacotron和WaveNet等,大大提高了合成語音的質(zhì)量和自然度。20多源信息融合起源與發(fā)展起源:20世紀70年代為軍事應用提出目標:提供更全面、準確的信息核心價值綜合信息:整合多種來源的數(shù)據(jù)決策支持:改善認知能力與決策質(zhì)量層次結(jié)構(gòu)數(shù)據(jù)預處理特征提取決策推理21多源信息融合多源信息融合的分類數(shù)據(jù)層特征層決策層22多源信息融合多源信息融合的模型聯(lián)合目標定位模型Bowman數(shù)據(jù)融合與資源管理模型Luo-Kay模型23多源信息融合多源信息融合的主要技術和方法24人機交互人機交互(Human-ComputerInteraction,HCI)作為一個伴隨計算機技術發(fā)展而蓬勃興起的交叉學科,它專注于探究人類、計算機系統(tǒng)及其兩者間相互作用的影響機制,旨在優(yōu)化用戶與計算機系統(tǒng)的交互設計流程,從而提升用戶體驗和工作效率。25人機交互體感交互利用身體動作進行數(shù)字指令的傳輸。特點:直觀、本能的交互方式。發(fā)展歷程:鼠標:引領圖形界面革命。體感技術:推動從二維到三維的交互轉(zhuǎn)型。特制硬件與算法:如Kinect、LeapMotion及深度學習技術。自然用戶界面(NUI):理解方式:觸碰、語音、手勢、眼神等。優(yōu)勢:提升直觀性和易用性,消除認知障礙。應用領域:智能生活,娛樂,教育,醫(yī)療未來展望:更真實、沉浸與智能的交互體驗。人機無縫溝通的新紀元。26人機交互手勢交互手勢檢測跟蹤識別27人機交互沉浸式交互HFUT敬請指正28工業(yè)大數(shù)據(jù)與人工智能HFUT29教材簡介30智能傳感器概述智能傳感器功能及分類第四章

工業(yè)中的感知智能

智能傳感器的基本功能智能傳感器分類采樣技術濾波技術時頻域分析技術智能傳感器的概念和特點智能傳感器的信號處理技術4.1工業(yè)智能傳感與感知31智能傳感器概述-智能傳感器的概念智能傳感器的概念起源于1979年的美國國家航空航天局宇宙飛船研發(fā)項目。作為一種先進的感測設備,智能傳感器具有實時處理、高精度、自校準和通信能力等特點,相比傳統(tǒng)傳感器,它更小巧高效,其內(nèi)部配備了先進處理器,可以實時分析環(huán)境參數(shù),并通過通信技術與其他設備互動,彌補了傳統(tǒng)傳感器感知范圍有限和數(shù)據(jù)處理能力不足的問題。32智能傳感器概述-智能傳感器的特點33智能傳感器功能及分類-智能傳感器的基本功能34智能傳感器功能及分類-智能傳感器的分類根據(jù)其內(nèi)部結(jié)構(gòu)和制造方式35智能傳感器功能及分類-智能傳感器的分類組合模塊式在保持原有生產(chǎn)工藝基礎不變的情況下,僅需通過增加一塊集成了數(shù)字總線接口的微處理器模塊,即可將傳統(tǒng)傳感器升級為智能傳感器系統(tǒng)。36智能傳感器功能及分類-智能傳感器的分類2.混合式混合式智能傳感器將傳感器的敏感元件、信號處理電路、校正電路和補償電路、微處理器、數(shù)字存儲器(ROM、RAM)、數(shù)字總線接口等以不同的組合方式集成在兩塊或者三塊芯片上,并封裝在一個外殼中。37智能傳感器功能及分類-智能傳感器的分類3.集成式集成式智能傳感器利用大規(guī)模集成電路技術和微機電技術,選用硅材料來構(gòu)建精密的傳感元件,并將這些元件與信號處理、A/D轉(zhuǎn)換及微型處理器等關鍵電路集成在同一微小芯片上。38智能傳感器的信號處理技術-采樣技術采樣技術-奈奎斯特定理核心思想:采樣頻率≥2×信號最高頻率避免混疊(aliasing)定義:對于帶限信號:采樣頻率≥2×最高頻率保證信號無失真重建混疊:采樣頻率過低導致高頻成分被誤解為低頻引起信號失真39智能傳感器的信號處理技術-濾波技術濾波目的:從含有干擾的信號中提取有用信號分類:模擬濾波器使用電容、電感、電阻等模擬電子元件處理連續(xù)時間模擬信號可處理無限帶寬信號精度受限,易受噪聲影響數(shù)字濾波器通過數(shù)字信號處理器(DSP)或軟件實現(xiàn)處理數(shù)字信號具有靈活性和可編程性可以實現(xiàn)復雜算法40智能傳感器的信號處理技術-時頻域分析技術時域分析技術均值方差41智能傳感器的信號處理技術-時域分析技術自相關函數(shù)信號能量功率信號的平均功率42智能傳感器的信號處理技術-頻域分析技術傅里葉變換(FourierTransform,FT)43智能傳感器的信號處理技術-頻域分析技術快速傅里葉變換(FastFourierTransform,FFT)功率譜密度(PowerSpectralDensity,PSD)描述隨機信號功率在頻率域的分布:44智能傳感器的信號處理技術-時頻域分析技術短時傅里葉變換(Short-TimeFourierTransform,STFT)結(jié)合時域和頻域分析的優(yōu)點,通過在信號上滑動的窗口進行傅里葉變換,提供信號頻率內(nèi)容隨時間變化的信息,適用于分析非平穩(wěn)信號。45智能傳感器的信號處理技術-時頻域分析技術小波變換(WaveletTransform,WT)利用不同尺度的小波基函數(shù),同時在時間和頻率上提供信號的局部化分析,特別適合于分析具有瞬態(tài)特征或頻率隨時間變化的信號。46智能傳感器的信號處理技術-時頻域分析技術Wigner-Ville分布(Wigner-VilleDistribution,WVD)直接在時頻平面上顯示信號的局部能量分布,適用于分析具有復雜時頻結(jié)構(gòu)的信號。HFUT敬請指正47工業(yè)大數(shù)據(jù)與人工智能HFUT48教材簡介49機器視覺基本概念工業(yè)圖像信號采集技術第四章

工業(yè)中的感知智能

工業(yè)相機鏡頭圖像增強他圖像特征提取基于深度學習的目標檢測工業(yè)圖像處理技術4.2工業(yè)機器視覺光源傳統(tǒng)目標檢測目標檢測自動定位50工業(yè)機器視覺-機器視覺基本概念51工業(yè)機器視覺-機器視覺基本概念機器視覺的工作流程根據(jù)判斷結(jié)果生成控制指令;指導機器人手臂、驅(qū)動器等執(zhí)行精確操作。圖像采集利用高性能工業(yè)相機與精密鏡頭捕捉高清晰度圖像。圖像處理將模擬信號轉(zhuǎn)換為數(shù)字信號;分析圖像的亮度、顏色與尺寸等關鍵特征。特征提取與決策運用復雜算法提取目標特征;采用模式識別與機器學習技術做出智能判斷。控制與執(zhí)行52工業(yè)機器視覺-工業(yè)圖像信號采集技術工業(yè)相機作為圖像采集系統(tǒng)的“眼睛”,相機負責捕捉并記錄被測物體的光學影像。其分辨率、動態(tài)范圍、幀率等因素均對圖像細節(jié)表現(xiàn)、色彩還原度及運動場景捕捉能力產(chǎn)生顯著影響。53工業(yè)機器視覺-工業(yè)圖像信號采集技術工業(yè)相機CCD相機CMOS相機功能:光電轉(zhuǎn)換、電荷存儲、轉(zhuǎn)移及信號讀取工作原理:光線→光電效應→電荷轉(zhuǎn)移→放大→圖像信號組件:光學鏡頭、時序與同步信號發(fā)生器、垂直驅(qū)動電路、模擬/數(shù)字信號處理電路優(yōu)點:無灼傷、響應快、低功耗功能:高度集成(光敏元件、信號放大器、模數(shù)轉(zhuǎn)換器等)工作原理:光線→電荷→電壓→數(shù)字信號優(yōu)點:集成性好、低功耗、高速數(shù)據(jù)傳輸、寬動態(tài)范圍54工業(yè)機器視覺-工業(yè)圖像信號采集技術鏡頭鏡頭在機器視覺系統(tǒng)中的功能類似于人眼中的晶狀體,負責將被觀察物體的光線聚焦并投射到圖像傳感器上形成清晰、準確的圖像。機器視覺系統(tǒng)的鏡頭選擇和配置直接影響到系統(tǒng)的分辨率、成像質(zhì)量、工作范圍以及對環(huán)境變化的適應能力55工業(yè)機器視覺-工業(yè)圖像信號采集技術鏡頭選擇工業(yè)檢測鏡頭的關鍵因素工作波長與變焦需求波長:根據(jù)應用光譜范圍選擇合適鏡頭(如近紅外用于穿透表面反射檢測)。變焦:根據(jù)是否需要調(diào)整觀測尺度選擇定焦或變焦鏡頭。景深管理作用:對于動態(tài)生產(chǎn)線或有位置偏差的應用場景。實現(xiàn):通過精確計算焦距保證足夠景深,即使目標移動也保持清晰。焦距選擇依據(jù):工作距離、目標尺寸、所需分辨率和傳感器規(guī)格。目的:優(yōu)化視場覆蓋和圖像細節(jié)。綜合考慮其他參數(shù)光圈大小:影響曝光時間和圖像亮度?;兛刂?保持圖像真實無扭曲。鏡頭材質(zhì)與鍍膜:提高透光率和圖像純凈度。接口兼容性:確保與現(xiàn)有系統(tǒng)兼容。成本效益:平衡性能與價格。56工業(yè)機器視覺-工業(yè)圖像信號采集技術光源1.塑造圖像質(zhì)量:光源直接影響圖像的清晰度與對比度。2.增強特征識別:適當?shù)恼彰髂芡怀瞿繕颂卣?,簡化圖像處理。3.維持檢測穩(wěn)定性:穩(wěn)定的照明確保系統(tǒng)在不同條件下的一致表現(xiàn)。57工業(yè)機器視覺-工業(yè)圖像信號采集技術光源LED光源的優(yōu)勢實用性:易于安裝與維護。經(jīng)濟性:能耗低、壽命長。靈活性:可定制形狀與顏色。關鍵指標對比度:增強特征與背景之間的差異。亮度:保證良好的信噪比與景深。魯棒性:確保圖像質(zhì)量的一致性。照明方式:根據(jù)需求選擇最佳策略。其他考量:利用單色光源、濾鏡、偏振技術等。照明策略暗場照明:突出輪廓。側(cè)光:增強紋理。垂直光照:確保均勻性。58工業(yè)機器視覺-工業(yè)圖像處理技術圖像增強59工業(yè)機器視覺-工業(yè)圖像處理技術圖像增強-單點運算方法灰度變換在得到灰度圖像的基礎上進一步對每個像素的灰度級進行調(diào)整的過程。對于圖像中的任意一點s,其在增強后的灰度圖像t中的對應灰度值可通過一個預定義的灰度映射函數(shù)E來決定,該函數(shù)可能呈現(xiàn)為線性變換、非線性變換或分段線性變換等形式。線性灰度變換-圖像反轉(zhuǎn)灰度線性變換最常見的就是圖像反轉(zhuǎn),在灰度圖像灰度級[0,L-1]范圍中,其反轉(zhuǎn)的公式如下所示:

s=L-1-r

其中r表示原始圖像的灰度級s表示變換后的灰度級。60工業(yè)機器視覺-工業(yè)圖像處理技術圖像增強-單點運算方法非線性灰度變換經(jīng)典的非線性變換有對數(shù)變換,一般表示如下所示:r表示原始圖像的灰度級s表示變換后的灰度級c為常數(shù)61工業(yè)機器視覺-工業(yè)圖像處理技術圖像增強-單點運算方法直方圖修正法直方圖修正法是圖像處理中用于調(diào)整圖像對比度和亮度的一種方法。該方法的核心在于細致分析圖像中各個灰度層次的分布特性,通過以灰度級別為橫軸,像素出現(xiàn)的頻率為縱軸繪制直方圖,直觀展示每種灰度級與其對應像素數(shù)量的關系。這樣不僅能夠清晰揭示出圖像的明暗分布特征及對比度強弱,還能總體上勾勒出圖像的視覺概貌。此步驟是后續(xù)圖像處理工作的關鍵基礎,為深入分析與優(yōu)化提供了不可或缺的信息依據(jù)。對像素的灰度級作歸一化處理,即將像素灰度級為L(0~255)歸一化為0<=L<=1,0代表黑,1代表白?;叶戎狈綀D的計算公式為式中,x是像素的灰度級,n是具有灰度r的像素的個數(shù),N是圖像中像素總個數(shù),p(x)稱為概率質(zhì)量函數(shù).其縱軸是概率,其歸一化的累積直方圖稱為累積分布函數(shù)62工業(yè)機器視覺-工業(yè)圖像處理技術圖像增強-單點運算方法直方圖修正法低亮度圖像:這類圖像的直方圖特征表現(xiàn)為灰度級分布集中在較低(暗)區(qū)域。這意味著圖像中的大部分像素點具有較低的灰度值,整體色調(diào)偏暗。在直方圖中,左側(cè)(代表較暗區(qū)域)的柱狀高度較高,顯示了像素數(shù)量較多,而右側(cè)高灰度區(qū)域的柱狀高度則相對較低。正常亮度圖像:對于這樣的圖像,其直方圖顯示了像素灰度值在中間區(qū)域的密集分布特性,意味著圖像中的大部分像素灰度均衡地介于高亮與昏暗之間,既不過分偏向極亮也不側(cè)重極度陰暗,展現(xiàn)了良好的灰度平衡。直方圖上的峰值出現(xiàn)在中間灰階部分,兩端(最暗和最亮)的灰度級所對應的像素數(shù)量相對適中。63工業(yè)機器視覺-工業(yè)圖像處理技術圖像增強-鄰域運算方法64工業(yè)機器視覺-工業(yè)圖像處理技術圖像增強-頻率域法低通濾波與高通濾波在頻率域中,低頻成分對應于圖像中的緩慢變化區(qū)域(如大面積的均勻顏色、平滑過渡的漸變等)以及圖像的全局結(jié)構(gòu)信息,而高頻成分則對應于快速變化的細節(jié)(如邊緣、紋理、噪聲等)。65工業(yè)機器視覺-工業(yè)圖像處理技術圖像增強-頻率域法在圖像處理中,低頻通常對應于變化緩慢的部分,如大面積的顏色區(qū)域;而高頻則對應于邊緣和細節(jié)等快速變化的部分。因此,低通濾波器主要用于以下方面:去除噪聲:由于圖像中的隨機噪聲通常是高頻成分,低通濾波可以平滑圖像,減少噪聲的影響。模糊效果:通過模糊圖像可以達到平滑的效果,常用于預處理步驟以減少后續(xù)處理的復雜性。高通濾波器允許高頻成分通過,而抑制或減弱低頻成分。在圖像處理中,這有助于突出邊緣和細節(jié),其主要應用包括:邊緣檢測:高通濾波器能夠增強圖像中的邊緣和輪廓,這對于特征提取非常有用。銳化圖像:通過增強高頻成分,可以使圖像看起來更加清晰,細節(jié)更豐富。66工業(yè)機器視覺-工業(yè)圖像處理技術圖像增強-圖像特征提取邊緣特征提取-Sobel算子模板基于圖像灰度梯度的變化來確定圖像中的邊緣位置。具體來說,Sobel算子由兩個3x3的卷積核組成,分別用于計算圖像在水平方向(x軸)和垂直方向(y軸)上的梯度強度。67工業(yè)機器視覺-目標檢測目標檢測概述機器視覺自動檢測人工檢測效率效率高效率低速度速度快速度慢精度高精度易受主觀因素影響,精度一般可靠性檢測效果穩(wěn)定不易保持檢測效果工作時間可24小時不停工作容易疲勞、工作時間有限信息采集可實現(xiàn)信息集成不易實現(xiàn)信息集成成本成本低人工成本高環(huán)境可適用于危險檢測環(huán)境不適用于危險檢測環(huán)境教材簡介68目標檢測發(fā)展歷程2012年,AlexNet網(wǎng)絡提出,是卷積神經(jīng)網(wǎng)絡發(fā)展也是深度學習發(fā)展的分水嶺。2014年,深度學習正式用于目標檢測任務。教材簡介69傳統(tǒng)目標檢測教材簡介70傳統(tǒng)目標檢測1.區(qū)域選擇:基于候選區(qū)域的目標檢測算法主要思想是在圖像中提取潛在的目標區(qū)域,通過利用圖像的低級特征,如紋理、顏色和邊緣信息,提取具有潛在目標的區(qū)域。2.特征提取:確認了目標物體在圖像上的位置之后,接下來的步驟是對該區(qū)域?qū)嵤┨卣魈崛?,圖像特征的選擇直接關系到目標檢測的準確性,因此是一個核心環(huán)節(jié)。3.分類器:提取得到的特征將被輸入到分類器中進行分類處理,分類器的效能直接影響到目標區(qū)分的速度與準確度,在實踐中,常用的目標檢測分類器有支持向量機(SVM)和Haar分類器等。教材簡介71深度學習在目標檢測中的應用教材簡介72深度學習在目標檢測中的應用卷積神經(jīng)網(wǎng)絡結(jié)構(gòu)主要包含:輸入層、卷積層、池化層、全連接層。卷積神經(jīng)網(wǎng)絡是人類視覺原理的一種體現(xiàn),即可視皮層是分級的。視網(wǎng)膜輸入原始信號->攝入像素

大腦皮層初步處理->邊緣和方向

抽象->形狀

進一步抽象->物體教材簡介73深度學習在目標檢測中的應用卷積層是卷積網(wǎng)絡的核心組件,其主要作用是從輸入中提取特征。

特點:局部連接、權(quán)值共享局部連接:CNN的基本組成單元是卷積層,其中的濾波器(或稱卷積核)只關注輸入圖像的一小塊區(qū)域,這反映了生物視覺系統(tǒng)中神經(jīng)元對局部輸入敏感的特性。通過滑動窗口操作,濾波器可以遍歷整個圖像,捕捉局部特征,如邊緣、紋理等。權(quán)值共享:卷積層中的每個濾波器在整個圖像上使用的權(quán)重是相同的,這意味著一個特征如果在一個位置被識別,那么在其他位置也能被同樣識別。這不僅減少了模型參數(shù)的數(shù)量,還增強了模型的泛化能力。教材簡介74雙階段目標檢測雙階段目標檢測算法是計算機視覺領域中一類經(jīng)典且影響力深遠的檢測模型,它將目標檢測任務分為兩個明確的步驟來執(zhí)行:提案生成(RegionProposalGeneration)和目標分類及定位(ClassificationandLocalization)。這種分階段處理的方式旨在提高檢測的準確性和效率,尤其是在處理復雜場景時。第一階段:區(qū)域生成這一階段的目標是從原始圖像中提出一系列潛在包含目標對象的區(qū)域,即候選區(qū)域。這些候選區(qū)域應該盡可能覆蓋所有真實目標,并且數(shù)量要足夠多以減少漏檢,同時也要避免過多的冗余,以減輕后續(xù)處理的負擔。第二階段:目標分類及定位在獲得候選區(qū)域后,第二階段的任務是對每個提案進行兩方面的評估:一是判斷該區(qū)域是否確實包含感興趣的目標類別(分類任務),二是精確定位目標的邊界框(回歸任務)。教材簡介75雙階段目標檢測-RCNN1.

利用選擇性搜索(SelectiveSearch)算法對輸入圖像進行區(qū)域選擇,提取2000個左右的候選區(qū)域。2.由于網(wǎng)絡結(jié)構(gòu)中存在全連接層,需要將提取出的候選區(qū)域統(tǒng)一尺寸,此處將尺寸縮放至227x227像素,再適當擴大以獲取更多上下文信息。3.使用卷積網(wǎng)絡對每個歸一化后的候選區(qū)域做特征提取操作,從每個候選區(qū)域提取

4096維的特征向量。4.使用SVM或其他分類器對提取到的特征進行分類識別。5.使用邊框回歸(BoundingBoxRegression)微調(diào)邊框位置基于區(qū)域的卷積神經(jīng)網(wǎng)絡(R-CNN)(CVRP2014)教材簡介76雙階段目標檢測-FastRCNN(ICCV-2015)R-CNN的第一個升級版本是FastR-CNN,通過使用了2次增強,大大提了檢測速度:在建議區(qū)域之前進行特征提取,因此在整幅圖像上只能運行一次卷積神經(jīng)網(wǎng)絡;用一個softmax層代替支持向量機,對用于預測的神經(jīng)網(wǎng)絡進行擴展,而不是創(chuàng)建一個新的模型。FastR-CNN的運行速度要比R-CNN快的多,因為在一幅圖像上它只能訓練一個CNN。但是,擇性搜索算法生成區(qū)域提議仍然要花費大量時間。教材簡介77雙階段目標檢測-FasterR-CNN(NIPS2015)繼FastR-CNN后,在CPU上實現(xiàn)的RegionProposal的算法SelectiveSearch成了物體檢測速度提升上的最大瓶頸。FasterR-CNN改進:設計RegionProposalNetwork(RPN),利用CNN卷積操作后的特征圖生成候選框,代替了SelectiveSearch方法,速度上提升明顯(10ms)。訓練RPN與FastR-CNN共享卷積層,大幅提高網(wǎng)絡的檢測速度。實現(xiàn)了端到端的檢測。從候選區(qū)域的產(chǎn)生->分類->定位都在一個系統(tǒng)下完成,實現(xiàn)端到端實時檢測RPN教材簡介78雙階段目標檢測R-FCN(CVPR2016)該模型針對感興趣局域的分類過程進行完善。

動機:目標檢測不僅需要檢測還需要定位,當網(wǎng)絡層數(shù)越來越深時,優(yōu)點是可以增加語義信息,使分類更加準確,缺點是會丟失位置信息,定位精度下降。那么該如何利用好分類網(wǎng)絡性能,解決這一矛盾?R-FCN提出了位置敏感得分圖(Position-sensitivescoremaps)來解決這一問題?;纠砟睿何恢妹舾械梅謭D是針對每個類別和每個預定義的子區(qū)域(例如,一個目標可能被劃分為上、下、左、右、中心等部分),獨立學習一個得分圖。這樣,每個子區(qū)域都有專門的分數(shù)來表示該區(qū)域是否包含目標的特定部分。目標:通過這種方式,模型不僅能夠識別出圖像中是否存在某個類別對象,還能更加精確地定位這個對象的各個部分,從而提高了邊界框的定位精度。工作原理79雙階段目標檢測R-FCN(CVPR2016)特征圖細分:首先,輸入圖像經(jīng)過卷積神經(jīng)網(wǎng)絡處理后得到特征圖。然后,這個特征圖會被進一步分割成多個較小的、重疊的網(wǎng)格,每個網(wǎng)格對應一個或多個子區(qū)域(例如,3x3的網(wǎng)格可以為一個目標定義9個不同的位置敏感區(qū)域)。位置敏感濾波器:為每個類別和每個子區(qū)域設計特定的濾波器(或稱為分類器)。這些濾波器會在特征圖的對應子區(qū)域上滑動,產(chǎn)生一系列響應,即位置敏感得分圖。每個得分圖反映了輸入圖像在特定位置和特定子區(qū)域中存在該類別目標的可能性。融合與預測:最后,對于每個候選區(qū)域,會從相應的得分圖中提取相應的得分,并根據(jù)這些得分來調(diào)整候選框的位置,或者直接對候選框內(nèi)的每個子區(qū)域打分,進而決定最佳的邊界框位置和類別。教材簡介80單階段目標檢測單階段目標檢測算法將目標檢測任務視為直接回歸問題,通過一個統(tǒng)一的網(wǎng)絡結(jié)構(gòu)同時完成目標的分類和位置回歸,省略了兩階段算法中的區(qū)域生成和目標識別兩個步驟。這樣的設計簡化了整體流程,減少了計算開銷。經(jīng)典的單階段目標檢測算法有:YOLO(YouOnlyLookOnce)、SSD(SingleShotMultiboxDetector)、RetinaNet等。簡潔高效:單階段算法省去了候選區(qū)域生成的步驟,直接在特征圖上進行密集采樣,每個采樣點都對應一個或多個預定義的錨框(AnchorBoxes),用于預測目標類別和邊界框??焖偻评恚河捎趦H需一次網(wǎng)絡前向傳播,單階段算法能夠?qū)崿F(xiàn)非常高的處理速度,適合對實時性要求高的應用場景,如自動駕駛、視頻監(jiān)控等。設計靈活性:這類算法在架構(gòu)設計上有較高的自由度,可以通過增加網(wǎng)絡深度、采用特征金字塔網(wǎng)絡(FPN)等方式來提升檢測性能。核心特點教材簡介81單階段目標檢測-YOLOYOLO(YouOnlyLookOnce)檢測算法將目標檢測任務視為單階段的回歸問題,通過學習從圖像像素到邊框坐標和類別概率的映射。圖像預處理:YOLO首先將輸入圖像的大小調(diào)整為448x448像素,為后續(xù)處理做準備。實現(xiàn)步驟神經(jīng)網(wǎng)絡處理:YOLO使用一個卷積神經(jīng)網(wǎng)絡對圖像進行處理,同時預測圖像中多個邊框以及它們所屬的目標類別。NMS處理:為了消除重復的邊框,YOLO使用非極大值抑制(NMS)的方法。NMS會保留具有高類別概率的邊框,并消除與這些邊框交并比(IntersectionoverUnion,IoU)高于閾值的其他邊框,以確保最終的檢測結(jié)果具有高度準確性。教材簡介82單階段目標檢測-YOLOYOLO的方案有幾個問題:針對小目標的檢測效果會不太好,因為7*7的網(wǎng)格的劃分可能太粗糙了;經(jīng)過多層卷積和pooling的操作,圖像的邊緣特征可能丟失較多了,而回歸boundingbox參數(shù)的只使用了高層的卷積層特征,會導致boundingbox不準確;當兩個目標同時落入7*7的某一個網(wǎng)格中的時候,對應位置只能檢測到一個物體。YOLO方案的輸入是比如448*448的圖片,輸入是一個7*7的網(wǎng)格,每個網(wǎng)格的信息包含:1.存在某個類別的物體的概率,比如有20類目標需要檢測,那就是20類+1類(backgroud);2.對應物體的boundingbox參數(shù),使用4個數(shù)字描述;3.對應目標的概率。這個問題就被format成一個回歸問題,448*448*3作為輸入;7*7*(b*5+c)作為回歸的參數(shù)然后進行end-to-end的學習教材簡介83單階段目標檢測-Yolov2YOLOv2相對YOLOv1進行了多項關鍵優(yōu)化,這些改進旨在提高檢測精度的同時保持或提升運行速度。高分辨率分類器:YOLOv2在訓練初期使用較大的圖像分辨率(如416x416),然后微調(diào)時逐步減小分辨率,以提高對小物體的檢測精度。特征圖尺寸設計為奇數(shù)(如13x13),這樣可以更準確地定位物體的中心點。網(wǎng)絡結(jié)構(gòu)改進:引入了Darknet-19作為骨干網(wǎng)絡,替代了YOLOv1中的網(wǎng)絡結(jié)構(gòu),提升特征表達能力去除了YOLOv1中的全連接層,轉(zhuǎn)而使用全局平均池化(GAP),允許輸入圖像尺寸更加靈活,不再受限于固定大小。在網(wǎng)絡中增加了批量歸一化(BatchNormalization),提升訓練速度并穩(wěn)定學習過程,實驗證明這能提高約2%的mAP。移除了Dropout,因為與批量歸一化一起使用時,Dropout的效果并不明顯,有時甚至會降低性能。教材簡介84單階段目標檢測-Yolov2多尺度預測:采用了不同尺度的特征圖進行檢測,即在多個特征層上預測邊界框,有助于檢測不同大小的對象,增強模型的多尺度適應能力。錨框機制:引入了錨框(AnchorBoxes)的概念,預先定義了一系列不同比例和大小的邊界框,用來匹配不同形狀的目標,這是對目標框預測的一種改進。教材簡介85對比方法PASCALVOC數(shù)據(jù)集COCO數(shù)據(jù)集mAPFPSmAPFPSRCNN58.5%0.531.4%0.5FastRCNN70.0%235.9%2FasterRCNN73.2%742.7%7R-FCN77.6%945.0%9YOLOv163.4%4521.6%45YOLOv278.6%4044.0%40教材簡介86總結(jié)RCNN(RegionswithCNNfeatures):這是一種兩階段的目標檢測方法,首先生成候選區(qū)域,然后在每個候選區(qū)域上運行卷積神經(jīng)網(wǎng)絡。RCNN的處理速度較慢,但檢測精度相對較高。FastRCNN:在RCNN的基礎上進行了改進,將候選區(qū)域生成和特征提取結(jié)合起來,大幅提高了檢測速度。FasterRCNN:進一步改進了FastRCNN,通過引入?yún)^(qū)域建議網(wǎng)絡(RPN)來更快地生成候選區(qū)域,進一步提高了檢測速度和精度R-FCN(Region-basedFullyConvolutionalNetworks):利用全卷積網(wǎng)絡來進行區(qū)域級別的特征提取和分類,保持高精度的同時,進一步提高了檢測速度。YOLOv1(YouOnlyLookOnce):單階段檢測方法,通過一次性地將圖像分割成網(wǎng)格并預測每個網(wǎng)格的檢測結(jié)果,大幅提高了檢測速度,但精度較低。YOLOv2:對YOLOv1進行了多項改進,包括更好的特征提取網(wǎng)絡和錨框機制,顯著提高了檢測精度,同時保持較高的檢測速度。教材簡介87實際應用案例火災煙霧監(jiān)控智能車牌檢測教材簡介88實際應用案例智能駕駛醫(yī)學影像分析教材簡介89自動定位自動定位是機器視覺領域中一項關鍵而廣泛應用的技術,它通過攝像機或其他視覺傳感器獲取圖像信息,并借助計算機視覺算法實現(xiàn)對目標物體的準確定位。教材簡介90自動定位-步驟詳解圖像采集:使用高清攝像機或多視角攝像系統(tǒng)捕獲目標區(qū)域的圖像或視頻流??赡軙孟冗M的圖像傳感器技術和同步曝光控制以獲得高質(zhì)量的圖像。圖像預處理:進行噪聲抑制,例如使用中值濾波或卡爾曼濾波器去除圖像噪聲。調(diào)整亮度和對比度,比如通過直方圖均衡化來改善圖像的整體灰度分布。邊緣檢測和銳化,例如使用Canny算法或Sobel算子來強化目標物體的輪廓特征。特征提?。撼槿∧繕宋矬w的獨特幾何特征(如HOG、SIFT、SURF等)、顏色特征(如HSV直方圖、顏色聚類)以及紋理特征(如Gabor濾波器、LBP算子)。教材簡介91自動定位-步驟詳解定位精度優(yōu)化:通過邊界框回歸、多幀融合或三維重建技術結(jié)合深度信息來提升定位精度。目標識別:利用深度學習模型如卷積神經(jīng)網(wǎng)絡(CNN)進行分類,以區(qū)分不同種類的目標。使用OCR技術識別文字標識,以確定目標的具體身份或類別屬性。結(jié)果整合與輸出:整合定位與識別的結(jié)果,并以坐標值、角度值等形式輸出目標的精確位置信息。HFUT敬請指正92工業(yè)大數(shù)據(jù)與人工智能HFUT93教材簡介94機器聽覺基本概念工業(yè)音頻信號采集第四章

工業(yè)中的感知智能

音頻信號采樣音頻信號量化音頻信號的接收音頻信號特征4.3工業(yè)機器聽覺音頻信號編碼濾波器組梅爾頻率倒頻譜系數(shù)語譜圖感知線性預測語音識別深度神經(jīng)網(wǎng)絡-隱馬爾可夫模型連接時序分類高斯混合模型-隱馬爾可夫模型語音合成注意力模型基于深度學習的語音合成傳統(tǒng)語音合成95機器聽覺基本概念機器聽覺的關鍵技術?聲音信號的采集與預處理?基于深度學習的聲音特征提取?聲音分類與識別算法機器聽覺的應用案例?智能家居中的語音助手?城市環(huán)境噪聲監(jiān)測?醫(yī)療健康領域的聲學分析機器聽覺面臨的挑戰(zhàn)與未來趨勢?數(shù)據(jù)隱私與安全問題?跨場景適應性挑戰(zhàn)?多模態(tài)融合與發(fā)展方向機器聽覺概述?定義與背景?機器聽覺與人類聽覺的比較?機器聽覺的主要應用領域96工業(yè)音頻信號采集97工業(yè)音頻信號采集-音頻信號的接收麥克風是最常見的聲音接收裝置之一,其原理是將聲音波動轉(zhuǎn)換成電信號以捕捉聲音。主要有兩種類型:動圈式和電容式。動圈式麥克風工作原理利用電磁感應結(jié)構(gòu)堅固耐用應用場合現(xiàn)場擴音、舞臺表演等技術特點輸出阻抗低不易受電纜電阻影響對溫濕度不敏感電容式麥克風特性卓越音質(zhì)更高靈敏度使用需求需要額外供電應用場合錄音棚、音樂制作等98工業(yè)音頻信號采集-音頻信號的接收麥克風性能的評估涉及多個核心指標,這些指標共同決定了麥克風在不同應用場景中的適用性和表現(xiàn)能力。99工業(yè)音頻信號采集-音頻信號的接收麥克風陣列通過使用兩個或更多的麥克風,提供了更全面的聲音采集和定位能力。100工業(yè)音頻信號采集-音頻信號采樣定義將模擬信號轉(zhuǎn)換為離散信號目的:復現(xiàn)原始語音采樣率計量單位:赫茲(Hz)描述:每秒采集聲音樣本的數(shù)量采樣過程定期抽樣模擬聲音信號記錄給定時刻聲音信號的幅度值轉(zhuǎn)化為一系列離散的數(shù)字信號點便于數(shù)字化處理、存儲、傳輸和處理101工業(yè)音頻信號采集-音頻信號采樣奈奎斯特采樣定理采樣率>最高頻率的兩倍避免折疊失真人耳感知范圍20Hz至20kHz發(fā)聲基音頻率:70Hz至450Hz諧波頻率:主要在4kHz以內(nèi),部分在4kHz至8kHz之間常見采樣率電話/嵌入式設備:8kHz手機/個人電腦:16kHzCD:44.1kHz(無損)102工業(yè)音頻信號采集-音頻信號量化聲音在被采樣后,模擬的電壓信號會變成離散的采樣值。聲音的量化過程涉及將每個采樣值在幅度上進行離散化處理,轉(zhuǎn)換為整型數(shù)值。103工業(yè)音頻信號采集-音頻信號量化

均勻量化:這種方法使用相等的量化間隔,即將整個輸入范圍等分為多個區(qū)間。每個區(qū)間的大小是相同的,導致在整個輸入范圍內(nèi)采樣點的分布均勻。均勻量化簡單直觀,但在處理一些具有不均勻分布的輸入信號時,可能會導致精度損失。非均勻量化:非均勻量化是根據(jù)信號的不同區(qū)間來確定量化間隔的。對于信號取值小的區(qū)間,其量化間隔也小,反之,量化間隔就大。這樣的設計允許在精度損失相對較小的情況下,使用較少的位數(shù)來表示信號。非均勻量化在處理輸入信號的動態(tài)范圍較大的情況下,能夠更好地適應信號的分布,減少存儲空間的需求。如果一個信號

x

被量化為最近的量化級

Q,且量化間隔為

,則量化后的信號xq可以近似表示為:104工業(yè)音頻信號采集-音頻信號量化105工業(yè)音頻信號采集-音頻信號編碼起源1975年:線性預測編碼(LPC)聲碼器用于分組語音電話會議傳輸里程碑1988年:4.8kb/s碼激勵線性預測編碼(CELP)標志語音編碼技術新階段互聯(lián)網(wǎng)時代的突破20世紀90年代:IP分組語音通信技術游戲內(nèi)的語音聊天功能國際標準:G.723.1(5.3/6.3kb/s)和G.729(8kb/s)語音存儲應用MP3高效有損壓縮格式壓縮比:10:1至12:1感知編碼:基于人耳聽覺特性特點:去除不易察覺的信息PCM采樣、量化、編碼優(yōu)點:無損音質(zhì)缺點:存儲空間大示例:寬帶PCM(16kHz采樣率,16位量化深度)文件格式:.raw,.wav改進:ADPCM,提高壓縮比106音頻信號特征-語譜圖語譜圖(Spectrogram)是一種表示語音信號頻率內(nèi)容隨時間變化的可視化工具。它通過二維圖像展示不同頻段的語音信號強度如何隨時間變化。短時傅立葉變換(STFT)將信號從時域轉(zhuǎn)換到頻域提供特定時間窗口內(nèi)的頻譜信息復數(shù)矩陣處理取模值(幅度),代表能量通常只取正頻率軸部分頻譜圖序列按時間順序排列頻譜幅度生成過程107音頻信號特征-濾波器組濾波器組(FilterBank,F(xiàn)Bank)是一種常用的語音信號特征提取方法,它主要基于人耳聽覺特性設計了一組濾波器來捕獲語音信號的頻譜特征。預加重強調(diào)高頻部分,減少低頻能量損失方法使用一階濾波器分幀將信號分成多個重疊幀參數(shù)每幀約20到40毫秒相鄰幀重疊方法移動窗口加窗(漢明窗或漢寧窗)生成過程短時傅里葉變換(STFT)將時域信號轉(zhuǎn)換為頻域信號作用分析短時段內(nèi)的頻譜信息結(jié)果每幀的頻譜能量分布濾波器組運算在頻域上進行濾波濾波器三角形濾波器組,梅爾濾波器組特性Mel頻率尺度上均勻分布模擬人耳頻率感知108工業(yè)音頻信號采集-梅爾倒頻譜系數(shù)109音頻信號特征-感知線性預測感知線性預測(PerceptualLinearPrediction,PLP)是一種基于人耳聽覺模型的特征參數(shù),它通過線性預測方法對語音信號進行解卷積處理,從而獲得相應的聲學特征參數(shù)。1.預加重、分幀、加窗處理:對語音信號進行預加重、分幀和加窗處理。2.計算短時功率譜:對每一幀的語音信號進行FFT,然后計算其幅值的平方,得到短時功率譜。3.臨界頻帶分析:將頻率轉(zhuǎn)換為Bark頻率,然后通過Mel濾波器組對功率譜進行濾波,得到每個濾波器通道的能量,這些通道對應于Bark頻帶。然后對這些能量進行加權(quán)求和,得到每個Bark頻帶的能量。4.等響度預加重:根據(jù)人耳的感知特性進行信號預處理,以增強高頻部分的能量。5.強度-響度轉(zhuǎn)換:進行強度-響度轉(zhuǎn)換,用于近似模擬聲音的強度與人耳感受的響度之間的關系,例如立方根壓縮6.線性預測:使用線性預測分析(LinearPredictionAnalysis)得到PLP特征參數(shù)。110語音識別語音識別(SpeechRecognition,SR)技術允許機器理解人類的口語,將聲音轉(zhuǎn)化為相應的文本信息,并執(zhí)行相關命令。111語音識別-高斯混合模型-隱馬爾可夫模型定義高斯混合模型-隱馬爾可夫模型(GMM-HMM),專為處理時間序列數(shù)據(jù)設計組成GMM(高斯混合模型)基于概率框架處理多維數(shù)據(jù)分布數(shù)據(jù)點視為多個高斯分布疊加HMM(隱馬爾可夫模型)時間序列的概率圖模型隱藏系統(tǒng)狀態(tài),通過可觀測數(shù)據(jù)推斷遵循馬爾可夫性質(zhì)結(jié)合HMM狀態(tài)用GMM描述觀測數(shù)據(jù)源自特定高斯混合模型捕獲時間序列動態(tài)轉(zhuǎn)移特性對狀態(tài)數(shù)據(jù)生成過程建模112語音識別-高斯混合模型-隱馬爾可夫模型語音識別應用特征提取原始語音信號轉(zhuǎn)化為聲學特征向量(MFCC)表征語音信號頻譜屬性建模HMM構(gòu)建語音信號整體模型狀態(tài)對應語音單元(音素、音節(jié)、單詞)揭示音素轉(zhuǎn)換規(guī)律細化每個HMM狀態(tài)用GMM細化描繪特征向量分布訓練與識別訓練采用EM算法最大化觀測數(shù)據(jù)似然度識別Viterbi算法尋找最優(yōu)狀態(tài)序列路徑推斷最可能詞匯序列113語音識別-高斯混合模型-隱馬爾可夫模型114語音識別-深度神經(jīng)網(wǎng)絡-隱馬爾可夫模型在新的DNN-HMM模型架構(gòu)中,DNN被用來直接預測每個狀態(tài)對應的觀察序列的概率分布。具體來說,DNN的輸出層節(jié)點與所有HMM狀態(tài)(對應于不同的音素,例如“a”,“o”等)的發(fā)射狀態(tài)一一對應。115語音識別-注意力模型類似于機器翻譯,語音識別也可以被視為序列對序列(Sequence-to-Sequence,Seq2Seq)問題,即將輸入的語音特征轉(zhuǎn)化為識別結(jié)果的任務。Encoder(聲學模型):通過循環(huán)神經(jīng)網(wǎng)絡(RNN),將輸入特征序列轉(zhuǎn)換為隱藏向量序列。這一部分主要負責將語音輸入映射為高層的特征表示,相當于聲學模型。Decoder(語言模型):計算輸出符號的概率分布,基于之前預測的標簽和輸入特征序列,即。這一部分相當于語言模型,負責生成目標文本序列。Attention(注意力模型):從Encoder輸出的所有隱藏向量序列中,計算注意力權(quán)重,用于構(gòu)建Decoder網(wǎng)絡的上下文向量。這個上下文向量包含了輸入序列中與當前時間步相關的信息,進而建立輸出序列與輸入序列之間的對齊關系。Attention機制通過學習輸入特征和模型輸出序列之間的對齊信息,指導Decoder的輸出。116語音合成18世紀:語音合成技術的探索最早可以追溯到這一時期,當時人們開始嘗試通過機械裝置來模擬人類聲音。20世紀初:隨著電子技術的進步,語音合成的研究也取得了實質(zhì)性的進展。特別是在1939年,貝爾實驗室開發(fā)的“VODER”系統(tǒng)被認為是電子語音合成的一個重要里程碑,它能夠在操作員控制下模擬語音。20世紀60年代:線性預測編碼(LPC)由瑞典語言學家引入,為語音合成提供了堅實的理論基礎,使得語音信號可以被數(shù)學模型精確地描述。20世紀80年代:此期間出現(xiàn)了多種技術進步,如混合型共振峰合成器和PSOLA(Pitch-SynchronousOverlapandAdd)算法,后者尤其解決了連續(xù)語音片段之間的平滑過渡問題,促進了語音合成技術的實用化。20世紀90年代:計算機技術的快速發(fā)展促進了基于語料庫的單元選擇和波形拼接技術的成熟,這些技術開始被廣泛應用并商業(yè)化。20世紀末:統(tǒng)計建模和機器學習技術開始應用于語音合成領域,提高了系統(tǒng)的適應性和靈活性。21世紀以來:隨著人工智能技術的興起,語音合成研究逐漸深入到了音質(zhì)優(yōu)化和情感表達等領域,力求實現(xiàn)更加自然和個性化的合成效果。同時,深度學習技術的引入,特別是深度神經(jīng)網(wǎng)絡的應用,極大地提升了合成語音的真實感和整體質(zhì)量,標志著語音合成技術達到了一個新的水平。117語音識別-傳統(tǒng)語音合成傳統(tǒng)的語音合成系統(tǒng)通常包括語言分析模塊和聲學系統(tǒng)模塊,也被稱為前端和后端兩個模塊。這兩個模塊協(xié)同工作,完成從輸入文本到最終語音波形的合成過程。語言分析模塊文本結(jié)構(gòu)與語種判斷語種識別根據(jù)語法規(guī)則切分句子文本標準化將數(shù)字和字母轉(zhuǎn)化為文字根據(jù)規(guī)則進行標準化文本轉(zhuǎn)音素中文使用拼音標注分詞和詞性句法分析判斷多音字讀音生成拼音序列讀韻律預測停頓位置與時長/重讀與輕讀預測/模仿自然韻律和語氣聲學系統(tǒng)模塊波形拼接(WaveformConcatenation)基于預錄制音頻片段選擇最匹配的音素、音節(jié)或單詞片段使用動態(tài)規(guī)劃優(yōu)化連接生成連續(xù)自然語音波形參數(shù)合成(ParameterSynthesis)分析真實人類語音信號提取聲學參數(shù)(如MFCCs、基頻、時長)建立文本到聲學參數(shù)的映射模型根據(jù)上下文預測聲學特征及發(fā)音時長利用預測參數(shù)通過聲碼器重建語音波形118語音識別-基于深度學習的語音合成定義通過神經(jīng)網(wǎng)絡直接從文本或注音字符生成音頻簡化傳統(tǒng)語言分析模塊優(yōu)勢強大的自我學習能力學習復雜特征降低對語言學知識的要求119語音識別-基于深度學習的語音合成WaveNet創(chuàng)新點殘差結(jié)構(gòu)膨脹因果卷積特點逐樣本生成音頻信號捕捉長期時間依賴關系局限性自回歸性質(zhì)合成速度慢不適合實時應用經(jīng)典模型Tacotron系列特點注意力機制文本到梅爾頻譜圖編碼器理解文本解碼器動態(tài)聚焦優(yōu)勢提高合成語音質(zhì)量減少對語言學知識依賴局限性處理韻律和語調(diào)不足依賴聲碼器轉(zhuǎn)換整體系統(tǒng)復雜度較高120語音識別-基于深度學習的語音合成經(jīng)典模型ParallelWaveGAN創(chuàng)新點生成對抗網(wǎng)絡(GAN)并行化生成器結(jié)構(gòu)特點提升合成速度保持音頻質(zhì)量通過判別器指導生成器優(yōu)勢實現(xiàn)實時語音合成應用廣泛移動設備、智能音箱、有聲讀物、個性化語音定制HFUT敬請指正121工業(yè)大數(shù)據(jù)與人工智能HFUT122教材簡介123多源信息融合的概念多源信息融合的分類第四章

工業(yè)中的感知智能

特征層決策層數(shù)據(jù)層多源信息融合的模型4.4多源信息融合Bowman數(shù)據(jù)融合與資源管理模型Luo-Kay模型聯(lián)合目標定位模型Pau模型多源信息融合的主要技術和方法基于人工智能的理論和方法經(jīng)典的理論和方法124多源信息融合的概念多源信息融合(Multi-SourceInformationFusion,MSIF)是20世紀70年代為了軍事應用提出的一項關鍵的信息處理技術。通過將來自不同來源、不同類型的多個信息源進行集成和處理,多源信息融合旨在獲取更全面、更準確的信息,這些信息源可能包括遙感數(shù)據(jù)、社交媒體數(shù)據(jù)、傳感器數(shù)據(jù)等各種來源125多源信息融合的概念-技術特點多層次處理結(jié)構(gòu)?數(shù)據(jù)預處理:清洗、標準化與格式轉(zhuǎn)換?特征提取:識別關鍵信息與模式?決策推理:基于多層次信息的綜合分析與判斷多元化信息集成?整合各類傳感器數(shù)據(jù):雷達、光學、紅外等?利用專家經(jīng)驗與歷史記錄:提升決策質(zhì)量?先進科技的應用:大數(shù)據(jù)、云計算與人工智能上下文與認知層增強?環(huán)境與時空變化的考量:動態(tài)調(diào)整信息處理策略?模擬人類理解方式:高層次信息處理機制?適配決策需求:情境感知與個性化信息服務面臨的挑戰(zhàn)與對策?解決信息異質(zhì)性:標準化與互操作性?應對內(nèi)容模糊性:模糊邏輯與不確定性管理?復雜性問題的處理:深度數(shù)學工具與算法優(yōu)化126多源信息融合的分類-數(shù)據(jù)層127多源信息融合的分類-數(shù)據(jù)層多樣性與數(shù)據(jù)層融合?多類型傳感器數(shù)據(jù)的整合挑戰(zhàn)?格式、單位和尺度差異下的數(shù)據(jù)處理方法?采用先進技術與方法實現(xiàn)異構(gòu)數(shù)據(jù)的有效融合大規(guī)模數(shù)據(jù)處理?大規(guī)模數(shù)據(jù)集帶來的計算與存儲挑戰(zhàn)?高效算法與技術在數(shù)據(jù)融合中的應用?保障數(shù)據(jù)融合效率與準確性的策略實時性與時效性要求?實時應用場景中數(shù)據(jù)融合的重要性?快速響應能力與實時數(shù)據(jù)處理技術?實時結(jié)果與反饋在不同場景中的應用去冗余性與數(shù)據(jù)利用率?數(shù)據(jù)去冗余技術的重要性與實現(xiàn)方法?提高數(shù)據(jù)利用率與價值的途徑?通過去冗去噪提升數(shù)據(jù)質(zhì)量和準確性128多源信息融合的分類-特征層129多源信息融合的分類-特征層特征層融合的優(yōu)勢?減少數(shù)據(jù)量:提高數(shù)據(jù)處理效率與實時性?提升數(shù)據(jù)表示:獲得更全面、豐富的信息?靈活性:適應不同場景的數(shù)據(jù)處理需求?特征提取算法的選擇與融合策略的應用特征層融合的具體實現(xiàn)?特征提取技術:從原始數(shù)據(jù)中提取關鍵信息?綜合分析方法:整合不同來源的特征信息?融合策略:提高數(shù)據(jù)處理精度與準確性130多源信息融合的分類-決策層131多源信息融合的分類-決策層決策層融合的優(yōu)勢?降低誤判率:提高整體決策系統(tǒng)的準確性?提升可靠性:通過綜合多個決策器的結(jié)果?增強魯棒性:減少個別決策器可能存在的偏差?全面信息整合:獲得更準確、可靠的決策依據(jù)決策層融合的具體實現(xiàn)?融合算法的選擇:基于不同決策器的特點?結(jié)果整合方法:加權(quán)平均、投票機制等面臨的挑戰(zhàn)與對策?計算時間與存儲空間需求增加:優(yōu)化算法與硬件支持?數(shù)據(jù)異質(zhì)性:解決不同來源數(shù)據(jù)的兼容性問題?內(nèi)容模糊性:應對不確定信息帶來的挑戰(zhàn)132多源信息融合的模型-聯(lián)合目標定位模型JDL模型概述?JDL模型的歷史背景與發(fā)展?JDL模型的基本概念與層次結(jié)構(gòu)?JDL模型與其他信息融合模型的對比JDL模型的核心層級?0級:數(shù)據(jù)融合?1級:狀態(tài)估計?2級:目標識別?3級:態(tài)勢評估?4級:影響評估JDL模型在軍事領域的應用?情報收集與分析?戰(zhàn)場態(tài)勢感知?決策支持系統(tǒng)JDL模型在非軍事領域的應用拓展?智慧城市中的信息融合?工業(yè)自動化與智能制造?環(huán)境監(jiān)測與災害預警133多源信息融合的模型-聯(lián)合目標定位模型134多源信息融合的模型-聯(lián)合目標定位模型數(shù)據(jù)源預處理?數(shù)據(jù)格式轉(zhuǎn)換:確保不同傳感器數(shù)據(jù)的一致性?數(shù)據(jù)校準與濾波:修正偏差,提高數(shù)據(jù)質(zhì)量?去噪處理:消除噪聲干擾,提升數(shù)據(jù)純凈度?時間與空間對齊:為后續(xù)融合做好準備目標優(yōu)化?目標辨識:分類與識別不同目標?目標追蹤:監(jiān)測目標狀態(tài)及運動方向?關聯(lián)數(shù)據(jù):確定目標位置和屬性態(tài)勢評估?相關性分析:評估對象或事件之間的關系?態(tài)勢評估:當前系統(tǒng)態(tài)勢的綜合評價?目標信息匯總:數(shù)量、類型、位置、速度等135多源信息融合的模型-聯(lián)合目標定位模型威脅評估?事件預報:預測當前形勢的發(fā)展趨勢?意圖分析:評估潛在威脅的意圖?薄弱點分析:找出我方部隊的薄弱環(huán)節(jié)?后果評估:分析可能產(chǎn)生的后果?威脅嚴重程度確定:深入評估威脅等級決策支持?融合過程評估:檢查正在進行的融合過程?指導建議提供:根據(jù)評估結(jié)果向用戶提供指導?任務優(yōu)先級設定:合理安排任務順序?資源最優(yōu)化配置:確保資源高效利用136多源信息融合的模型-聯(lián)合目標定位模型JDL模型的優(yōu)勢?通用性:跨領域的數(shù)據(jù)融合框架?清晰分階段流程:細化融合過程為多個明確階段?算法設計指導:為不同背景的研究者和實踐者提供統(tǒng)一指導?提升透明度與操作性:促進融合系統(tǒng)的高效設計與實施?階段性任務導向:增強針對性和實用性面臨的挑戰(zhàn)與不足?理論與實踐脫節(jié):高度抽象化導致應用時需額外定制?數(shù)據(jù)不確定性處理缺失:忽視現(xiàn)實數(shù)據(jù)的不穩(wěn)定性與質(zhì)量差異?缺乏動態(tài)反饋機制:限制了模型根據(jù)融合成效自我調(diào)整的能力?適應性與靈活性受限:影響系統(tǒng)的長期運行與優(yōu)化137多源信息融合的模型-Bowman數(shù)據(jù)融合與資源管理模型Bowman數(shù)據(jù)融合與資源管理模型(BowmanDF&RM)是1980年由Bowman提出的一種用于多傳感器環(huán)境下多目標識別和跟蹤的數(shù)據(jù)融合架構(gòu),通過數(shù)據(jù)融合層次樹和假設驗證循環(huán)來優(yōu)化信息處理。138多源信息融合的模型-Bowman數(shù)據(jù)融合與資源管理模型數(shù)據(jù)融合層?數(shù)據(jù)預處理與特征提取?關聯(lián)分析與信息整合?減少信息冗余性控制策略?協(xié)調(diào)數(shù)據(jù)融合與資源管理?動態(tài)調(diào)整資源分配與使用?最大化系統(tǒng)性能與效率模型優(yōu)勢?解決資源有限性與不確定性的挑戰(zhàn)?提供清晰的設計框架?提升系統(tǒng)性能與可靠性資源管理層?計算、存儲與通信資源的管理?基于需求的資源分配策略?確保系統(tǒng)的高效運行139多源信息融合的模型-Luo-Kay模型Luo-Kay模型是一種基于多傳感器集成的通用數(shù)據(jù)融合結(jié)構(gòu),由Luo和Kay于1988年提出。該模型旨在凸顯傳感器集成和傳感器融合之間的區(qū)別,并提供了一種分層的數(shù)據(jù)融合方法140多源信息融合的模型-Luo-Kay模型信號級別數(shù)據(jù)融合?原始信號數(shù)據(jù)的收集與傳輸?信號預處理與校正分層嵌入式中心融合架構(gòu)像素級別數(shù)據(jù)融合?圖像數(shù)據(jù)處理與融合?圖像增強與去噪特征級別數(shù)據(jù)融合?從圖像中提取特征信息?特征組合與目標識別符號級別數(shù)據(jù)融合?特征轉(zhuǎn)符號信息?決策支持與行為分析141多源信息融合的模型-Pau模型Pau模型是一種基于行為知識的數(shù)據(jù)融合模型,由法國學者Pau于1992年提出,是一種典型的分層結(jié)構(gòu)。在Pau模型中,首先從原始數(shù)據(jù)中提取特征向量,然后將這些向量對齊并與定義的屬性相關聯(lián)。數(shù)據(jù)信息在傳感器特征融合和數(shù)據(jù)分析層面進行組合、分析和聚類。最終決策階段由一組行為規(guī)則組成,這些規(guī)則可以通過顯式組合輸出提取出來142多源信息融合的模型-Pau模型143多源信息融合的模型-Pau模型底層:傳感器級別?傳感器數(shù)據(jù)的矢量化表示?原始觀測結(jié)果記錄分層嵌入式中心融合架構(gòu)中層:特征提取與關聯(lián)?提取傳感器數(shù)據(jù)特征?特征與屬性的關聯(lián)頂層:事件關聯(lián)與決策?特征向量與事件的關聯(lián)?基于數(shù)據(jù)分析的行為規(guī)則制定?適應性決策調(diào)整機制技術實現(xiàn)與應用領域?多層次數(shù)據(jù)融合技術實現(xiàn)?目標識別與行為分析應用?環(huán)境模型構(gòu)建與融合策略定義144多源信息融合的主要技術和方法-經(jīng)典的理論和方法經(jīng)典的信息融合理論主要建立在統(tǒng)計推理和估計的數(shù)學方法之上,通常用于不完整數(shù)據(jù)(即數(shù)據(jù)類型不一致、數(shù)據(jù)可信度低、數(shù)據(jù)信息不完整等)的融合處理。經(jīng)典信息融合理論中的兩種方法:1.基于概率建模的融合2.信念函數(shù)理論(BeliefFunctionTheory)145多源信息融合的主要技術和方法-經(jīng)典的理論和方法1.基于概率建模的融合貝葉斯融合原理貝葉斯概率論作為一種統(tǒng)計推斷方法,用統(tǒng)一的概率度量來表示各種不確定性。對于單一來源,貝葉斯公式根據(jù)假設的先驗概率和事件/觀察的條件概率的組合計算給定假設為真的概率。例如表示健康(H1)或生病(H2)等相互排斥的事件,以及表示為證據(jù)E的相應解釋事件(觀察)(可以表示“環(huán)境污染”,“健康飲食”等觀察結(jié)果)?;蛘摺耙?guī)律的睡眠模式”)。146多源信息融合的主要技術和方法-經(jīng)典的理論和方法1.基于概率建模的融合147多源信息融合的主要技術和方法-經(jīng)典的理論和方法2.信念函數(shù)理論信念函數(shù)理論的起源可以追溯到Dempster對MSIF中源狀態(tài)可靠性的研究,旨在理解和完善Fisher的概率推理方法。這一理論后來被Shafer以數(shù)學形式形式化,成為循證推理的一般理論,包括兩個主要部分:證據(jù)推理(Dempster-Shafer理論,DST)Dezert-Smarandache理論(DSmT)。148多源信息融合的主要技術和方法-經(jīng)典的理論和方法2.信念函數(shù)理論-信念函數(shù)理論的優(yōu)勢提供不同粒度級別的信息?識別結(jié)果可以是粗粒度的靜態(tài)和運動狀態(tài)?也可以是細粒度的狀態(tài),如躺、坐、站、走、跑和跳識別框架與基本信念賦值?設置Ω作為識別框架?使用基本信念分配函數(shù)m?系統(tǒng)地為所有潛在的識別結(jié)果分配置信度沖突系數(shù)與多源信息融合?每個輸入源被視為具有獨立基本信念賦值函數(shù)的證據(jù)?沖突系數(shù)K衡量不同證據(jù)來源給出的識別結(jié)果的沖突大小?Dempster-Shafer規(guī)則提供了一種系統(tǒng)的方法來融合和組合多個證據(jù)來源149多源信息融合的主要技術和方法-基于人工智能的理論和方法多視圖數(shù)據(jù)融合(MultiViewLearning,MVL)單一視圖分析的局限性?深度學習模型在單一視圖上的成就?復雜多源融合任務中單一視圖的不足?多視圖學習的概念與目標多視圖學習的核心在于構(gòu)建一個共享特征空間,整合多源特征或數(shù)據(jù),實現(xiàn)協(xié)同訓練。當前,主流策略聚焦于映射多視圖至統(tǒng)一空間,增強視圖間一致性。近幾十年,該領域在傳統(tǒng)機器學習及深度學習中均有重大突破,催生了協(xié)同訓練、多核學習、子空間學習等前沿算法。150多源信息融合的主要技術和方法-基于人工智能的理論和方法多視圖數(shù)據(jù)融合(MultiViewLearning,MVL)協(xié)同訓練的基礎與假設?基于散度的半監(jiān)督學習方法?標記數(shù)據(jù)上的分類器訓練與偽標簽生成?迭代過程中的分類器權(quán)重穩(wěn)定?充分性、兼容性與條件獨立性假設協(xié)同訓練的作用機制?利用不同視圖的信息增強訓練?增加訓練數(shù)據(jù)規(guī)模提升泛化能力?促進信息交互與學習提高效果?降低過擬合風險與提高魯棒性HFUT敬請指正151工業(yè)大數(shù)據(jù)與人工智能HFUT152教材簡介153人機交互基本概念體感交互第四章

工業(yè)中的感知智能

體感交互技術的分類體感交互技術的應用手勢交互4.5人機交互沉浸式交互交互界面設計154人機交互基本概念美國計算機協(xié)會下屬的人機交互興趣小組對此領域進行了定義:人機交互是一門致力于設計、評估并實現(xiàn)可供人類使用的互動式計算系統(tǒng)的科學,同時圍繞這些方法所衍生出的主要現(xiàn)象開展深入研究。155人機交互基本概念156體感交互157體感交互-體感交互技術的應用家庭智能設備與智能家居控制系統(tǒng)娛樂領域的游戲互動體驗158體感交互-體感交互技術的應用康復醫(yī)學中的運動健康訓練系統(tǒng)電子商務虛擬試衣間159體感交互-體感交互技術的分類觸覺技術知覺技術160手勢交互手勢檢測:識別用戶做出的手勢開始和結(jié)束的時間點。手勢跟蹤:持續(xù)監(jiān)測手勢的變化軌跡。手勢識別:解析手勢的含義,并將其轉(zhuǎn)換為相應的命令或動作。161沉浸式交互虛擬現(xiàn)實技術的興起背景:信息技術的發(fā)展和各行各業(yè)對計算機應用需求的增長。關注:在中國國家自然科學基金會、國家重點基礎研究發(fā)展計劃等項目的支持下,虛擬現(xiàn)實技術成為熱點。研發(fā)進展:頂尖團隊推出沉浸式設備(如暴風魔鏡、OculusRift、GearVR、ProjectMorpheus),推動技術革新。162沉浸式交互技術實現(xiàn):通過頭戴顯示器、數(shù)據(jù)手套等設備創(chuàng)建全方位感知的虛擬世界。用戶體驗:封鎖感官接口,精確追蹤用戶視線、頭部動作及手勢,實現(xiàn)流暢互動。核心優(yōu)勢:極大地增強沉浸感與真實體驗。對比傳統(tǒng)二維展示:提供更直觀的虛擬場景體驗,如飛行或潛水。信息展示:生動、全面的信息展示方式,優(yōu)化用戶體驗。商業(yè)價值:增強產(chǎn)品展示吸引力,提升購買意愿,降低成本。163交互界面設計在設計交互界面時,首要目標是確保界面組件、布局和風格等視覺元素能夠有效地支持并優(yōu)化用戶的交互行為,通過清晰定義產(chǎn)品的交互邏輯,創(chuàng)造直觀易用的設計,同時保持視覺設計的藝術性和功能性,以提升整體用戶體驗。164交互界面設計-視覺設計過程研究用戶是設計的起點,通過訪談了解用戶情感聯(lián)系、環(huán)境因素及交互中的挑戰(zhàn)與期望。研究用戶通過研究形成的用戶模式和關鍵詞為設計團隊提供了明確方向,使視覺設計師能基于體驗關鍵字創(chuàng)造積極的第一印象和持續(xù)的情感體驗,從而提出更周全的設計方案并獲得實際反饋。形成視覺策略165交互界面設計-視覺設計基本原則對齊:保持界面元素間的對齊關系有助于營造視覺一致性,增強可讀性和舒適度。一致性:在整個系統(tǒng)內(nèi)保持設計的一致性,使用戶能快速學習并遷移知識到新場景。強調(diào):通過色彩、大小或位置等方式突出重要信息,引導用戶的注意力。重復:在設計中采用統(tǒng)一的模式和樣式,幫助用戶建立熟悉感和操作習慣。映射:直觀反映界面元素與其功能之間的關聯(lián),讓用戶能夠迅速理解并執(zhí)行操作。沉浸式體驗:在特定應用場景(如游戲、VR)中創(chuàng)造沉浸式的環(huán)境,提升用戶參與度和滿意度。功能可見性:保證關鍵功能的明顯可見,便于用戶隨時了解系統(tǒng)的狀態(tài)和可用功能。易于識別:確保信息和控件具有高辨識度,尤其是針對視力較弱或其他特殊群體用戶。HFUT敬請指正166工業(yè)大數(shù)據(jù)與人工智能HFUT167主講人:徐娟

副教授基于語音指令的目標檢測系統(tǒng)實驗

168實驗課目標檢測169實驗背景介紹目標檢測是計算機視覺中的一個重要任務,它旨在從圖像或視頻中定位并識別出特定類別的對象。這項技術通常包括兩個主要步驟:對象定位和分類。目標檢測可以應用于許多場景,如自動駕駛、安全監(jiān)控、醫(yī)學影像分析等。主要組成部分:特征提?。菏褂镁矸e神經(jīng)網(wǎng)絡(CNN)或其他方法來提取圖像中的特征。候選區(qū)域生成:確定圖像中可能包含對象的位置。分類與回歸:對每個候選區(qū)域進行分類判斷,并調(diào)整邊界框以更精確地定位對象。目標檢測算法分類:兩階段檢測器:如R-CNN,FastR-CNN和FasterR-CNN,這類方法先生成候選區(qū)域,然后對每個區(qū)域進行分類和位置修正。單階段檢測器:如YOLO(YouOnlyLookOnce)和SSD(SingleShotMultiBoxDetector),這類算法直接從輸入圖像中預測邊界框和類別概率,速度較快但精度可能略低。語音識別170實驗背景介紹語音識別技術是一種能夠?qū)⑷祟愓Z音轉(zhuǎn)換成可讀文本的技術。這項技術在日常生活中有著廣泛的應用,例如語音助手、電話自動客服系統(tǒng)、語音輸入法等?;玖鞒蹋赫Z音采集:通過麥克風捕捉說話人的聲音。預處理:對音頻信號進行降噪、分幀等預處理操作。特征提?。簭囊纛l信號中提取有用的特征,如梅爾頻率倒譜系數(shù)(MFCC)。聲學模型:識別聲音片段對應的發(fā)音單元(如音素),常用的模型有隱馬爾科夫模型(HMM)、深度神經(jīng)網(wǎng)絡(DNN)等。語言模型:根據(jù)上下文確定最有可能的詞匯序列。解碼器:結(jié)合聲學模型和語言模型輸出最終的文本結(jié)果。融合兩種技術的意義171實驗背景介紹融合目標檢測技術和語音識別技術的意義在于創(chuàng)建更加智能和直觀的人機交互系統(tǒng)。這兩種技術結(jié)合可以實現(xiàn)更復雜的應用場景,為用戶提供更加自然、便捷的服務體驗。融合的意義:增強用戶體驗:通過同時處理視覺和聽覺信息,系統(tǒng)可以更好地理解用戶的意圖和需求。提高安全性:在一些需要高度注意的場景下(如駕駛輔助系統(tǒng)),同時使用視覺和聽覺信息可以提供更全面的環(huán)境感知能力。拓展應用場景:融合多種感知方式可以開拓新的應用場景,比如無障礙設計、智能客服等。實現(xiàn)個性化服務:結(jié)合用戶的行為習慣和個人偏好,提供定制化的服務體驗。172實驗環(huán)境硬件環(huán)境:i5及以上的CPU,GTX1060及以上的GPU軟件環(huán)境:操作系統(tǒng):Windows10或Ubuntu18.04及以上版本;Python:版本3.8或更高,推薦使用Anaconda進行環(huán)境管理。/download

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論