版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、2022/8/7NJNU15.1 文本與文本處理文本:基于特定字符集的、按一定格式組織起來的、具有上下文相關(guān)性的一個字符流,每個字符均使用編碼表示。文本展現(xiàn)(閱讀器)文本處理(文本處理軟件)文本生成電子文本文本編輯(編輯器)格式化的電子文本文本存儲與傳輸2022/8/7NJNU21、西文字符的編碼 西文字符集(拉丁字母、數(shù)字、標點等組成) 標準 ASCII 字符集ASCII 字符集采用 7 位編碼每個 ASCII 字符以一個字節(jié)存放 擴充 ASCII 字符集:標準ASCII 碼 + 擴展ASCII 碼 一、字符的編碼2022/8/7NJNU32. 漢字的編碼漢字是記錄漢語(國語,華語)的文字,
2、屬于表意文字,它用符號直接表達詞或詞素。漢字的特點:數(shù)量大(我國漢字自古至今累計已超過6萬字多個國家和地區(qū)使用:港臺地區(qū),日、韓、朝、新、馬等字形復雜,同音字多,異體字多。我國漢字編碼的國家標準:GB2312(6763個常用簡體漢字和682個非漢字字符 )GBK (20902個CJK漢字和符號)UCS /Unicode與GB180302022/8/7NJNU4(1) GB2312 1980 漢字編碼 包括 6763 個漢字和 682 個非漢字字符 GB2312 構(gòu)成:一級常用漢字 3755 個,按漢語拼音排列二級常用漢字 3008 個,按偏旁部首排列非漢字字符 682 個 GB2312 構(gòu)成一
3、個二維平面,分成 94 行和 94列, 行號稱為區(qū)號,列號稱為位號,兩者組合就是漢字編碼。稱為區(qū)位碼。 區(qū)位碼的區(qū)號和位號分別加上 20H,得到國標碼。 國標碼的兩個字節(jié)的最高位置 1,得到 PC 機常用的 機內(nèi)碼2022/8/7NJNU5以漢字“啊”為例:區(qū)位碼為:1601,表示區(qū)號16位號01 對應二進制數(shù)為:00010000,00000001國標碼對應二進制數(shù)為:00110000,00100001B機內(nèi)碼對應二進制數(shù)為:10110000,10100001B2022/8/7NJNU6(2) GBK漢字內(nèi)碼擴充規(guī)范總計 23940 個碼位,共收入 21003 個漢字和883圖形符號簡體和繁體
4、漢字在同一個字符集中;包含了中、日、韓認同的全部CJK漢字;與GB2312-80保持向下兼容;2022/8/7NJNU73、UCS/Unicode 與 GB18030 漢字編碼標準(1) 通用編碼字符集 UCS/UnicodeUCS 實現(xiàn)了對所有字符統(tǒng)一編碼(2) GB18030 編碼(2000年)目的是向 UCS 過渡,同時與 GB2312、GBK 兼容,目前已經(jīng)在許多計算機系統(tǒng)中使用。用 1、2 或 4 字節(jié)編碼,漢字數(shù)達到 27000 多個2022/8/7NJNU8二、文本的準備 文本信息的輸入:2022/8/7NJNU9漢字鍵盤輸入漢字的鍵盤輸入編碼輸入編碼要求:易學、易記、效率高、
5、重碼少、容量大輸入編碼分類:數(shù)字編碼字音編碼字形編碼形音編碼用不同的輸入編碼方法輸入同一個漢字,其內(nèi)碼是一樣的2022/8/7NJNU10聯(lián)機手寫漢字識別原理:用專用筆在專用書寫板上書寫漢字 (或符號) 計算機實時自動識別 用該漢字 (或符號) 對應的代碼進行保存例: “漢王”手寫筆 正識率達到 90% 以上,識別速度超過12字/秒2022/8/7NJNU11漢語語音識別分類: 孤立語音/連續(xù)語音識別 小詞匯量/大詞匯量語音識別 特定人/非特定人語音識別現(xiàn)狀:特定人連續(xù)語音識別率已達到 90% 以上目標:非特定人大詞匯量的連續(xù)語音識別2022/8/7NJNU124.印刷體漢字識別輸入對于將現(xiàn)存
6、的大量書、報、刊物、檔案、資料等輸入計算機是非常重要的手段。5.脫機手寫漢字識別輸入是一種用于將預先手寫好的文稿輸入計算機的方法,也是計算機字符識別中最困難的一個問題。2022/8/7NJNU131、簡單文本(純文本)除了表達正文的字符和幾個打印控制字符外,不含其它格式信息和結(jié)構(gòu)信息。簡單文本又稱為純文本,ASCII文本,其文件的后綴為“ .txt”(文本文件)簡單文本為一種線性結(jié)構(gòu),由若干行構(gòu)成,每行由若干個字構(gòu)成2、豐富格式文本在簡單文本中增加格式控制和結(jié)構(gòu)說明信息,構(gòu)成豐富格式文本RTF是一種中間格式,它的目的是使各種豐富格式文本相互交換使用,以兼容不同格式文本。三、文本的類型2022/
7、8/7NJNU143、超文本超文本采用一種網(wǎng)狀結(jié)構(gòu)來組織信息一個超文本由若干個文本塊組成,這些文本塊稱為節(jié)點節(jié)點可以是文字、圖形、圖像、聲音或視頻基于多媒體信息結(jié)點的超文本,也稱為超媒體。例:Windows中的 “幫助” 文件就是一種典型的超文本文本的類型2022/8/7NJNU15超文本結(jié)構(gòu) a1 a2 b2 c2 f1d1c1 b1 e1 g1h1a32022/8/7NJNU16四、文本的編輯與處理1、文本編輯與文本處理 文本編輯:內(nèi)容:對字(詞, 句)、段落、頁面等進行添加、刪除、 修改等操作 字的處理 段落的處理 頁面布局的處理目的:使文本內(nèi)容正確,版面清晰整齊、美觀大方 所見即所得:
8、編輯的效果在屏幕上可以立即看到在屏幕上看到的效果與打印出來的效果一致2022/8/7NJNU172. 文本處理軟件(1)面向通信的文本處理軟件 : Outlook Express (2)面向辦公的文本處理軟件 : MS Word , WPS2000(3)面向印刷出版的文本處理軟件: “飛騰”排版軟件,PageMaker,PDF Writer (4)面向網(wǎng)絡信息發(fā)布和電子出版的文本處理軟件: FrontPage, PDF Writer 2022/8/7NJNU18五、文本的展現(xiàn)過程:對文本的格式描述進行解釋生成文字和圖表的映像(bitmap)傳送到顯示器或打印機輸出承擔文本輸出任務的軟件稱為文本
9、閱讀器或瀏覽器:嵌入在文本編輯(處理)軟件中,如微軟的 Word獨立的軟件:如 Adobe 公司的 Acrobat Reader,微軟公司的 IE 等 2022/8/7NJNU19輸出過程中字形的生成 文本展現(xiàn)過程中,字符形狀的生成是一個關(guān)鍵先根據(jù)字符的字體確定相應的字型庫(font)再按照該字符的代碼從字型庫中取出該字符的形狀描述信息然后按形狀描述信息生成字形,并按照字號大小及有關(guān)屬性(粗體、斜體、下橫線)將字形作必要的變換最后將變換得到的字形放置在頁面的指定位置處2022/8/7NJNU20字形描述方法點陣字形:“1”表示對應位置是黑點 “0”表示是空白輪廓字形:用曲線描述,精度高、字形可
10、變, 如:Windows 中的 TrueType 字符的點陣描述字符的輪廓描述2022/8/7NJNU215.2 圖像與圖形數(shù)字圖像按其生成方法可以分為兩大類:通過數(shù)字化設(shè)備獲取的圖像,它們稱為取樣圖像(sampled image)、點陣圖像(dot matrix image)、位圖圖像(bitmap image),以下簡稱圖像(image)計算機合成的圖像(synthetic image),它們稱為矢量圖形(vector graphics),或簡稱圖形(graphics)2022/8/7NJNU221. 圖像的數(shù)字化(1)掃描 : 將圖像分成 M * N 個點進行取樣(2)分色 : 將每個點
11、分成 R、G、B 三個基色。(3)取樣 :測量每個取樣點每個分量的亮度值 (4)量化 :對每個分量進行 A / D 轉(zhuǎn)換,再用 數(shù)字量表示一、圖像的獲取2022/8/7NJNU232. 數(shù)字圖像獲取設(shè)備 功能:將現(xiàn)實的景物輸入到計算機內(nèi) 種類:2D 掃描儀、數(shù)碼相機、3D 掃描儀等2022/8/7NJNU24二、圖像的表示與壓縮編碼1. 圖像的表示方法與主要參數(shù) 每個取樣點稱為像素 彩色圖像用三個矩陣來表示矩陣的行數(shù)稱為垂直分辯率矩陣的列數(shù)稱為水平分辯率矩陣的元素值是像素顏色分量的亮度值 一幅取樣圖像,除了像素數(shù)據(jù)外,還有以下屬性:圖像分辯率:圖像在屏幕上的大小顏色空間的類型:描述彩色圖像所使
12、用的顏色描述方法(常用的有RGB、CMYK、HSV、YUV)像素深度:各種顏色(亮度)分量的位數(shù)之和2022/8/7NJNU25彩色圖像的表示藍色分量綠色分量紅色分量2022/8/7NJNU262. 圖像的壓縮編碼圖像數(shù)據(jù)量的計算公式(以字節(jié)為單位): 數(shù)據(jù)量 = 圖像水平分辨率圖像垂直分辨率像素深度8 數(shù)據(jù)壓縮的必要性數(shù)據(jù)壓縮的兩種類型:無損壓縮有損壓縮壓縮編碼方法的評價:壓縮倍數(shù)的大小,重建圖像的質(zhì)量(有損壓縮時)壓縮算法的復雜程度 2022/8/7NJNU27圖像壓縮編碼的國際標準 JPEGJPEG20002022/8/7NJNU283. 常用圖像文件格式要求:熟悉常用的圖像文件名了解它
13、們有什么特性和適用的場合2022/8/7NJNU29數(shù)字圖象處理與應用1.數(shù)字圖象的處理圖象處理的主要目的有以下幾個方面:(1)提高圖象的視覺質(zhì)量(2)圖象復原與重建(3)圖象分析(4)圖象數(shù)據(jù)的變換、編碼和數(shù)據(jù)壓縮(5)圖象的存儲、管理、檢索等。2022/8/7NJNU30常用(通用)圖像編輯軟件微軟公司 畫圖軟件(paint):可查看和編輯處理.jpg、.gif 或 .bmp圖像微軟公司 imaging for windowsMicrosoft Photo EditorUlead system 的PhotoImpactACD System公司的ACDSee32Adobe PhotoShop
14、2022/8/7NJNU313. 數(shù)字圖像的應用(1) 圖像通信。包括圖像傳輸、電視電話、電視會議 等。(2) 遙感。(3) 醫(yī)療診斷。(4) 工業(yè)生產(chǎn)中的應用。如產(chǎn)品質(zhì)量檢測,生產(chǎn)過程 的自動控制等。(5) 機器人視覺。對三維景物進行理解與識別。(6) 軍事、公安、檔案管理等其他方面的應用。如軍 事目標的偵察,制導和警戒,自動火器的控制及 反偽裝,指紋、手跡、印章、人像等的處理和辨 識,古跡和圖片檔案的修復與管理等。 2022/8/7NJNU32四、計算機圖形1、景物形狀的計算機表示使用算法或幾何要素(如點、線、面、體的位置、形狀和大?。┘氨砻娌牧系男再|(zhì),在計算機中對景物和形體(無論是真實的
15、還是假想的)進行描述(modeling)需要顯示時,計算機根據(jù)觀察者的位置及光線的設(shè)定,生成該景物的圖像。 2022/8/7NJNU33 2.計算機合成圖像的應用(1) 計算機輔助設(shè)計和輔助制造(CADCAM)(2) 利用計算機生成各種地形圖、交通圖、天氣圖、 海洋圖、石油開采圖等(3) 作戰(zhàn)指揮和軍事訓練(4) 計算機動畫和計算機藝術(shù)(5) 其它:電子出版、數(shù)據(jù)處理、工業(yè)監(jiān)控、 輔助教學、軟件工程等 2022/8/7NJNU343. 矢量繪圖軟件專業(yè)繪圖軟件: AutoCADMAPInfo、ARCInfo辦公與事務處理、平面設(shè)計、電子出版等領(lǐng)域:Corel公司的CorelDraw,Adobe
16、 公司的Illustrator,Macromedia公司的FreeHand,微軟公司的Microsoft Visio等內(nèi)嵌的繪圖軟件 2022/8/7NJNU355.3 數(shù)字聲音及應用數(shù)字聲音的特點:是一種連續(xù)媒體,傳輸與播放有實時性要求數(shù)據(jù)量大,對存儲和傳輸?shù)囊蠛芨摺?數(shù)字聲音的類型:取樣(波形)聲音語音(3003400Hz)全頻帶聲音(2020kHz)計算機合成聲音合成音樂(MIDI)合成語音2022/8/7NJNU36一、波形聲音的獲取和播放1、聲音信號的數(shù)字化:取樣(sampling)量化(quantization,AD conversion )編碼(encoding)模擬聲音信號量
17、 化數(shù)字聲音01100011001編 碼取 樣2022/8/7NJNU372. 波形聲音的獲取設(shè)備聯(lián)機獲取設(shè)備(聲卡)麥克風(microphone)聲音卡(sound card)聲波轉(zhuǎn)換為電信號取樣、量化、壓縮、編碼、模擬聲音數(shù)字聲音脫機獲取設(shè)備:數(shù)碼錄音筆2022/8/7NJNU38聲音錄制與播放的處理過程二、波形聲音的表示與壓縮編碼1、波形聲音的主要參數(shù)數(shù)字化的波形聲音是一種二進制表示的串行比特流(bitstream)形式按一定的標準或規(guī)范進行了壓縮編碼數(shù)據(jù)的結(jié)構(gòu)按物理屬性(時間,聲道)進行組織,語義上沒有結(jié)構(gòu)化。2022/8/7NJNU40波形聲音的數(shù)據(jù)壓縮主要參數(shù):sampling f
18、requency(取樣頻率)quantization bits(量化位數(shù))number of sound channels(聲道數(shù)目)encoding method ( compression method )(壓縮編碼方法)bit rate(碼率,比特率),每秒鐘的數(shù)據(jù)量波形聲音的碼率 = 取樣頻率 量化位數(shù) 聲道數(shù) 2022/8/7NJNU412.全頻帶數(shù)字音頻的壓縮編碼2022/8/7NJNU42流媒體技術(shù)、流媒體流媒體技術(shù)就是允許用戶一邊下載一邊收看 (聽) 音視頻連續(xù)媒體的技術(shù)。 使用流式傳輸技術(shù)的音/視頻媒體,稱為流媒體。1995年出現(xiàn),優(yōu)點:1. 等待時間大大縮短; 2. 減少了
19、對緩沖容量的需求;3. 降低了對網(wǎng)絡帶寬的要求。常見流媒體音頻REAL NETWORK 公司的RA(REAL AUDIO)微軟公司的WMA(WINDOWS MEDIA AUDIO)2022/8/7NJNU43四、計算機合成聲音計算機合成語音計算機合成音樂2022/8/7NJNU441. 音樂合成(MIDI)樂曲的計算機表示方法MIDI Message樂曲的制作軟件音序器存放樂曲的文件 .MID 文件播放樂曲的軟件 媒體播放器樂器聲音的生成 聲卡上的音樂合成器 視頻(video):隨時間變化其內(nèi)容的一組圖像(24,25,30 幀/秒), 又叫運動圖像或活動圖像(motion picture)常見
20、視頻信號:電視,電影,計算機動畫等視頻信號的特點:內(nèi)容隨時間而變化伴隨有與畫面動作同步的聲音(伴音)5.4 數(shù)字視頻及應用2022/8/7NJNU46一、數(shù)字視頻基礎(chǔ)1、電視基本知識電視畫面采用隔行掃描方式,圖像分奇數(shù)場和偶數(shù)場我國采用 PAL 制式,幀頻為 25 幀/秒,場頻為 50 場/秒2022/8/7NJNU47電視信號的彩色空間PAL制式的彩色電視信號在遠距離傳輸時,使用亮度信號Y和兩個色度信號U、V來表示,與RGB表示進行轉(zhuǎn)換2022/8/7NJNU48電視信號的彩色空間使用Y、U,V彩色空間的優(yōu)點:Y和U,V是獨立的,因此彩色電視和黑白電視都可以使用,Y分量可由黑白電視接收機直接
21、使用而不需做任何進一步的處理;可以利用人的視覺特性來節(jié)省信號的帶寬和功率,通過選擇合適的顏色模型,可以使U,V的帶寬明顯低于Y的帶寬,而又不明顯影響彩色圖像的質(zhì)量。2022/8/7NJNU49數(shù)字攝像頭最高分辨率為 640480,一般都是352288速度一般在30fps (每秒30幀) 以下鏡頭的視角可達到45-60度 支持USB接口 或 FireWire(火線)接口2022/8/7NJNU50數(shù)碼攝像機 提供480線以上的分辨率,清晰度高自動對焦(Auto focus),自動曝光(Auto Expose) 使用M-JPEG或MPEG-2進行壓縮編碼,然后記錄在磁帶或磁盤上提供錄音功能數(shù)據(jù)量很大,采用USB接口或 IEEE1394 (FireWire)接口,后者傳輸速率可以達到200-800MB/s。 2022/8/7NJNU51五、數(shù)字視頻的應用數(shù)字視頻
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 非織造布卷繞分切工沖突解決測試考核試卷含答案
- 平版制版員誠信品質(zhì)考核試卷含答案
- 電光源電路部件制造工安全實操水平考核試卷含答案
- 2025年環(huán)衛(wèi)清潔裝備項目發(fā)展計劃
- 2026年重生式消費項目評估報告
- 供水業(yè)務知識題庫及答案
- 施工安全消防措施
- 導管滑脫應急預案演練腳本
- 2025年AI自然語言處理技術(shù)培訓專項試題及答案
- 2025年單位駕駛員年度工作總結(jié)
- 2026年重慶市江津區(qū)社區(qū)專職人員招聘(642人)筆試備考試題及答案解析
- 2026年思明區(qū)公開招聘社區(qū)工作者考試備考題庫及完整答案詳解1套
- 【四年級】【數(shù)學】【秋季上】期末家長會:數(shù)海引航愛伴成長【課件】
- 小學音樂教師年度述職報告范本
- 2025年新版八年級上冊歷史期末考試模擬試卷試卷 3套(含答案)
- 2026福建廈門市校園招聘中小學幼兒園中職學校教師346人筆試參考題庫及答案解析
- 2025年合肥經(jīng)開投資促進有限公司公開招聘11人筆試參考題庫及答案解析
- 儲能電站電力銷售協(xié)議2025
- 腫瘤科人文關(guān)懷護理
- GB/T 1048-2019管道元件公稱壓力的定義和選用
- 臨床見習帶教2課件
評論
0/150
提交評論