網(wǎng)絡(luò)多媒體素材加工_第1頁
網(wǎng)絡(luò)多媒體素材加工_第2頁
網(wǎng)絡(luò)多媒體素材加工_第3頁
網(wǎng)絡(luò)多媒體素材加工_第4頁
網(wǎng)絡(luò)多媒體素材加工_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

網(wǎng)絡(luò)多媒體素材加工第1頁,共26頁,2023年,2月20日,星期六第2章文字素材采集與處理2.1文字素材基礎(chǔ)2.2使用OCR工具軟件轉(zhuǎn)換圖像文字2.3語音識別與手寫輸入技術(shù)2.4文字素材采集實訓(xùn)第2頁,共26頁,2023年,2月20日,星期六2.1文字素材基礎(chǔ)2.1.1文字素材采集與編輯2.1.2文字編輯常用工具軟件2.1.3常用文本文件格式及其轉(zhuǎn)換第3頁,共26頁,2023年,2月20日,星期六2.1.1文字素材采集與編輯一般根據(jù)文字素材在計算機(jī)中的存儲和顯示方式不同,可將文字素材分為文本文字素材和圖像文字素材兩類。文本文字是指以文本文件格式存在的文字素材,如TXT、DOC等格式的文本文字;圖像文字是指以圖像文件格式存在的文字素材,如BMP、TIF等格式的文件。第4頁,共26頁,2023年,2月20日,星期六

圖2-1文本文字圖2-2圖像文字1.文本文字與圖像文字第5頁,共26頁,2023年,2月20日,星期六2.文字素材的采集鍵盤輸入:通過鍵盤,可以將中文字、英文字母、數(shù)字、標(biāo)點符號等輸入到計算機(jī)中。掃描輸入:通過掃描儀將紙上的文字轉(zhuǎn)換為計算機(jī)可處理的信息,一般用于大量文字的快速錄入。語音輸入:語音輸入設(shè)備向計算機(jī)輸入信息的過程,包括命令控制和聽寫兩個功能。手寫輸入:用書寫筆在與計算機(jī)相連的書寫板上寫字,用壓敏或電磁感應(yīng)等方式將筆在運動中的坐標(biāo)輸入計算機(jī),識別軟件根據(jù)采集到的筆跡之間的位置關(guān)系和時間關(guān)系信息來識別所寫的文字,并把結(jié)果顯示在屏幕上。第6頁,共26頁,2023年,2月20日,星期六2.1.2文字編輯常用工具軟件Windows操作系統(tǒng)自帶的編輯工具(記事本、寫字板)MicrosoftWordWPSOffice金山文字2003第7頁,共26頁,2023年,2月20日,星期六2.1.3常用文本文件格式及其轉(zhuǎn)換1.常用文本文件格式2.DOC文件與PDF文件的格式轉(zhuǎn)換3.DOC文件格式與CAJ文件格式間的相互轉(zhuǎn)換第8頁,共26頁,2023年,2月20日,星期六1.常用文本文件格式TXT格式:TXT是一種純文本格式文件,可由記事本處理創(chuàng)建。CSV格式:CSV(CommaSeparatedValues)文件格式也是一種純文本文件,常用于不同應(yīng)用程序之間交換數(shù)據(jù),它可以被任何文本編輯器調(diào)用、編輯、修改。第9頁,共26頁,2023年,2月20日,星期六1.常用文本文件格式DOC格式:一種通用的PC格式化文本文件格式,由MicrosoftWord或WordPerfectforWindows創(chuàng)建,可以包含更多的內(nèi)容,建立超鏈接等,表現(xiàn)力強(qiáng)、操作簡便。RTF格式:RTF(RichTextFormat)格式是微軟公司的寫字板采用的標(biāo)準(zhǔn)格式。第10頁,共26頁,2023年,2月20日,星期六1.常用文本文件格式WPS格式:WPS文件是作為目前國內(nèi)唯一較成熟的擁有完全自主知識產(chǎn)權(quán)的辦公系統(tǒng)軟件——WPSOffice生成的文本文件格式。PDF格式:PDF(PortableDocumentFormat便攜式文檔格式)文件格式是Adobe公司開發(fā)的電子讀物文件格式。CAJ格式:CAJ文件是《中國學(xué)術(shù)期刊全文數(shù)據(jù)庫》的專用格式,由中國學(xué)術(shù)期刊(光盤版)電子雜志社開發(fā)制作。第11頁,共26頁,2023年,2月20日,星期六2.DOC文件與PDF文件的格式轉(zhuǎn)換(1)DOC格式文件轉(zhuǎn)換為PDF格式文件將DOC格式轉(zhuǎn)換為PDF格式比較容易,如果系統(tǒng)完全安裝AdobeAcrobat7.0Professional,就可以通過下列方式進(jìn)行轉(zhuǎn)換:使用“快捷菜單”進(jìn)行轉(zhuǎn)換利用AcrobatPDFMaker利用AcrobatPDF打印機(jī)轉(zhuǎn)換

第12頁,共26頁,2023年,2月20日,星期六①使用“快捷菜單”進(jìn)行轉(zhuǎn)換

圖2-3快捷菜單圖2-4SaveAdobeFileAs對話框第13頁,共26頁,2023年,2月20日,星期六②利用AcrobatPDFMaker

圖2-5AcrobatPDFMaker菜單欄圖2-6AdobePDF菜單第14頁,共26頁,2023年,2月20日,星期六③利用AcrobatPDF打印機(jī)轉(zhuǎn)換

圖2-7AcrobatPDF打印機(jī)圖2-8選擇AcrobatPDF打印機(jī)第15頁,共26頁,2023年,2月20日,星期六(2)PDF文件轉(zhuǎn)換為DOC格式文件①直接從PDF文件復(fù)制文本到DOC文件②利用AdobeAcrobat自身轉(zhuǎn)換功能③借助格式轉(zhuǎn)換工具軟件(ScanSoft軟件)④圖像形式PDF文件的轉(zhuǎn)換⑤利用CAJViewer的OCR功能第16頁,共26頁,2023年,2月20日,星期六①直接從PDF文件復(fù)制文本到DOC文件圖2-9從PDF文件復(fù)制文本到DOC文件第17頁,共26頁,2023年,2月20日,星期六②利用AdobeAcrobat自身轉(zhuǎn)換功能AdobeAcrobat提供了PDF格式向DOC格式的轉(zhuǎn)換功能。執(zhí)行【文件】→【另存為】命令,在對話框中選擇【保存類型】為MicrosoftWord文檔,單擊【保存】。第18頁,共26頁,2023年,2月20日,星期六③借助格式轉(zhuǎn)換工具軟件PDF向DOC格式轉(zhuǎn)換的工具軟件比較多,其中ScanSoftPDFConverterforMicrosoftWord是由ScanSoft公司與微軟共同開發(fā)的一個全新的Office2003插件。該插件可以通過Word直接將PDF文檔轉(zhuǎn)換為Word文檔,并且完全保留原來的格式和版面設(shè)計。第19頁,共26頁,2023年,2月20日,星期六④圖像形式PDF文件的轉(zhuǎn)換對于圖像形式的PDF文件(從圖像文件轉(zhuǎn)換形成的PDF文件),可以將PDF文件打印到MicrosoftOffice2003的MicrosoftOfficeDocumentImageWriter打印機(jī),生成一個MDI文件。用MicrosoftOfficeDocumentImage打開此文件,執(zhí)行【工具】→【使用OCR識別文本】命令,進(jìn)行文字識別。識別完成后,執(zhí)行【工具】→【將文本發(fā)送到word】命令,把整個PDF文件識別輸出到word文件中。第20頁,共26頁,2023年,2月20日,星期六⑤利用CAJViewer的OCR功能圖2-11利用CAJViewer的OCR功能轉(zhuǎn)換第21頁,共26頁,2023年,2月20日,星期六3.DOC文件格式與CAJ文件格式間的相互轉(zhuǎn)換(1)CAJ格式文件轉(zhuǎn)換為DOC格式文件局部文本文字的識別轉(zhuǎn)換借助MicrosoftOfficeDocumentImageWriter打印機(jī)進(jìn)行文件識別全文間接轉(zhuǎn)換(2)DOC格式文件轉(zhuǎn)換為CAJ格式文件第22頁,共26頁,2023年,2月20日,星期六①局部文本文字的識別轉(zhuǎn)換圖2-14從CAJViewer6.0直接復(fù)制文本第23頁,共26頁,2023年,2月20日,星期六②借助MicrosoftOfficeDocumentImageWriter打印機(jī)進(jìn)行文件識別圖2-15設(shè)置打印機(jī)第24頁,共26頁,2023年,2月20日,星期六③全文間接轉(zhuǎn)換CAJViewer不支持直接將全文另存為DOC格式文件,但支持將全文另存為TXT格式文件,事實上達(dá)到間接轉(zhuǎn)換為DOC的目的。一般地,對于以文本文字為主的CAJ文件可以采用通過TXT間接轉(zhuǎn)換為DOC的方式。第25頁

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論