版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第三節(jié) 其它信息的數(shù)字化表示,ASCII編碼 中文編碼 BCD編碼 圖像編碼 聲音編碼 多媒體編碼,文字信息的數(shù)字表示,計(jì)算機(jī)也要處理大量文字信息,文字信息是由字符所組成,例如:英語中的26個(gè)字母,漢字等等。 這些字符數(shù)據(jù)要被計(jì)算機(jī)處理,就需要轉(zhuǎn)換成數(shù)字信息,方法就是給每個(gè)字符編一個(gè)代碼,并用二進(jìn)制數(shù)字表示。 例如: A 用 0100 0001表示。,字符編碼的種類,輸入碼:為輸入某字符從鍵盤上按的一個(gè)鍵或一組鍵。英文字符的輸入碼就是字符本身,輸入字母C,直接按C鍵。 機(jī)內(nèi)碼:是字符在計(jì)算機(jī)內(nèi)存儲(chǔ)、處理時(shí)用的編碼,輸入碼轉(zhuǎn)換為機(jī)內(nèi)碼的工作由計(jì)算機(jī)自動(dòng)完成。 字形碼:供顯示和打印用的,表征字符筆
2、型和輪廓的編碼。,字符編碼的種類,機(jī)內(nèi)碼是字符在計(jì)算機(jī)中保存、處理、傳輸中使用的數(shù)字編碼,是計(jì)算機(jī)中使用的主要的字符編碼。硬盤上的文件,就是使用機(jī)內(nèi)碼代表文字的。 如果要想互相通信而不造成混亂,就必須使用相同的編碼規(guī)則。,1、ASCII編碼,ASCII(American Standard Code for Information Interchange,美國(guó)標(biāo)準(zhǔn)信息交換碼)是基于拉丁字母的一套電腦編碼系統(tǒng),它主要用于顯示現(xiàn)代英語和其他西歐語言,是現(xiàn)今最通用的單字節(jié)編碼系統(tǒng),供不同計(jì)算機(jī)在相互通信時(shí)用作共同遵守的西文字符編碼標(biāo)準(zhǔn)。,1、ASCII編碼,美國(guó)標(biāo)準(zhǔn)信息交換碼是由美國(guó)國(guó)家標(biāo)準(zhǔn)學(xué)會(huì)(Am
3、erican National Standard Institute , ANSI )制定的,標(biāo)準(zhǔn)的單字節(jié)字符編碼方案。起始于50年代后期,在1967年定案。它最初是美國(guó)國(guó)家標(biāo)準(zhǔn),已被國(guó)際標(biāo)準(zhǔn)化組織(International Organization for Standardization, ISO)定為國(guó)際標(biāo)準(zhǔn),稱為ISO 646標(biāo)準(zhǔn)。,1、ASCII編碼,英文字符的機(jī)內(nèi)碼:由字符在ASCII碼表內(nèi)的位置決定。 標(biāo)準(zhǔn)ASCII采用七位二進(jìn)制編碼,例如: 空格(SP)的編碼是:0100000B =20H = 32 數(shù)字符號(hào)0的編碼是:0110000B = 30H = 48 大寫字母A的編碼是
4、:1000001B = 41H = 65 小寫字母a的編碼是:1100001B = 61H = 97 編碼也稱ASCII碼值,1、 ASCII編碼,標(biāo)準(zhǔn)ASCII碼常用字符有128個(gè),編碼從0到127。每個(gè)字符在計(jì)算機(jī)中占一個(gè)字節(jié),用低7位,最高位為0。 包括09十個(gè)數(shù)字,大小寫英文字母及專用符號(hào)等95種可打印字符。 還包括33個(gè)控制字符。,1、 ASCII編碼,1、 ASCII編碼,擴(kuò)展ASCII編碼(EASCII),對(duì)ASCII編碼進(jìn)行擴(kuò)充,把一些特殊符號(hào)編碼到128-255,稱為擴(kuò)展ASCII編碼。 字節(jié)最高位為1。,ISO/IEC 646,ISO/IEC 646是國(guó)際標(biāo)準(zhǔn)化組織(ISO
5、)和國(guó)際電工委員會(huì)(IEC)1972年制訂的標(biāo)準(zhǔn)。 它來自數(shù)個(gè)國(guó)家標(biāo)準(zhǔn),最主要來自美國(guó)的 ASCII 也是采用7位二進(jìn)制數(shù)表示一個(gè)字符的編碼 ISO646 除了英語字母和數(shù)字部分各個(gè)國(guó)家都相同外,有些字母可按照實(shí)際需要,把ISO646進(jìn)行修改,以定出該國(guó)的字符標(biāo)準(zhǔn),所以有些ASCII中的字符沒有包含在這些國(guó)家的ISO646標(biāo)準(zhǔn)中。,ISO8859系列,ISO8859,全稱ISO/IEC 8859,是國(guó)際標(biāo)準(zhǔn)化組織(ISO)及國(guó)際電工委員會(huì)(IEC)聯(lián)合制定的一系列8位字符集的標(biāo)準(zhǔn)。 可看作為不同的文字中的EASCII,它使用128-255的區(qū)域?yàn)椴煌淖侄x了這種文字常用字符的編碼。 包括:I
6、SO8859-1定義了西歐語言的字符,ISO8859-2是中歐語言, ISO8859-3是南歐語言, ISO8859-4是北歐語言,ISO8859-5是斯拉夫語,ISO8859-6是阿拉伯語等16個(gè)標(biāo)準(zhǔn)。 0-127的編碼與ASCII相同。,ISO8859系列,以上文字的編碼方案主要是針對(duì)文字符號(hào)較少的語言,使用一個(gè)字節(jié)就可以為所有的文字符號(hào)進(jìn)行編碼,稱為單字節(jié)編碼方案,能夠編碼的字符的個(gè)數(shù)也基本限制在128個(gè)或256個(gè)之內(nèi),它們卻沒有辦法將文字符號(hào)較多的語言進(jìn)行編碼, 為了提供更多的編碼空間,各個(gè)國(guó)家和地區(qū)開始使用兩個(gè)字節(jié)作為本地字符的編碼,為自己國(guó)家和地區(qū)的語言文字設(shè)計(jì)編碼,例如:中文簡(jiǎn)體
7、字符的GB2312,中文繁體的BIG5,日文的JIS等方案。,2、中文編碼,計(jì)算機(jī)里處理漢字,也要對(duì)漢字進(jìn)行編碼。 漢字內(nèi)碼 漢字輸入碼 漢字字形碼,2、中文編碼,漢字內(nèi)碼: 區(qū)位碼:1980年,我國(guó)為6763個(gè)漢字和682個(gè)符號(hào)規(guī)定了編碼,把它們分成94個(gè)區(qū),每區(qū)可包含94個(gè)字符,每個(gè)字符的代碼由2個(gè)字節(jié)組成,第一個(gè)字節(jié)指明它所在的區(qū)號(hào),第二個(gè)字節(jié)指明它所在的區(qū)的位置號(hào),稱為區(qū)位碼。 例如:啊 在16區(qū)第一位,則區(qū)位碼為: 1001H,2、中文編碼,漢字內(nèi)碼: 國(guó)標(biāo)碼:是國(guó)家標(biāo)準(zhǔn)(GB2312-80)所規(guī)定的漢字的編碼,實(shí)際是把區(qū)位碼的區(qū)碼和位碼分別加上20H。 例如:啊 在16區(qū)第一位,則
8、區(qū)位碼為: 1001H,國(guó)標(biāo)碼則是:3021H。,2、中文編碼,漢字內(nèi)碼: 機(jī)內(nèi)碼(GB內(nèi)碼):是把國(guó)標(biāo)碼的高字節(jié)和低字節(jié)的最高位分別設(shè)置為1,相當(dāng)于每個(gè)字節(jié)加上80H,主要是為了和ASCII碼區(qū)分開。 例如:啊 在16區(qū)第一位,則區(qū)位碼為: 1001H,國(guó)標(biāo)碼則是:3021H,機(jī)器內(nèi)碼就是:B0A1H。,2、中文編碼,Big5,又稱為大五碼,是使用繁體中文社區(qū)中最常用的計(jì)算機(jī)漢字內(nèi)碼標(biāo)準(zhǔn),共收錄13060個(gè)漢字,Big5碼普及于臺(tái)灣、香港與澳門等繁體中文通行區(qū)。 Big5碼也是采用兩個(gè)字節(jié)表示一個(gè)漢字或符號(hào)的編碼。,2、中文編碼,采用的編碼方案與GB2312不同,同一個(gè)字符編碼在GB2312
9、中和Big5中表示的漢字是不同的。 比如:“王子”兩個(gè)字的GB內(nèi)碼是0CDF5H和0D7D3H,但是這兩個(gè)編碼在Big5中表示的漢字分別是“卼赽”,所以使用GB內(nèi)碼保存的文件如果在使用Big5碼的環(huán)境中打開,會(huì)看到亂的漢字,稱為亂碼。 使用GB內(nèi)碼和Big5碼的字符就無法共存與一個(gè)文件中。,2、中文編碼,漢字內(nèi)碼: 1993的國(guó)際標(biāo)準(zhǔn)化組織公布了ISO/IEC10646,通用多八位編碼字符集UCS(Universal Code Set),它是包括漢字在內(nèi)的各種正在使用的文字的統(tǒng)一編碼方案,共包括128個(gè)組,每組包括256個(gè)平面,每平面包括256行,每行包括256個(gè)字位。 每個(gè)字符占用4個(gè)字節(jié),
10、最高位為0。每個(gè)字節(jié)分別表示組號(hào)、平面號(hào)、行號(hào)和字位號(hào)。這種方案也稱為UCS-4編碼,2、中文編碼,漢字內(nèi)碼: UCS的第0組第0號(hào)平面稱為BMP(基本多文種平面),它用來存放全世界主要的文字和符號(hào),用行號(hào)和字位號(hào)表示字符編碼,也稱為Unicode編碼,被廣泛使用。 每個(gè)字符占用2個(gè)字節(jié),也稱為Unicode編碼或UCS-2編碼。,2、中文編碼,UCS和Unicode字符的機(jī)內(nèi)碼采用幾種變換格式(Transformation Format)來表示,包括:UTF-8、UTF-16和UTF-32等三種。 UTF-32采用的就是UCS-4的編碼,一個(gè)字符固定使用4個(gè)字節(jié)來編碼,是定長(zhǎng)的編碼。比如:大
11、寫字母A的編碼就是十六進(jìn)制數(shù)“00000041”。 UTF-16使用2或4個(gè)字節(jié)進(jìn)行編碼。比如:大寫字母A的UTF-16編碼就是十六進(jìn)制數(shù)“0041”,而字符編碼U+64321的UTF-16編碼就是十六進(jìn)制數(shù)“D950DF21”。,2、中文編碼,UTF-8是一種針對(duì)UCS字符的可變長(zhǎng)度字符編碼。 它使用1到6個(gè)字節(jié)為字符編碼,可以用來表示UCS中的任何字符, 而且其編碼中的單字節(jié)字符仍與ASCII兼容,這使得原來處理ASCII字符的軟件無需或只需做少部份修改,即可繼續(xù)使用。因此,它逐漸成為電子郵件、網(wǎng)頁及其他存儲(chǔ)或傳送文字的應(yīng)用中,優(yōu)先采用的編碼?;ヂ?lián)網(wǎng)工程工作小組(IETF)要求所有互聯(lián)網(wǎng)協(xié)
12、議都必須支持UTF-8編碼?;ヂ?lián)網(wǎng)郵件聯(lián)盟(IMC)建議所有電子郵件軟件都支持UTF-8編碼。,2、中文編碼,全國(guó)信息技術(shù)化技術(shù)委員會(huì)于1995年12月1日發(fā)布漢字內(nèi)碼擴(kuò)展規(guī)范。GBK向下與GB2312 完全兼容,向上支持ISO 10646國(guó)際標(biāo)準(zhǔn)。 GBK 亦采用雙字節(jié)表示,總體編碼范圍為8140-FEFE之間。 GBK共收入21886個(gè)漢字和圖形符號(hào),包括:GB2312中的全部漢字、非漢字符號(hào),BIG5中的全部漢字,與ISO 10646相應(yīng)的國(guó)家標(biāo)準(zhǔn)GB13000中的其它CJK漢字,以上合計(jì)20902個(gè)漢字,其它漢字、部首、符號(hào),共計(jì)984個(gè)。,2、中文編碼,GB 18030,全稱:國(guó)家標(biāo)
13、準(zhǔn)GB18030-2005信息技術(shù)中文編碼字符集,是中華人民共和國(guó)現(xiàn)時(shí)最新的內(nèi)碼字集,是GB18030-2000的修訂版。 它與GB 2312-1980完全兼容,與GBK基本兼容,支持GB 13000及Unicode的全部統(tǒng)一漢字,共收錄漢字70244個(gè)。 GB18030采用多字節(jié)編碼,每個(gè)字可以由1個(gè)、2個(gè)或4個(gè)字節(jié)組成,支持中國(guó)國(guó)內(nèi)少數(shù)民族的文字,收錄范圍包含繁體漢字以及日韓漢字。 GB18030是中國(guó)所有非手持/嵌入式計(jì)算機(jī)系統(tǒng)的強(qiáng)制實(shí)施標(biāo)準(zhǔn)。,2、中文編碼,漢字輸入碼:一組按鍵,用于輸入漢字。 數(shù)字編碼 (區(qū)位碼) 字音編碼(全拼,雙拼) 字形編碼(五筆) 形音編碼,2、中文編碼,漢字
14、字型碼: 點(diǎn)陣式字形 矢量式字形,漢字的輸出(字庫),漢字的輸出(字庫),72,128,288,矢量式字形,將漢字看作由筆畫組成的圖形,抽取漢字每個(gè)筆畫的特征坐標(biāo)值,這些坐標(biāo)組合起來就得到這個(gè)漢字的矢量信息。 對(duì)縮放字體大小很方便,并且字體不易變形。 每個(gè)漢字筆畫不同,抽取的矢量信息大小也不相同。,曲線輪廓字形,曲線輪廓字形是以二次曲線或三次曲線逼近字形輪廓的字形描述方法,常用的輪廓字形描述技術(shù)包括Postscript和TrueType兩大類。 PostScript字體由Adobe公司為專業(yè)數(shù)字排版開發(fā)。它使用PostScript,字形以3次貝茲曲線描述,因此一組字型可以通過簡(jiǎn)單的數(shù)學(xué)變形放大
15、或縮小。 TrueType是由Apple公司和Microsoft公司聯(lián)合提出的一種新型數(shù)學(xué)字形描述技術(shù)。 TrueType采用幾何學(xué)中二次貝塞爾曲線及直線來描述字體的外形輪廓。,OpenType字體,OpenType字體是為了實(shí)現(xiàn)Windows和Macintosh系統(tǒng)兼容,由美國(guó)微軟公司與Adobe公司聯(lián)合開發(fā),用來替代TrueType字型的新字型。 它在繼承了TrueType格式的基礎(chǔ)上增加了對(duì)PostScript字型數(shù)據(jù)的支持,所以O(shè)penType的字形數(shù)據(jù)既可以采用TrueType的字形描述方式,也可以采用PostScript的字型描述方式。同一個(gè)OpenType字體文件可以用于Mac
16、OS,Windows 和 Linux系統(tǒng),這種跨平臺(tái)的字庫非常方便于用戶的使用。 Microsoft從Windows 2000系統(tǒng)開始兼容OpenType字庫。,OpenType字體,ClearType,是微軟在Windows中提供的屏幕亞像素微調(diào)字體平滑技術(shù),讓W(xué)indows字體更加漂亮。 ClearType主要是針對(duì)LCD液晶顯示器設(shè)計(jì),可提高文字的清晰度?;驹硎?,將顯示器的R, G, B各個(gè)次像素也發(fā)光,讓其色調(diào)進(jìn)行微妙調(diào)整,可以達(dá)到實(shí)際分辨率以上(橫方向分辨率的三倍)的纖細(xì)文字的顯示效果。 在Windows XP平臺(tái)上,這項(xiàng)技術(shù)默認(rèn)是關(guān)閉,到了IE7才默認(rèn)打開。依靠ClearTyp
17、e技術(shù)提高字體的可讀性,相當(dāng)程度上依賴于使用的字體,微軟在Windows Vista里,新發(fā)布了兩個(gè)支持ClearType的中文字庫:微軟雅黑和微軟正黑體。Windows7也對(duì) ClearType提供默認(rèn)支持。,2、中文編碼,字符代碼化(輸入),3、BCD編碼,用二進(jìn)制數(shù)表示10進(jìn)制數(shù)的一種編碼方法,用4位二進(jìn)制數(shù)表示一位10進(jìn)制數(shù),常見的編碼是8421碼,用0000到1001表示十進(jìn)制數(shù)的0到9。 例如:十進(jìn)制數(shù)128表示為: 0001 0010 1000,4、圖像編碼,位圖法:(BMP,JPG,GIF,TIFF) 矢量圖形:(WMF,DXF,MGX等),4、圖像編碼,一般圖像的數(shù)字化會(huì)采用
18、位圖模式,在這種模式下一幅彩色圖像(image)可以看成是由許許多多個(gè)彩色的點(diǎn)(像素)組成的,每個(gè)點(diǎn)有深淺不同的顏色。如果將每個(gè)點(diǎn)的顏色用二進(jìn)制數(shù)字表示出來,就可以將圖像數(shù)字化。 例如:如果將一幅圖像水平方向上劃分出800個(gè)點(diǎn),垂直方向上劃分出600個(gè)點(diǎn),則此圖像總共由48萬個(gè)像素點(diǎn)組成,每個(gè)像素點(diǎn)有一種顏色。,4、圖像編碼,對(duì)于每個(gè)像素點(diǎn)的顏色,采用幾位二進(jìn)制數(shù)字保存會(huì)直接決定每個(gè)像素點(diǎn)能夠顯示多少種顏色。 如果使用一位二進(jìn)制數(shù)字表示一個(gè)點(diǎn)的顏色,則只能使用0或1表示兩種顏色;如果使用8位二進(jìn)制數(shù)字表示一個(gè)點(diǎn)的顏色,則每個(gè)點(diǎn)的顏色值可以由二進(jìn)制數(shù)字00000000到11111111中一個(gè)數(shù)字表示,每個(gè)點(diǎn)可以有28個(gè)顏色值,即256色;如果使用1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 46758-2025紙漿硫酸鹽法蒸煮液總堿、活性堿和有效堿的測(cè)定(電位滴定法)
- 2025年大學(xué)農(nóng)學(xué)(作物研究)試題及答案
- 2025年大學(xué)安全教育(人身安全防護(hù))試題及答案
- 2025年中職(物聯(lián)網(wǎng)技術(shù)應(yīng)用)傳感器應(yīng)用試題及解析
- 2025年大學(xué)本科一年級(jí)(臨床醫(yī)學(xué))人體解剖基礎(chǔ)測(cè)試題及答案
- 2025年高職(園林管理)園林景區(qū)運(yùn)營(yíng)管理綜合測(cè)試題及答案
- 2025年大學(xué)大一(康復(fù)治療學(xué))康復(fù)心理學(xué)基礎(chǔ)階段測(cè)試題及答案
- 2025年大學(xué)工業(yè)工程(工業(yè)4.0研發(fā))試題及答案
- 2025年大學(xué)森林消防(森林滅火技術(shù))試題及答案
- 2025年中職(學(xué)前教育)幼兒教育學(xué)階段測(cè)試題及答案
- ISO27001信息安全管理體系培訓(xùn)資料
- 四年級(jí)語文國(guó)測(cè)模擬試題 (1)附有答案
- 2024-2030年墨西哥數(shù)碼打印機(jī)墨水市場(chǎng)前景分析
- 固定式、車載式、便攜式反無人機(jī)實(shí)施方案
- 餐飲投資項(xiàng)目計(jì)劃書
- 廣州小學(xué)英語單詞分類識(shí)記表-注音版
- 男朋友打游戲申請(qǐng)表
- 危險(xiǎn)化學(xué)品經(jīng)營(yíng)許可證變更申請(qǐng)書(附件2)
- 職業(yè)培訓(xùn)師的8堂私房課:修訂升級(jí)版
- 18621客運(yùn)服務(wù)禮儀題庫(114道)
- 多園區(qū)管理模式下的機(jī)制建設(shè)
評(píng)論
0/150
提交評(píng)論