大學(xué)計(jì)算機(jī)基礎(chǔ)(微課版)課件 3-4-文字編碼_第1頁(yè)
大學(xué)計(jì)算機(jī)基礎(chǔ)(微課版)課件 3-4-文字編碼_第2頁(yè)
大學(xué)計(jì)算機(jī)基礎(chǔ)(微課版)課件 3-4-文字編碼_第3頁(yè)
大學(xué)計(jì)算機(jī)基礎(chǔ)(微課版)課件 3-4-文字編碼_第4頁(yè)
大學(xué)計(jì)算機(jī)基礎(chǔ)(微課版)課件 3-4-文字編碼_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

西文字符:指數(shù)字、字母以及其它一些符號(hào)的總稱(chēng)。西文字

符最常用的是ASCII編碼。3.4文字編碼ASCII碼(AmericanStandardCodeforInformation

Interchange,美國(guó)信息交換標(biāo)準(zhǔn)代碼)

用7位二進(jìn)制編碼表示128個(gè)字符,從0到1273.4.1西文字符:2ASCII編碼表2A1000001字母A的編碼為3ASCII包含10個(gè)數(shù)字34ASCII包含34個(gè)控制字符45ASCII包含52個(gè)英文字母56ASCII包含32個(gè)標(biāo)點(diǎn)符號(hào)與運(yùn)算符號(hào)6按照上面提供的ASCII碼,就可以把字符串“code”表示為:c o d e01100011 01101111 01100100 01100101利用ASCII標(biāo)準(zhǔn)對(duì)字符串“1+2”進(jìn)行編碼,可以表示為:1 + 200110001 00101011 00110010

控制字符:34個(gè)(0~32,127);圖形字符(普通字符):94個(gè)?!?’~‘9’30H~39H 48~57‘A’~‘Z’41H~5AH 65~90‘a(chǎn)’~‘z’61H~7AH 97~122

小寫(xiě)字母的編碼比對(duì)應(yīng)大寫(xiě)字母的編碼大32;例如:

“a”字符的編碼為1100001,對(duì)應(yīng)的十進(jìn)制數(shù)是97;“A”字符的編碼為1000001,對(duì)應(yīng)的十進(jìn)制數(shù)是65;

2.4.3漢字編碼(1)漢字外碼

外碼也叫輸入碼,主要解決如何將每個(gè)漢字變成可以直接從鍵盤(pán)輸入的代碼。目前常用的輸入法主要是音碼和形碼兩類(lèi)。音碼類(lèi):全拼、雙拼、微軟拼音、自然碼和智能ABC等 形碼類(lèi):五筆字型法、鄭碼輸入法等。輸入碼國(guó)際碼機(jī)內(nèi)碼字形碼漢字輸入漢字輸出

3.4.3漢字編碼(2)漢字國(guó)標(biāo)碼(GB2312-80)

漢字國(guó)標(biāo)碼是1980年發(fā)布的《中華人民共和國(guó)標(biāo)準(zhǔn)信息交換編碼》,代號(hào)為GB2312-80,簡(jiǎn)稱(chēng)國(guó)標(biāo)碼。

國(guó)標(biāo)碼是二字節(jié)碼,既用二個(gè)字節(jié)的低7位進(jìn)行二進(jìn)制數(shù)編碼來(lái)表示一個(gè)漢字,每個(gè)字節(jié)的最高位置都是0。

漢字的國(guó)標(biāo)碼與區(qū)位碼的關(guān)系:

每個(gè)漢字的區(qū)號(hào)和位號(hào)各加32(20H)就構(gòu)成了國(guó)標(biāo)碼加32的原因:為了與ASCII碼兼容,每個(gè)字節(jié)值大于

32(0~32為非圖形字符碼值)

每個(gè)漢字的編碼占兩個(gè)字節(jié),使用每個(gè)字節(jié)的低7位,共14位

區(qū)位碼

漢字94×94的矩陣,即94個(gè)區(qū)和94個(gè)位,由區(qū)號(hào)和位號(hào)構(gòu)成漢字的區(qū)位碼。中:5448華:2710區(qū)號(hào)位號(hào)(3)漢字機(jī)內(nèi)碼

漢字在設(shè)備或信息處理系統(tǒng)內(nèi)部最基本的表達(dá)形式。為了在計(jì)算機(jī)內(nèi)部能夠區(qū)分是漢字編碼還是ASCII碼,將國(guó)標(biāo)碼每個(gè)字節(jié)最高位設(shè)置為1(80H).

區(qū)位碼國(guó)標(biāo)碼機(jī)內(nèi)碼

(3630)H(5650)H=(0101011001010000)B(1101011011010000)B=(D6D0)H華(1B0A)H(3B2A)H=(0011101100101010)B(1011101110101010)B=(BBAA)H三種碼之間關(guān)系:漢字機(jī)內(nèi)碼=漢字國(guó)標(biāo)碼+8080H=區(qū)位碼+A0A0H

國(guó)標(biāo)碼=區(qū)位碼+2020H(4)漢字字形碼

點(diǎn)陣:漢字字形點(diǎn)陣的代碼,有16×16、24×24、32×32、

48×48等編碼、存儲(chǔ)方式簡(jiǎn)單、無(wú)需轉(zhuǎn)換直接輸出放大后產(chǎn)生的效果差。

矢量:存儲(chǔ)的是描述漢字字形的輪廓特征矢量方式特點(diǎn)正好與點(diǎn)陣相反“大”字的16×16點(diǎn)陣及代碼(5)幾種常見(jiàn)的漢字編碼Unicode字符集另一國(guó)際標(biāo)準(zhǔn):采用雙字節(jié)編碼統(tǒng)一地表示世界上的主要文字。目前的Unicode字符分為17組編排。UTF-8、UTF-16、UTF-32是常用的幾組編碼方案。UTF-8編碼UTF-8的特點(diǎn)是對(duì)不同范圍的字符使用不同長(zhǎng)度的編碼,0~127之間的碼字都使用一個(gè)字節(jié)存儲(chǔ),超過(guò)128的碼字使用2~4個(gè)字節(jié)存儲(chǔ)。UTF-16編碼UTF-16中的字符,要么用2個(gè)字節(jié)表示,要么用4個(gè)字節(jié)表示。(5)幾種常見(jiàn)的漢字編碼GBK碼

GBK等同于UCS的新的中文編碼

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論