PHP漢字轉(zhuǎn)換為拼音字頭原理_第1頁
PHP漢字轉(zhuǎn)換為拼音字頭原理_第2頁
PHP漢字轉(zhuǎn)換為拼音字頭原理_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

本文格式為Word版,下載可任意編輯——PHP漢字轉(zhuǎn)換為拼音字頭原理PHP漢字轉(zhuǎn)換為拼音字頭原理

學(xué)習(xí)猶如逆水行舟,不進那么退。下面是我整理的PHP漢字轉(zhuǎn)換為拼音字頭原理,夢想對大家學(xué)習(xí)PHP有用,更多消息請關(guān)注應(yīng)屆畢業(yè)生網(wǎng)。

GB2312中對所收漢字舉行了"分區(qū)'處理,每區(qū)含有94個漢字/符號。這種表示方式也稱為區(qū)位碼。

101-09區(qū)為特殊符號。

216-55區(qū)為一級漢字,按拼音排序。

356-87區(qū)為二級漢字,按部首/筆畫排序。

410-15區(qū)及88-94區(qū)那么未有編碼。

在使用GB2312的程序中,通常采用EUC儲存方法,以便兼容于ASCII。欣賞器編碼表上的"GB2312',通常都是指"EUC-CN'表示法。

每個漢字及符號以兩個字節(jié)來表示。第一個字節(jié)稱為"高位字節(jié)'也稱"區(qū)字節(jié)',其次個字節(jié)稱為"低位字節(jié)'也稱"位字節(jié)'。

"高位字節(jié)'使用了0xA1-0xF7把01-87區(qū)的區(qū)號加上0xA0,"低位字節(jié)'使用了0xA1-0xFE把01-94加上0xA0。由于一級漢字從16區(qū)起始,漢字區(qū)的"高位字節(jié)'的'范圍是0xB0-0xF7,"低位字節(jié)'的范圍是0xA1-0xFE,占用的碼位是72*94=6768。其中有5個空位是D7FA-D7FE。

例如"啊'字在大多數(shù)程序中,會以兩個字節(jié),0xB0第一個字節(jié)0xA1其次個字節(jié)儲存。區(qū)位碼=區(qū)字節(jié)+位字節(jié)與區(qū)位碼比較:0xB0=0xA0+16,0xA1=0xA0+1。

設(shè)計:

用一個數(shù)組存放國標(biāo)一級漢字不同讀音的起始區(qū)位碼:如

staticfinalint[]secPosValueList=

1601,1637,1833,2078,2274,2302,2433,2594,2787,3106,3212,3472,

3635,3722,3730,3858,4027,4086,4390,4558,4684,4925,5249,9999;

一個數(shù)據(jù)存放存放國標(biāo)一級漢字不同讀音的起始區(qū)位碼對應(yīng)讀音

staticfinalchar[]firstLetter=

a,b,c,d,e,f,g,h,j,k,l,m,n,o,p,

q,r,s,t,w,x,y,z;

處理方法:

1.判斷是否為英文之母

2.假設(shè)是,直接返回英文之母

3.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論