- 相關(guān)推薦
全國(guó)計(jì)算機(jī)應(yīng)用基礎(chǔ)知識(shí):漢字、字符編碼
。1)計(jì)算機(jī)中的信息單位
計(jì)算機(jī)中對(duì)信息表示的單位有位、字、字長(zhǎng)及字節(jié)等,它們是用來(lái)表示信息量的大小的基本概念。
、 位:計(jì)算機(jī)中數(shù)據(jù)存儲(chǔ)的最小單位是一個(gè)二進(jìn)制位,簡(jiǎn)稱(chēng)位,英文為bit,音譯為比特,可用小寫(xiě)字母b表示。
、 字節(jié):八位二進(jìn)制位稱(chēng)為一個(gè)字節(jié),英文為Byte,可用大寫(xiě)字母B表示,是計(jì)算機(jī)存儲(chǔ)的基本單位。一個(gè)字節(jié)的八位二進(jìn)制數(shù),其位編號(hào)自左至右為b7、b6、b5、b4、b3、b2、b1、b0。在計(jì)算機(jī)中,往往用字節(jié)數(shù)來(lái)表示存儲(chǔ)容量,容量可以以KB、MB、GB、TB為單位,它們相互之間的轉(zhuǎn)換關(guān)系如下:
1KB=210B=1024B
1MB=210KB=1024KB
1GB=210MB=1024MB
1TB=210GB=1024GB
、 字:計(jì)算機(jī)在存儲(chǔ)、傳送或操作時(shí),作為一個(gè)整體單位進(jìn)行操作的一組二進(jìn)制,稱(chēng)為一個(gè)計(jì)算機(jī)字,簡(jiǎn)稱(chēng)字。
、 字長(zhǎng):每個(gè)字所包含的位數(shù)稱(chēng)為字長(zhǎng)。由于字長(zhǎng)是計(jì)算機(jī)一次可處理的二進(jìn)制數(shù)的位數(shù),因此它與計(jì)算機(jī)處理數(shù)據(jù)的速率有關(guān),是衡量計(jì)算機(jī)性能的一個(gè)重要因素。
。2)字符的編碼。
、 ASCII碼。
計(jì)算機(jī)只能識(shí)別二進(jìn)制數(shù),因此計(jì)算機(jī)中的數(shù)字、字母、符號(hào)也必須用二進(jìn)制進(jìn)行編碼。編碼方法有多種,微型機(jī)中普遍采用的是ASCII碼(美國(guó)標(biāo)準(zhǔn)信息交換碼),ASCII碼現(xiàn)已被國(guó)際標(biāo)準(zhǔn)化組織(ISO)接收為國(guó)際標(biāo)準(zhǔn),稱(chēng)為ISO-646。ASCII碼有7位版本和8位版本兩種,國(guó)際上通用的ASCII碼是7位版本。7位版本的ASCII碼包含10個(gè)阿拉伯?dāng)?shù)字、52個(gè)英文大小寫(xiě)字母、32個(gè)標(biāo)點(diǎn)符號(hào)和運(yùn)算符及34個(gè)控制碼,共128個(gè)字符,所以可用7位二進(jìn)制數(shù)表示。7位ASCII碼字符如下圖所示:
要確定一個(gè)數(shù)字、字母、符號(hào)或控制字符的ASCII碼,可在表中先找出它的位置,然后確定它所對(duì)應(yīng)的十進(jìn)制值或二進(jìn)制值。例如小寫(xiě)字母“a”的ASCII碼其十進(jìn)制值是97,二進(jìn)制值是1100001B(B表示二進(jìn)制數(shù)),若轉(zhuǎn)換成十六進(jìn)制,其值是61H(H表示十六進(jìn)制數(shù))。從表中可以看出,數(shù)字0~9的ASCII碼是30H~39H(后綴H表示是十六進(jìn)制數(shù)),大寫(xiě)字母A~Z的ASCII碼是41H~5AH,小寫(xiě)字母a~z的ASCII碼是61H~7AH。字符大小的比較就是看它的ASCII碼值的大小。
表中,NUL、BEL、LF、FF、CR、DEL等是控制字符,NUL表示空,BEL是告警符,BS是退格符,LF是換行符,F(xiàn)F是換頁(yè)符,CR是回車(chē)符,SP是空格符,DEL是刪除符。
、 BCD碼。
用計(jì)算機(jī)處理數(shù)字時(shí),要進(jìn)行二進(jìn)制與十進(jìn)制的相互轉(zhuǎn)換,這就要用二進(jìn)制對(duì)十進(jìn)制數(shù)進(jìn)行編碼,BCD(Binary Coded Decimal)碼是二進(jìn)制編碼的十進(jìn)制數(shù)。最常用的BCD碼就是8421BCD碼,
它是用4位二進(jìn)制數(shù)為一組表示一個(gè)十進(jìn)制數(shù)字,4位二進(jìn)制數(shù)從左到右其位權(quán)依次為8、4、2、1,它可以組合成16種狀態(tài),對(duì)0~9這10個(gè)數(shù)字的編碼只取0000~1001這前10種狀態(tài),其余6種狀態(tài)不用。為了能對(duì)一個(gè)多位十進(jìn)制數(shù)進(jìn)行編碼,需要有和十進(jìn)制數(shù)的位數(shù)一樣多的4位二進(jìn)制組,按順序分別進(jìn)行編碼。表1-4表示8421BCD碼與十進(jìn)制數(shù)的對(duì)應(yīng)關(guān)系。
表1-4 BCD碼與十進(jìn)制數(shù)的對(duì)應(yīng)關(guān)系
、 Unicode編碼
ASCII碼提供了128個(gè)字符,擴(kuò)展的ASC碼提供了256個(gè)字符,但用來(lái)表示世界各國(guó)的文字編碼還顯得不夠,還需要表示更多的字符和意義,因此又出現(xiàn)了Unicode編碼。
Unicode是一種16位的編碼,能夠表示65000多個(gè)字符或符號(hào)。目前世界上的各種語(yǔ)言一般所使用的字母或符號(hào)在34000個(gè)左右,所以Unicode編碼可以用于任何一種語(yǔ)言。Unicode編碼與現(xiàn)在流行的ASCII碼完全兼容,二者的前256個(gè)符號(hào)是一樣的。
(3)漢字的編碼
漢字是一種象形文字,字?jǐn)?shù)極多(現(xiàn)代漢字中僅常用字就有六七千個(gè),總字?jǐn)?shù)高達(dá)5萬(wàn)個(gè)以上),且字形復(fù)雜,每一個(gè)漢字都有“音、形、義”三要素,同音字、異體字也很多,這些都給漢字的計(jì)算機(jī)處理帶來(lái)了很大的困難。要在計(jì)算機(jī)中處理漢字,必須解決以下幾個(gè)問(wèn)題:首先,是漢字的輸入,即如何把結(jié)構(gòu)復(fù)雜的方塊漢字輸入到計(jì)算機(jī)中去,這是漢字處理的關(guān)鍵;其次,漢字在計(jì)算機(jī)內(nèi)如何表示和存儲(chǔ),如何與西文兼容;最后,如何將漢字的處理結(jié)果從計(jì)算機(jī)內(nèi)輸出。為此,必須將漢字代碼化,
即對(duì)漢字進(jìn)行編碼。對(duì)應(yīng)于上述漢字處理過(guò)程中的輸入、內(nèi)部處理及輸出這3個(gè)主要環(huán)節(jié),每一個(gè)漢字的編碼都包括輸入碼、交換碼、內(nèi)部碼和字形碼。在計(jì)算機(jī)的漢字信息處理系統(tǒng)中,處理漢字時(shí)要進(jìn)行如下的代碼轉(zhuǎn)換:輸入碼→交換碼→內(nèi)部碼→字形碼。以上簡(jiǎn)述了對(duì)漢字進(jìn)行計(jì)算機(jī)處理的基本思想和過(guò)程,下面具體介紹漢字的4種編碼。
、 輸入碼。
為了利用計(jì)算機(jī)上現(xiàn)有的標(biāo)準(zhǔn)西文鍵盤(pán)來(lái)輸入漢字,必須為漢字設(shè)計(jì)輸入編碼。輸入碼也稱(chēng)為外碼。目前,已申請(qǐng)專(zhuān)利的漢字輸入編碼方案有六七百種之多,而且還不斷有新的輸入方法問(wèn)世,以至于有“萬(wàn)碼奔騰”之喻。按照不同的設(shè)計(jì)思想,可把這些數(shù)量眾多的輸入碼歸納為四大類(lèi):數(shù)字編碼、拼音碼、字形碼和音形碼。其中,目前應(yīng)用最廣泛的是拼音碼和字形碼。
a. 數(shù)字編碼:數(shù)字編碼是用等長(zhǎng)的
數(shù)字串為漢字逐一編號(hào),以這個(gè)編號(hào)作為漢字的輸入碼,如區(qū)位碼、電XX等都屬于數(shù)字編碼。此種編碼的編碼規(guī)則簡(jiǎn)單,易于與漢字的內(nèi)部碼轉(zhuǎn)換,但難于記憶,僅適用于某些特定部門(mén)。
b. 拼音碼:拼音碼是以漢字的讀音為基礎(chǔ)的輸入碼。拼音碼使用方法簡(jiǎn)單,一學(xué)就會(huì),易于推廣,缺點(diǎn)是重碼率較高(因漢字同音字多),在輸入時(shí)常要進(jìn)行屏幕選字,對(duì)輸入速度有影響。拼音碼是按照漢語(yǔ)拼音編碼輸入,因此在輸入漢字時(shí),要求讀音標(biāo)準(zhǔn),不能使用方言。拼音碼特別適合于對(duì)輸入速度要求不是太高的非專(zhuān)業(yè)錄入人員。
c. 字形碼:字形碼是以漢字的字形結(jié)構(gòu)為基礎(chǔ)的輸入編碼。在微型計(jì)算機(jī)上廣為使用的五筆字型碼(王碼)是字形碼的典型代表。五筆字型碼的主要特點(diǎn)為輸入速度快,目前最高紀(jì)錄為每分鐘輸入293個(gè)漢字(該記錄為XXXX一女兵所保持),如此高的輸入速度已達(dá)
到人眼掃描的極限。但這種輸入方法因要記憶字根、練習(xí)拆字,前期學(xué)習(xí)花費(fèi)的時(shí)間較多。此外,有極少數(shù)的漢字拆分困難,給出的編碼與漢字的書(shū)寫(xiě)習(xí)慣不一致。
d. 音形碼:音形碼是兼顧漢字的讀音和字形的輸入編碼。目前使用較多的音形碼是自然碼。
、 交換碼。
交換碼用于漢字外碼和內(nèi)部碼的交換。我國(guó)于1981年頒布的《信息交換用漢字編碼字符集·基本集》(代號(hào)為GB2312—1980)是交換碼的國(guó)家標(biāo)準(zhǔn),所以交換碼也稱(chēng)為國(guó)標(biāo)碼。國(guó)標(biāo)碼是雙字節(jié)代碼,即有兩個(gè)字節(jié)為一個(gè)漢字編碼,每個(gè)字節(jié)的最高位為“1”。國(guó)標(biāo)GB2312—1980收入常用漢字6763個(gè)(其中一級(jí)漢字3755個(gè),按拼音順序排列;二級(jí)漢字3008個(gè),按部首順序),其他字母及圖形符號(hào)(如序號(hào)、數(shù)字、羅馬數(shù)字、英文字母、日文假名、俄文字母
和漢語(yǔ)注音等)682個(gè),總計(jì)7445個(gè)字符。將這7445個(gè)字符按94行×94列排列在一起,組成GB2312—1980字符集編碼表,表中的每一個(gè)漢字都對(duì)應(yīng)于唯一的行號(hào)(稱(chēng)為區(qū)號(hào))和列號(hào)(稱(chēng)為位號(hào)),根據(jù)區(qū)位號(hào)確定漢字的國(guó)標(biāo)碼值,分別用兩個(gè)字節(jié)存放。由于篇幅所限,本書(shū)未列出GB2312—1980字符編碼表,讀者可參看有關(guān)書(shū)籍。
③ 內(nèi)部碼。
內(nèi)部碼是漢字在計(jì)算機(jī)內(nèi)的基本表示形式,是計(jì)算機(jī)對(duì)漢字進(jìn)行識(shí)別、存儲(chǔ)、處理和傳輸所用的編碼。內(nèi)部碼也是雙字節(jié)編碼,將國(guó)標(biāo)碼兩個(gè)字節(jié)的最高位都置為“1”,即轉(zhuǎn)換成漢字的內(nèi)部碼。計(jì)算機(jī)信息處理系統(tǒng)就是根據(jù)字符編碼的最高位是“1”還是“0”來(lái)區(qū)分漢字字符和ASCII碼字符的。
、 字形碼。
字形碼是表示漢字字形信息(漢字的結(jié)構(gòu)、形狀、筆畫(huà)等)的編碼,用來(lái)
實(shí)現(xiàn)計(jì)算機(jī)對(duì)漢字的輸出(顯示、打。S捎跐h字是方塊字,因此字形碼最常用的表示方式是點(diǎn)陣形式,有16×16點(diǎn)陣、24×24點(diǎn)陣和48×48點(diǎn)陣等。例如,16×16點(diǎn)陣的含義為:有256個(gè)點(diǎn)(16× 16=256)來(lái)表示一個(gè)漢字的字形信息,每個(gè)點(diǎn)有“亮”或“滅”兩種狀態(tài),用一個(gè)二進(jìn)制數(shù)的“1”或“0”來(lái)對(duì)應(yīng)表示。因此,存儲(chǔ)一個(gè)16×16點(diǎn)陣的漢字需要256個(gè)二進(jìn)制位,共32個(gè)字節(jié)(256位/8位)。以上的點(diǎn)陣可根據(jù)漢字輸出的不同需要進(jìn)行選擇,點(diǎn)陣的點(diǎn)數(shù)越多,輸出的漢字就越精確、美觀。漢字的字形點(diǎn)陣要占用大量的存儲(chǔ)空間,通常將其以字庫(kù)的形式存放在機(jī)器的外存中,需要時(shí)才檢索字庫(kù),輸出相應(yīng)漢字的字形。
【全國(guó)計(jì)算機(jī)應(yīng)用基礎(chǔ)知識(shí):漢字、字符編碼】相關(guān)文章:
計(jì)算機(jī)應(yīng)用基礎(chǔ)基礎(chǔ)知識(shí)12-24
計(jì)算機(jī)應(yīng)用基礎(chǔ)知識(shí)備考試題11-03
2017計(jì)算機(jī)應(yīng)用基礎(chǔ)知識(shí)模擬試題及答案06-13
中考語(yǔ)文基礎(chǔ)知識(shí)復(fù)習(xí):漢字06-23
水泥功能與應(yīng)用基礎(chǔ)知識(shí)06-13
2017年全國(guó)計(jì)算機(jī)應(yīng)用基礎(chǔ)試題(附答案)08-27
計(jì)算機(jī)硬盤(pán)基礎(chǔ)知識(shí)11-09
美術(shù)色彩基礎(chǔ)知識(shí)高級(jí)灰的應(yīng)用09-16
2017全國(guó)一級(jí)計(jì)算機(jī)基礎(chǔ)及MS Office應(yīng)用講義08-29