在計算機中每個漢字用兩個位元組表示要從文字字元組成的10萬字的

2021-04-08 14:17:56 字數 2820 閱讀 5901

1樓:匿名使用者

這種每個漢字用兩個位元組表示要從文字字元組成的十萬個字的中文書籍是100000÷2

計算機如何表示文字?比如用0、1如何表示「hello」和「你好」?求解答~ 20

2樓:匿名使用者

8個有0和1組成的一串,代表一個字母,稱為一個位元組b,所以hello這個詞是5個位元組,也就是40個0和1組成

3樓:匿名使用者

3是110011

. 是101110

1是110001

4是110100

4樓:清風

目前在計算機中主要有兩種方式來表示漢字,分別是gb2312碼和big5碼。

gb2312碼是中華人民共和國國家漢字資訊交換用編碼,全稱《資訊交換用漢字編碼字符集--基本集》,由國家標準總局釋出,2023年5月1日實施,通行於大陸。新加坡等地也使用此編碼。

gb2312收錄簡化漢字及符號、字母、日文假名等共7445個圖形字元,其中漢字佔6763個。gb2312規定"對任意一個圖形字元都採用兩個位元組表示,每個位元組均採用七位編碼表示",習慣上稱第一個位元組為"高位元組",第二個位元組為"低位元組"。gb2312-80包含了大部分常用的

一、二級漢字,和9區的符號。該字符集是幾乎所有的中文系統和國際化的軟體都支援的中文字符集,這也是最基本的中文字符集。其編碼範圍是高位0xa1-0xfe,低位也是0xa1-0xfe;漢字從0xb0a1開始,結束於0xf7fe。

big5碼多用於港臺地區。每個字由兩個位元組組成,其第一位元組編碼範圍為0xa1~0xf9,第二位元組編碼範圍為0x40~0x7e與0xa1~0xfe,總計收入13868個字(包括5401個常用字、7652 個次常用字、7個擴充字、以及808個各式符號)。

由於gb2312編碼的字數太少,其後又對其進行過多次擴充,故產生了gb12345碼、gbk碼、gb18030碼。

big5也作了不少擴充,如cns11643碼。

編碼字數統計:

gb2312 6763個漢字

gb12345 6866個漢字

gbk 21003個漢字

gb18030 27000

big5 13053

cns11643 48,027

通過不同的編碼就可以表示「hello」和「你好「

2進製表示小數的時候只能夠表示能夠用1/(2^n)的和的任意組合

例如:0.5能夠表示,因為它可以表示成為1/2

0.75也能夠表示,因為它可以表示成為1/2+1/(2^2)

0.875也能夠表示,因為它可以表示成為1/2+1/(2^2)+1/(2^3)

但是3.14不能夠精確表示,因為它補能夠表示成為1/(2^n)的和的形式

一個漢字在計算機中佔用幾個位元組

5樓:假面

一箇中文漢字佔兩個位元組的空間,一個漢字中的標點也是兩個位元組。

計算機資訊科技用於計量儲存容量的一種計量單位,通常情況下一位元組等於八位,也在一些計算機程式語言中表示資料型別和語言字元。

一個英文字母(不分大小寫)佔一個位元組的空間。一個二進位制數字序列,在計算機中作為一個數字單元,一般為8位二進位制數。換算為十進位制 ,最小值-128,最大值127。

如一個ascii碼就是一個位元組。

漢字系統把一個漢字表示為二個位元組的二進位制編碼,這種編碼叫?

6樓:很多很多

漢字機內碼。

漢字機內碼,又稱「漢字ascii碼」,簡稱「內碼」,指計算機內部儲存,處理加工和傳輸漢字時所用的由0和1符號組成的**。

輸入碼被接受後就由漢字作業系統的「輸入碼轉換模組」轉換為機內碼,與所採用的鍵盤輸入法無關。機內碼是漢字最基本的編碼,不管是什麼漢字系統和漢字輸入方法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被儲存和進行各種處理。

因為漢字處理系統要保證中西文的相容,當系統中同時存在ascii碼和漢字國標碼時,將會產生二義性。例如:有兩個位元組的內容為30h和21h,它既可表示漢字「啊」的國標碼,又可表示西文「0」和「!

」的ascii碼。為此,漢字機內碼應對國標碼加以適當處理和變換。

7樓:匿名使用者

你好,叫漢字機內碼

漢字機內碼的基礎是漢字國標碼。

機內碼:為了避免ascii碼和國標碼同時使用時產生二義性問題,大部分漢字系統都採用將國標碼每個位元組高位置1作為漢字機內碼。這樣既解決了漢字機內碼與西文機內碼之間的二義性,又使漢字機內碼與國標碼具有極簡單的對應關係。

漢字機內碼、國標碼和區位碼三者之間的關係為:區位碼(十進位制)的兩個位元組分別轉換為十六進位制後加20h得到對應的國標碼;機內碼是漢字交換碼(國標碼)兩個位元組的最高位分別加1,即漢字交換碼(國標碼)的兩個位元組分別加80h得到對應的機內碼;區位碼(十進位制)的兩個位元組分別轉換為十六進位制後加a0h得到對應的機內碼。

8樓:匿名使用者

ascii碼,一個字兩個位元組,一個位元組八位。

9樓:匿名使用者

漢字機內碼 參考資料:

10樓:匿名使用者

國標gb2312-80規定,全部國標漢字及符號組成94×94矩陣,每行稱區,每列稱位,這種編碼方式就叫做區位碼.

因區碼和位碼組合是在01至94範圍內,會與ascii碼產生衝突,於是制定了漢字內碼:規定為高位內碼=區碼+20h+80h;

低位內碼=位碼+20h+80h.所以各種輸入法都是按這個標準去編寫的.

因此,把一個漢字表示為兩個位元組的二進位制碼,這種編碼稱為 區位 碼,或稱為內碼.

計算機中字到底等於多少個位元組啊計算機中一個字到底等於多少個位元組啊

計算機中一箇中文等於兩個字 節,一個英文字母 不分大小寫 佔一個位元組的空間。位元組 byte 是計算機資訊科技用於計量儲存容量的一種計量單位,通常情況下一位元組等於八位,也在一些計算機程式語言中表示資料型別和語言字元。資料儲存是以 位元組 byte 為單位,資料傳輸大多是以 位 bit,又名 位元...

在計算機中,1MB等於多少位元組,1MB等於多少位元組?為什麼?

1mb等於2 20位元組。1mb 1024kb 2 20 b。1 位元組 byte 是計算機資訊科技用於計量儲存容量的一種計量單位,作為一個單位來處理的一個二進位制數字串,是構成資訊的一個小單位。最常用的位元組是八位的位元組,即它包含八位的二進位制數。2 kb千位元組 kbytes 計算機儲存容量單...

在計算機中,每個儲存單元都有連續的編號,這個編號被稱為什麼

編號被稱為地址。為了便於存放,每個儲存單元必須有唯一的編號 稱為 地址 通過地址可以找到所需的儲存單元,取出或存入資訊。這如同旅館中每個房間必須有唯一的房間號,才能找到該房間內的人。記憶體地址只是一個編號,代表一個記憶體空間。在計算機中儲存器的容量是以位元組為基本單位的。也就是說一個記憶體地址代表一...