熱心網友

從GB2312-1980編碼開始,漢字都是采用雙字節編碼。為了與系統中基本的ASCII字符集區分開,所有漢字編碼的每個字節的第一位都是1。例如:“啊”字的編碼為0xB0A1。GB2312的漢字編碼規則為:第一個字節的值在0xB0到0xF7之間,第二個字節的值在0xA0到0xFE之間。GB12345和GB13000是對GB2312-1980的擴充,所有已經包含在GB2312中的漢字編碼不變,另外增加更多的碼位。其編碼規則大致為:第一個字節的值在0x81到0xFE之間,第二個字節的值在0x40到0xFE之間。由于GB13000是對GB2312的擴展,所以也被成為GBK。 GB18030也是對GB2312的擴展,其編碼長度由2個字節變為1~4個字節。其中包括: * 單字節,其值從0到0x7F。* 雙字節,第一個字節的值從0x81到0xFE,第二個字節的值從0x40到0xFE(不包括0x7F)。* 四字節,第一個字節的值從0x81到0xFE,第二個字節的值從0x30到0x39,第三個字節的值從0x81到0xFE,第四個字節的值從0x30到0x39。 可以看出,GB18030的容量非常大,共有碼位160萬左右。另外,它與GB13000標準是兼容的。因此,所有基于GB13000設計的軟件都能夠不經修改運行在支持GB18030的系統平臺上。 。

熱心網友

GB18030是對GB2312的擴展,其編碼長度由2個字節變為1~4個字節