char[] 和 String 類型占用字節(jié)大小問題

2019-8-8    seo達人

如果您想訂閱本博客內(nèi)容,每天自動發(fā)到您的郵箱中, 請點這里

在 C 語言中
1、char a[10] = {"China"} 中,這個 a 占用多少字節(jié)?

答:占用 10 個字節(jié)。

解析:上面代碼對 a 做了賦值的操作,

a[0]='C' ,a[1]='h' ,a[2]='i' ,a[3]='n' ,a[4]='a' ,a[5]='\0',a[6]='\0',a[7]='\0',a[8]='\0',a[9]='\0'

所以,它占用的是 10 個字節(jié)。

2、如果單指 ”China“ ?

答:共 6 個字節(jié)。China 占 5 個字節(jié),最后以 '\0' 結(jié)束,占 1 個字節(jié)。

在 Java 語言中
1、String s = "China"; 占多少字節(jié)?

答:占 5 個字節(jié)。

System.out.println(Charset.defaultCharset());//獲取ide默認編碼類型
String s = new String("China".getBytes());
byte[] b = s.getBytes();
System.out.println("" + b.length);
 以上代碼,可以輸出 "China" 所占的字節(jié)長度為 5

2、String s = "中國"; 占多少字節(jié)?

答:如果是 漢字 的情況需要考慮編碼。

(1)GBK 編碼(ide默認)時,每一個漢字占用 2 個字節(jié),那么中國占 4 個字節(jié)。

(2)UTF-8 編碼時,每一個漢字占用 3 個字節(jié),那么中國占用 6 個字節(jié)。

3、轉(zhuǎn)碼問題,GBK 轉(zhuǎn) UTF-8 時,字節(jié)占用會變大嗎?反過來呢?

//獲取的是 UTF-8編碼
System.out.println(Charset.defaultCharset());
String s;
try {
        s = new String("中國".getBytes(),"GBK");
        byte[] b = s.getBytes();
        System.out.println("" + b.length);
    } catch (UnsupportedEncodingException e) {
        e.printStackTrace();
}
如上代碼是:UTF-8 轉(zhuǎn) GBK 編碼格式,s 長度從 6 字節(jié)變?yōu)?9 字節(jié)。
s 內(nèi)容變化:中國 —> 涓浗
因為當前編碼是 UTF-8,轉(zhuǎn)碼之后變成了 3 個文字,占用 9 個字節(jié)。然而,反過來的情況是這樣的:

中國 (gbk) —> ?й? (utf-8)
s 長度從 4字節(jié) 變成了 4字節(jié),雖然長度沒發(fā)生改變,但是文字已經(jīng)改變。這里的 ? 占用 1 個字節(jié)。

藍藍設計www.bouu.cn )是一家專注而深入的界面設計公司,為期望卓越的國內(nèi)外企業(yè)提供卓越的UI界面設計、BS界面設計 、 cs界面設計 、 ipad界面設計 、 包裝設計 、 圖標定制 、 用戶體驗 、交互設計、 網(wǎng)站建設 、平面設計服務。

分享本文至:

日歷

鏈接

個人資料

藍藍設計的小編 http://www.bouu.cn

存檔