2020年6月3日 星期三

code point 與 code unit 的簡單分類

我的簡單理解方式為:

  • code unit: a byte. 較接近硬體的,但也可能因系統而異,
    e.g. UTF-16  uses two bytes as a code unit。
  • code point: a character. 某字集內的一個字元,可能為多個 code unit 組成。