string – 为什么Utf8与ascii兼容

UTF-8中的A是U 0041 LATIN CAPITAL LETTER A. ASCII中的A是065.

UTF-8如何向后兼容ASCII?

ASCII仅使用8位字节的前7位.所以从00000000到01111111的所有组合.此范围内的所有128个字节都映射到特定字符.

UTF-8保留了这些精确的映射.由ASCII表示的01101011中的字符也由UTF-8中的相同字节表示.所有其他字符以多个字节的顺序编码,其中每个字节具有最高位集;即UTF-8中所有非ASCII字符的每个字节的格式为1xxxxxxx.

相关文章
相关标签/搜索