字符集和编码方式
字符集:是某组字符的集合.字符集定义了字符和二进制的关系,给每个字符分配一个唯一的ID
编码方式:是一种规则,把字符转换成内存的转换规则。
Unicode是字符集
Unicode字符集能表示所有语言的字符
UTF是一种编码方式
UFT-8/16/32是Unicode使用的编码方式
- UFT-8:一种变长的编码方案,使用 1~6 个字节来存储;
- UFT-32:一种固定长度的编码方案,不管字符编号大小,始终使用 4 个字节来存储;
- UTF-16:介于 UTF-8 和 UTF-32 之间,使用 2 个或者 4 个字节来存储,长度既固定又可变。
base64
base64是一种编码方式,基于64个可打印字符来表示二进制数
A-Za-z0-9+/: 26个大写字母+26个小写字母+10个数字+ "+" + "/" = 52+10+2 =64
Base64要求把每三个8Bit的字节转换为四个6Bit的字节(38 = 46 = 24),然后把6Bit再添两位高位0,组成四个8Bit的字节,也就是说,转换后的字符串理论上将要比原来的长1/3。
优点:用于http传输比较长的标识信
=:表示空位
网友评论