美文网首页
Unicode和UTF-8/UTF-16/UTF-32

Unicode和UTF-8/UTF-16/UTF-32

作者: 小麻烦爱学习 | 来源:发表于2020-07-09 20:01 被阅读0次

字符集和编码方式

字符集:是某组字符的集合.字符集定义了字符和二进制的关系,给每个字符分配一个唯一的ID
编码方式:是一种规则,把字符转换成内存的转换规则。

Unicode是字符集

Unicode字符集能表示所有语言的字符

UTF是一种编码方式

UFT-8/16/32是Unicode使用的编码方式

  1. UFT-8:一种变长的编码方案,使用 1~6 个字节来存储;
  2. UFT-32:一种固定长度的编码方案,不管字符编号大小,始终使用 4 个字节来存储;
  3. UTF-16:介于 UTF-8 和 UTF-32 之间,使用 2 个或者 4 个字节来存储,长度既固定又可变。

base64

base64是一种编码方式,基于64个可打印字符来表示二进制数
A-Za-z0-9+/: 26个大写字母+26个小写字母+10个数字+ "+" + "/" = 52+10+2 =64
Base64要求把每三个8Bit的字节转换为四个6Bit的字节(38 = 46 = 24),然后把6Bit再添两位高位0,组成四个8Bit的字节,也就是说,转换后的字符串理论上将要比原来的长1/3。
优点:用于http传输比较长的标识信
=:表示空位

相关文章

  • Java 知识点

    final 修饰符 Unicode实现方式:包含了UTF-8、UTF-16、UTF-32 栈溢出 codePoin...

  • 一文解开java中字符串编码的小秘密

    简介 在本文中你将了解到Unicode和UTF-8,UTF-16,UTF-32的关系,同时你还会了解变种UTF-8...

  • Unicode和UTF-8、UTF-16、UTF-32

    写在前面 如果你是iOS开发者,并且在处理NSString字符上遇到了一些问题,强烈建议去看看Objc中国上关于 ...

  • Unicode和UTF-8/UTF-16/UTF-32

    字符集和编码方式 字符集:是某组字符的集合.字符集定义了字符和二进制的关系,给每个字符分配一个唯一的ID编码方式:...

  • Unicode, UTF-8, UTF-16, UTF-32

    Unicode是字符集,给每个字符一个唯一的编码,目前的版本用4个字节表示所有的字符。UTF是 unicode t...

  • Unicode和UTF-8、UTF-16

    Unicode 和 UTF-8 、UTF-16是什么关系呢?这是我最近好奇的一个问题。 Unicode Unico...

  • python字符串与正则表达式学习笔记 1

    字符串 现在我们常见的编码格式主要有UTF-8、UTF-16、UTF-32、GB2312、GBK、CP93...

  • UTF-16编码方式

    1. 首先要注意的是,代理Surrogate是专属于UTF-16编码方式的一种机制,UTF-8和UTF-32是不用...

  • Unicode和UTF-8、UTF-16、UTF-32编码问题

    utf和Unicode编码到底有什么区别?是存储方式不同?编码方式不同?它们看起来似乎很相似,但是实际上他们并不是...

  • 知识点

    @Unicode 我们知道unicode是一种编码标准,具体的实现标准可能是utf-8,utf-16,gbk ……...

网友评论

      本文标题:Unicode和UTF-8/UTF-16/UTF-32

      本文链接:https://www.haomeiwen.com/subject/avtecktx.html