本节主要列出字符实体和标签简写,备查和易于记忆
1. 字符集
2. 字符实体
3. 标签简写及全称
1. 字符集
如需正确地显示 HTML 页面,浏览器必须知道使用何种字符集。
1.1 ASCII
万维网早期使用的字符集是 ASCII(American Standard Code for Information Interchange)。ASCII的全称是"美国信息交换标准代码"。它设计于60年代早期,是计算机和诸如打印机、磁带驱动器之类的硬件设备的标准字符集。
ASCII 支持 0-9 的数字,大写和小写英文字母表,以及一些特殊字符,共128个字符。具体可以参考:ASCII字符集参考手册
1.2 ISO-8859-1
由于很多国家使用的字符并不属于 ASCII,现代浏览器的默认字符集是 ISO-8859-1。ISO 字符集是国际标准组织 (ISO, International standard organization) 针对不同的字母表/语言定义的标准字符集。如果网页使用不同于 ISO-8859-1 的字符集,就应该在 <meta> 标签进行指定。
ISO-8859-1 的较低部分(从 1 到 127 之间的代码)是最初的 ASCII 字符集(0-9 的数字,大写和小写英文字母表,以及一些特殊字符)。而ISO-8859-1 的较高部分(从 160 到 255 之间的代码)包含了一些西欧国家使用的字符和一些被广泛使用的特殊字符,它们全都有实体名称。这些符号中的大多数都可以在不进行实体引用的情况下使用,但是实体名称或实体编号为那些不容易通过键盘键入的符号提供了表达的方法。
具体可以参考:ISO-8859-1 字符集参考手册
1.3 Unicode
由于上面列出的字符集都有容量限制,而且不兼容多语言环境,Unicode 联盟开发了 Unicode 标准。他们的目标是用标准的 Unicode 转换格式 (UTF) 来取代现有的字符集。Unicode 标准涵盖了世界上的所有字符、标点和符号。不论是何种平台、程序或语言,Unicode 都能够进行文本数据的处理、存储和交换。Unicode 可以被不同的字符集兼容。最常用的编码方式是 UTF-8 和 UTF-16:
UTF-8中的字符可以是 1-4 个字节长,可以表示 Unicode 标准中的任意字符,向后兼容 ASCII,是网页和电子邮件的首选编码。
UTF-16的 Unicode 转换格式是一种 Unicode 可变字符编码,能够对全部 Unicode 指令表进行编码。UTF-16 主要被用于操作系统和环境中,比如微软的 Windows 2000/XP/2003/Vista/CE 以及 Java 和 .NET 字节代码环境。
2. 字符实体
HTML 中的预留字符必须被替换为字符实体。一些在键盘上找不到的字符也可以使用字符实体来替换。
字符 | 实体编号 | 实体名称 | 描述 |
---|---|---|---|
  |
|
非间断空格(non-breaking space) | |
¡ | ¡ |
¡ |
倒置感叹号(inverted exclamation mark) |
¢ | ¢ |
¢ |
美分符号(cent) |
£ | £ |
£ |
英镑符号(pound) |
¤ | ¤ |
¤ |
货币符号(currency) |
¥ | ¥ |
¥ |
日元符号(yen) |
¦ | ¦ |
¦ |
间断的竖杠(broken vertical bar) |
§ | § |
§ |
小节号(section) |
¨ | ¨ |
¨ |
分音符号(spacing diaeresis) |
© | © |
© |
版权所有(copyright) |
ª | ª |
ª |
阴性序数记号(feminine ordinal indicator) |
« | « |
« |
左双角引号(angle quotation mark (left)) |
¬ | ¬ |
¬ |
否定符号(negation) |
| ­ |
­ |
软连字符(soft hyphen) |
® | ® |
® |
注册商标(registered trademark) |
¯ | ¯ |
¯ |
长音符号(spacing macron) |
° | ° |
° |
度符号(degree) |
± | ± |
± |
加减号/正负号(plus-or-minus) |
´ | ´ |
´ |
尖音符号(spacing acute) |
µ | µ |
µ |
微米符号(micro) |
¶ | ¶ |
¶ |
段落符号(paragraph) |
· | · |
· |
中间点(middle dot) |
¸ | ¸ |
¸ |
变音符号(spacing cedilla) |
¹ | ¹ |
¹ |
上标 1(superscript 1) |
º | º |
º |
阳性序数记号(masculine ordinal indicator) |
» | » |
» |
右双角引号(angle quotation mark (right)) |
¼ | ¼ |
¼ |
1/4 分数(fraction 1/4) |
½ | ½ |
½ |
1/2 分数(fraction 1/2) |
¾ | ¾ |
¾ |
3/4 分数(fraction 3/4) |
¿ | ¿ |
¿ |
倒置问号(inverted question mark) |
参考:
HTML教程
网友评论