PHP中Unicode的签名问题
PHP中Unicode的签名问题
被 WordPress 模板的怪异代码空行折腾半天。因为 Dansion 师兄的驱使,开始 Dreamweaver 征途。不过很少有人关注到,在 Dreamweaver 中使用 utf-8 编码保存时,默认会有 "Unicode 标准化表单" 和 "包括 Unicode 签名 (BOM)" 两个选项,在页面属性里也可以看到:
如果 "包括 Unicode 签名" 选项被勾选,会产生稀奇古怪的页面渲染问题。
什么是 Unicode 签名 (BOM)?
BOM (Byte Order Mark) 是 UTF 编码方案里用于标识编码的标准标记。位于文本文件开头的 2 到 4 个字节,可将文件标识为 Unicode,还标识后面字节的字节顺序。由于 UTF-8 没有字节顺序,因此可以选择添加 UTF-8 BOM。对于 UTF-16 和 UTF-32,这是必需的。
由于这个 BOM 的存在,PHP 会误认为文本内容已经输出,因此会对页面渲染造成影响。据说 PHP6 中已经修复这个问题。
如何防止 Unicode 签名 (BOM) 对页面渲染的影响?
以 Dreamweaver 为例,保存 utf-8 编码的文档时,不勾选 "包括 Unicode 签名 (BOM)" 选项即可。