URL 编码简介
URL 只能使用 ASCII 字符集来通过因特网进行发送。由于 URL 常常会包含 ASCII 集合之外的字符,URL 必须转换为有效的 ASCII 格式。
转化格式为:URL 编码使用 "%" 其后跟随两位的十六进制数来替换非 ASCII 字符。具体的转换过程如下所示:
对于Unicode字符,RFC文档建议使用utf-8对其进行编码得到相应的字节,然后对每个字节执行百分号编码。如"中文"使用UTF-8字符集得到的字节为0xE4 0xB8 0xAD 0xE6 0x96 0x87
,经过Url编码之后得到:%E4%B8%AD%E6%96%87
。
备注:URL 不能包含空格。URL 编码通常使用 + 来替换空格。