UTF-8(8-bit Unicode Transformation Format)是一種針對 Unicode 的可變長度字符編碼:
å¦ä½ 好)都是由於本應以 UTF-8 解碼的數據被錯誤地以 GBK 或 ISO-8859-1 讀取導致的。通過本工具,可以手動校驗字符的原始字節流。本站 工具提供了從字符到字節底層的全方位視角:
E4 BD A0(常用於數據庫分析、Hex 編輯器)。%E4%BD%A0(常用於 URL 傳輸)。| 亂碼錶現 | 可能原因 | 解決方法 |
|---|---|---|
你好 -> ä½ å¥½ |
UTF-8 字符被誤當做 Latin-1 讀取 | 使用本站重新進行 UTF-8 編碼校驗。 |
你好 -> 浣犲ソ |
UTF-8 字符被誤當做 GBK/ANSI 讀取 | 檢查源文件編碼,並使用工具還原字節。 |
| (空白或方塊) | 字體不支持或編碼截斷 | 檢查 UTF-8 字節序列是否完整。 |
\xe4\xbd\xa0)。U+1F600),確保在現代社交應用開發中不掉鏈子。0x、\x 或空格分隔的十六進制數據。