DiffMate

返回术语表

字符编码

字符编码是将字符转换为计算机可以处理的数字(字节)的一组规则。

主要编码方法

  • UTF-8:支持全球所有字符的可变长度编码。Web标准。
  • EUC-KR:韩语专用编码,用于旧版韩国系统。
  • UTF-16:以2字节表示大多数字符。Windows内部使用。
  • ISO-8859-1:西欧语言编码。

编码问题发生的原因

当保存文件时使用的编码与打开时使用的编码不同时,字符会出现乱码。这在韩语、中文、日语等非拉丁字符中尤为常见。

DiffMate的编码处理

DiffMate按以下顺序自动检测编码:BOM检测 → UTF-8 → EUC-KR → ISO-8859-1 → UTF-16。这确保大多数包含非拉丁字符的文件能正确比较。

立即比较