返回术语表
字符编码
字符编码是将字符转换为计算机可以处理的数字(字节)的一组规则。
主要编码方法
- UTF-8:支持全球所有字符的可变长度编码。Web标准。
- EUC-KR:韩语专用编码,用于旧版韩国系统。
- UTF-16:以2字节表示大多数字符。Windows内部使用。
- ISO-8859-1:西欧语言编码。
编码问题发生的原因
当保存文件时使用的编码与打开时使用的编码不同时,字符会出现乱码。这在韩语、中文、日语等非拉丁字符中尤为常见。
DiffMate的编码处理
DiffMate按以下顺序自动检测编码:BOM检测 → UTF-8 → EUC-KR → ISO-8859-1 → UTF-16。这确保大多数包含非拉丁字符的文件能正确比较。