용어사전으로 돌아가기
인코딩
문자 인코딩(Character Encoding)은 문자를 컴퓨터가 처리할 수 있는 숫자(바이트)로 변환하는 규칙입니다.
주요 인코딩 방식
- UTF-8: 전 세계 모든 문자를 지원하는 가변 길이 인코딩. 웹 표준.
- EUC-KR: 한국어 전용 인코딩. 오래된 한국 시스템에서 사용.
- UTF-16: 대부분의 문자를 2바이트로 표현. Windows 내부 사용.
- ISO-8859-1: 서유럽 언어용 인코딩.
인코딩 문제가 발생하는 이유
파일을 저장할 때 사용한 인코딩과 열 때 사용한 인코딩이 다르면 글자가 깨집니다. 특히 한글, 중국어, 일본어 등 비영문 문자에서 자주 발생합니다.
DiffMate의 인코딩 처리
DiffMate는 BOM 감지 → UTF-8 → EUC-KR → ISO-8859-1 → UTF-16 순서로 인코딩을 자동 감지합니다. 대부분의 한글 파일을 정상적으로 비교할 수 있습니다.