DiffMate

용어사전으로 돌아가기

인코딩

문자 인코딩(Character Encoding)은 문자를 컴퓨터가 처리할 수 있는 숫자(바이트)로 변환하는 규칙입니다.

주요 인코딩 방식

  • UTF-8: 전 세계 모든 문자를 지원하는 가변 길이 인코딩. 웹 표준.
  • EUC-KR: 한국어 전용 인코딩. 오래된 한국 시스템에서 사용.
  • UTF-16: 대부분의 문자를 2바이트로 표현. Windows 내부 사용.
  • ISO-8859-1: 서유럽 언어용 인코딩.

인코딩 문제가 발생하는 이유

파일을 저장할 때 사용한 인코딩과 열 때 사용한 인코딩이 다르면 글자가 깨집니다. 특히 한글, 중국어, 일본어 등 비영문 문자에서 자주 발생합니다.

DiffMate의 인코딩 처리

DiffMate는 BOM 감지 → UTF-8 → EUC-KR → ISO-8859-1 → UTF-16 순서로 인코딩을 자동 감지합니다. 대부분의 한글 파일을 정상적으로 비교할 수 있습니다.

지금 바로 비교하기