용어사전으로 돌아가기
CSV 파일
CSV(Comma-Separated Values)는 쉼표로 값을 구분하는 텍스트 기반 데이터 파일 형식입니다.
CSV의 구조
각 행은 하나의 레코드를 나타내며, 각 값은 쉼표(,)로 구분됩니다. 첫 번째 행은 보통 헤더(컬럼명)입니다.
CSV의 장점
- 거의 모든 프로그램에서 열 수 있는 범용 형식
- 텍스트 기반이라 diff 비교에 최적
- 파일 크기가 작고 처리 속도가 빠름
CSV 비교 시 주의점
- 인코딩(UTF-8, EUC-KR 등)이 다르면 한글이 깨질 수 있음
- 구분자가 쉼표가 아닌 경우(탭, 세미콜론) 확인 필요
- 대용량 파일은 메모리 제한에 주의
DiffMate에서의 CSV 비교
DiffMate는 100만 행 이상의 CSV도 브라우저에서 비교할 수 있습니다. 자동 인코딩 감지(UTF-8 → EUC-KR → ISO-8859-1)를 지원하여 인코딩 문제도 자동으로 해결합니다.