COLUMN - Updated 2026-05-15

CP949, EUC-KR, UTF-8, Shift-JIS 실무 비교

한국어와 일본어 CSV에서 자주 만나는 CP949, EUC-KR, UTF-8, Shift-JIS의 차이와 실무 선택 기준을 비교한다.

Open CSV Encoding Fixer

결론부터 말하면 새로 만드는 시스템과 웹 다운로드는 UTF-8을 기본으로 두는 것이 가장 안전하다. 다만 오래된 한국어 Windows/Excel 환경에서는 CP949/EUC-KR 파일이, 일본 거래처나 레거시 업무에서는 Shift-JIS CSV가 여전히 등장한다. 그래서 실무에서는 "저장은 UTF-8, 수신 파일은 원본 인코딩 확인, Excel 공유는 UTF-8 BOM"이라는 기준을 잡는 편이 좋다.

인코딩을 비교해야 하는 이유

CSV 깨짐 문제는 파일 내용이 틀려서 생기는 경우보다, 읽는 쪽이 문자 체계를 다르게 해석해서 생기는 경우가 많다. 특히 한국어와 일본어는 영문보다 인코딩 실수가 눈에 잘 띄고, 한 번 깨진 상태로 저장하면 원본 복구가 어려워진다.

인코딩 비교는 개발 지식만의 문제가 아니다. 운영자, 마케터, 번역 담당자, 고객 지원팀이 파일을 주고받는 모든 단계에서 실제 비용으로 이어진다.

실무 비교표

인코딩주 사용 맥락장점주의할 점
UTF-8웹, API, 최신 데이터 파이프라인다국어 처리에 유리하고 표준성이 높음Excel에서 BOM이 없으면 깨져 보일 수 있음
UTF-8 BOMExcel 공유 CSVExcel에서 UTF-8 신호로 잘 인식되는 편일부 시스템은 BOM을 데이터로 오해할 수 있음
CP949한국어 Windows 레거시오래된 한국어 Excel/업무 시스템과 호환국제화와 웹 처리에 불리함
EUC-KR오래된 한국어 시스템일부 레거시 서버/문서에서 등장CP949와 완전히 같지 않음
Shift-JIS일본어 Windows/Excel 레거시일본 업무 파일에서 자주 만남UTF-8로 잘못 열면 文字化け가 생김

선택 기준

새 기능을 만든다면 UTF-8을 기본값으로 둔다. 한국어와 일본어가 섞이는 문서, 이모지, 특수기호, 다국어 상품명은 UTF-8로 처리하는 편이 가장 예측 가능하다.

반대로 외부에서 받은 파일은 먼저 원본 인코딩을 추정해야 한다. 한국어가 깨진다고 무조건 CP949라고 단정하면 일본어 Shift-JIS 파일이나 잘못 저장된 UTF-8 파일을 더 망칠 수 있다.

업무 체크리스트

  • 원본 파일은 변환 전에 보관한다.
  • Excel에서 바로 더블클릭하지 말고 데이터 가져오기를 사용한다.
  • 웹 다운로드용 CSV는 UTF-8 BOM 옵션을 제공한다.
  • 일본 거래처 파일은 Shift-JIS 가능성을 먼저 확인한다.
  • DB 저장과 API 응답은 UTF-8로 통일한다.
  • 깨진 파일을 다시 저장하기 전에 원본 인코딩을 확인한다.

FixData 도구로 확인하기

CSV Encoding Fixer는 CSV 텍스트의 깨짐 신호, 행 수, 열 수를 빠르게 확인하는 데 초점을 둔다. Excel 공유용 파일이 필요하면 UTF-8 BOM CSV 다운로드 흐름을 사용한다.

관련 문서

업데이트 날짜

2026-05-15