GUIDE - Updated 2026-05-15
UTF-8, CP949, EUC-KR, Shift-JIS 차이
CSV와 Excel에서 자주 만나는 UTF-8, CP949, EUC-KR, Shift-JIS 인코딩 차이와 깨짐 문제를 구분하는 방법.
Open CSV Encoding Fixer핵심 요약
UTF-8은 다국어를 폭넓게 다루는 현재 표준에 가까운 인코딩이고, CP949/EUC-KR은 한국어 레거시 환경, Shift-JIS는 일본어 레거시 환경에서 자주 만납니다. CSV가 깨질 때는 파일 내용이 사라진 것이 아니라 읽는 프로그램이 다른 인코딩으로 해석했을 가능성이 큽니다. Excel 공유용인지, 웹 업로드용인지, 레거시 시스템용인지에 따라 선택이 달라집니다.
왜 중요한가
CSV는 인코딩 정보를 강하게 보장하지 않는 경우가 많습니다. 그래서 같은 파일도 Excel, 브라우저, 업로드 서버, 편집기에서 서로 다르게 보일 수 있습니다. 고객명, 상품명, 주소처럼 원문 보존이 중요한 데이터는 인코딩을 잘못 다루면 재업로드와 검수 비용이 커집니다.
기본 개념
| 인코딩 | 주로 만나는 곳 | 실무 주의점 |
|---|---|---|
| UTF-8 | 웹, API, 최신 SaaS, 다국어 데이터 | Excel에서 BOM이 없으면 깨질 수 있음 |
| UTF-8 BOM | Excel 공유용 CSV | API 업로드에서는 첫 컬럼 문제 가능 |
| CP949 | 한국어 Windows, 오래된 업무 시스템 | UTF-8로 잘못 읽으면 한글 깨짐 |
| EUC-KR | 오래된 한국어 시스템 | CP949와 완전히 같지는 않음 |
| Shift-JIS | 일본어 Windows, 일본 레거시 CSV | UTF-8과 혼동하면 文字化け 발생 |
비교표
| 상황 | 먼저 시도할 인코딩 | 다음 확인 |
|---|---|---|
| 한국어 CSV가 Excel에서 깨짐 | UTF-8 또는 UTF-8 BOM | CP949로 만들어진 파일인지 확인 |
| 레거시 한국어 시스템 export | CP949/EUC-KR | 웹 업로드 전 UTF-8 변환 |
| 일본어 CSV가 깨짐 | Shift-JIS 또는 UTF-8 | 파일 출처가 일본어 Windows인지 확인 |
| API가 받는 CSV | UTF-8 | BOM 허용 여부 확인 |
실무 적용 방법
- 원본 CSV를 복사해 보관합니다.
- 깨진 화면만 보고 저장하지 않습니다.
- CSV Encoding Fixer에서 샘플을 확인합니다.
- Excel은 더블클릭 대신 데이터 가져오기로 열어 인코딩을 선택합니다.
- 업로드 대상의 권장 인코딩을 문서에서 확인합니다.
예제
홍길동,서울이 ?솉길?룞,?쒖슱처럼 보이면 UTF-8 파일을 CP949 계열로 잘못 읽었을 수 있습니다. 반대로 CP949 파일을 UTF-8로 읽어도 한글이 깨질 수 있으므로, 파일 출처와 열어보는 프로그램을 함께 확인해야 합니다.
관련 도구
- CSV Encoding Fixer: CSV 깨짐 가능성을 확인하고 UTF-8 BOM 파일을 만들 수 있습니다.
관련 에러
관련 가이드
업데이트 날짜
2026-05-15