GUIDE - Updated 2026-05-15
다국어 문서에서 인코딩 문제가 생기는 이유
한국어, 일본어, 영어가 섞인 CSV와 문서에서 인코딩 문제가 생기는 원인과 안전하게 확인하는 절차.
Open CSV Encoding Fixer핵심 요약
다국어 문서에서 인코딩 문제가 생기는 이유는 파일을 만든 시스템과 읽는 시스템이 같은 문자 규칙을 사용하지 않기 때문입니다. 한국어는 CP949/EUC-KR, 일본어는 Shift-JIS, 웹 서비스는 UTF-8을 기대하는 흐름이 섞이면서 CSV 깨짐이 자주 발생합니다. 원본을 보존하고 출처, 인코딩, 열기 방식을 순서대로 확인해야 합니다.
왜 중요한가
다국어 데이터는 고객명, 주소, 상품명, 리뷰처럼 원문 보존이 중요합니다. 깨진 상태로 저장하거나 다시 업로드하면 복구가 어렵고, 검색/분석/고객 대응 품질이 떨어집니다. 특히 한국어와 일본어가 함께 있는 CSV는 한쪽 기준만으로 처리하면 다른 언어가 깨질 수 있습니다.
기본 개념
| 문제 | 설명 |
|---|---|
| 인코딩 불일치 | UTF-8 파일을 CP949처럼 읽는 등 해석 기준 차이 |
| BOM 유무 | Excel이 UTF-8을 알아차리는 데 영향 |
| 레거시 시스템 | 오래된 업무 도구가 CP949 또는 Shift-JIS 사용 |
| 업로드 규칙 | 웹 서비스가 UTF-8만 허용할 수 있음 |
비교표
| 데이터 출처 | 흔한 인코딩 | 권장 확인 |
|---|---|---|
| 최신 SaaS export | UTF-8 | Excel에서 BOM 필요 여부 |
| 한국어 레거시 시스템 | CP949/EUC-KR | 웹 업로드 전 UTF-8 변환 |
| 일본어 레거시 시스템 | Shift-JIS/CP932 | 文字化け 여부 확인 |
| API export | UTF-8 | 문서의 charset 확인 |
실무 적용 방법
- 원본 파일을 보관합니다.
- 파일 출처와 대상 시스템을 확인합니다.
- CSV Encoding Fixer로 샘플을 확인합니다.
- Excel에서는 데이터 가져오기에서 인코딩을 선택합니다.
- 업로드용과 Excel 공유용 파일을 분리합니다.
예제
한국어와 일본어가 섞인 CSV:
country,name
KR,홍길동
JP,株式会社サンプル
이 파일은 UTF-8로 관리하는 것이 가장 안전한 경우가 많습니다. 다만 일본 레거시 시스템에 다시 넣어야 한다면 Shift-JIS 요구 여부를 확인해야 합니다.
관련 도구
- CSV Encoding Fixer: 다국어 CSV 깨짐 가능성을 확인하고 Excel용 UTF-8 BOM CSV를 만들 수 있습니다.
관련 에러
관련 가이드
업데이트 날짜
2026-05-15