ERROR - Updated 2026-05-14
Shift-JIS CSV를 UTF-8로 바꾸는 법
일본어 Windows나 레거시 시스템에서 받은 Shift-JIS CSV를 UTF-8 CSV로 바꿀 때 확인해야 할 절차와 주의점.
Open CSV Encoding FixerShift-JIS CSV를 UTF-8로 바꾸려면 먼저 원본이 실제로 Shift-JIS 또는 CP932 계열인지 확인해야 합니다. 변환은 파일을 한 번 열어 다시 저장하는 단순 작업처럼 보이지만, 잘못된 인코딩으로 열면 변환 전에 이미 일본어가 깨질 수 있습니다. 원본을 보존하고, 미리보기로 정상 문자열을 확인한 뒤 UTF-8 또는 UTF-8 BOM 사본을 만드는 순서가 안전합니다.
증상
- 일본어 Windows에서 받은 CSV를 웹 서비스에 올리면 文字化け가 납니다.
- UTF-8만 받는 시스템에 Shift-JIS CSV를 업로드해야 합니다.
- Excel에서는 정상으로 보이지만 개발 도구나 API에서는 일본어가 깨집니다.
- 변환 후 일부 기호, 가타카나, 주소 문자가 이상하게 바뀝니다.
원인
Shift-JIS는 일본어 레거시 환경에서 널리 쓰인 문자 인코딩입니다. 웹 서비스, 데이터베이스, 최신 API는 보통 UTF-8을 기대하므로 Shift-JIS CSV를 그대로 넣으면 깨질 수 있습니다.
또한 일본어 Windows 환경에서는 Shift-JIS와 유사한 CP932 확장 문자가 쓰일 수 있습니다. 변환 도구가 이 차이를 처리하지 못하면 일부 문자가 누락되거나 다른 문자로 바뀔 수 있습니다.
바로 해결 방법
- 원본 Shift-JIS CSV를 복사해서 보관합니다.
- Excel이나 편집기에서 일본어 인코딩으로 미리보기해 정상 문자열을 확인합니다.
- 업로드 대상이 요구하는 인코딩이 UTF-8인지, UTF-8 BOM인지 확인합니다.
- 정상으로 읽은 상태에서 UTF-8 사본으로 저장합니다.
- 변환 후 첫 줄, 일본어 상품명, 주소, 특수기호, 줄바꿈이 있는 필드를 확인합니다.
FixData 도구로 확인하기
CSV Encoding Fixer는 UTF-8로 변환된 CSV가 Excel에서 깨지지 않도록 UTF-8 BOM 사본을 만드는 데 사용할 수 있습니다. Shift-JIS 원본을 바로 덮어쓰기보다 변환된 UTF-8 텍스트를 도구에 넣어 최종 확인하는 흐름이 좋습니다.
브라우저가 원본 Shift-JIS 파일을 어떤 방식으로 읽는지는 환경에 따라 달라질 수 있습니다. 중요한 업무 파일은 원본 보존과 샘플 검증을 먼저 하세요.
수동 해결 방법
Excel로 변환할 때
Excel의 데이터 가져오기에서 일본어(Shift-JIS) 또는 그에 가까운 파일 원본을 선택해 미리보기를 확인합니다. 일본어가 정상으로 보이면 로드한 뒤 UTF-8 CSV 또는 UTF-8 BOM CSV로 별도 저장합니다.
편집기로 변환할 때
VS Code나 전문 편집기를 사용한다면 파일을 열 때 인코딩을 명시적으로 선택합니다. 깨진 상태로 열린 파일을 UTF-8로 저장하면 깨진 글자가 그대로 저장되므로, 열기 단계에서 정상 표시되는지 확인해야 합니다.
변환 후 검수하기
변환 후에는 단순히 파일이 열리는지만 보지 말고 다음 항목을 확인합니다.
| 확인 항목 | 이유 |
|---|---|
| 첫 번째 컬럼명 | BOM 또는 구분자 문제를 빨리 발견할 수 있음 |
| 일본어 회사명과 주소 | Shift-JIS/CP932 문자 차이가 드러나기 쉬움 |
| 쉼표가 들어간 필드 | 따옴표 처리 문제를 확인할 수 있음 |
| 줄바꿈이 들어간 설명 필드 | CSV 레코드 깨짐을 확인할 수 있음 |
예제
원본 의도:
sku,name
JP-001,東京都限定セット
잘못 읽은 뒤 저장된 결과:
sku,name
JP-001,譚ア莠ャ驛ス髯仙ョ壹そ繝?ヨ
이미 깨진 상태로 저장했다면 단순히 UTF-8로 다시 저장해도 원래 문자열이 돌아오지 않을 수 있습니다. 이때는 원본 Shift-JIS 파일에서 다시 시작해야 합니다.
자주 하는 실수
- 깨진 상태로 열린 파일을 UTF-8로 저장합니다.
- Shift-JIS와 UTF-8 BOM을 같은 개념으로 다룹니다.
- Excel에서 정상으로 보이면 웹 업로드도 정상일 것이라고 가정합니다.
- 변환 후 일본어 특수문자와 따옴표 포함 필드를 검수하지 않습니다.
관련 도구
- CSV Encoding Fixer: UTF-8 변환 후 Excel용 BOM CSV 확인에 사용할 수 있습니다.
관련 글
- CSV / Excel Encoding Center
- 일본어 CSV 文字化け 해결
- UTF-8 BOM이 필요한 경우
- Excel CSV UTF-8 깨짐 해결
- UTF-8, CP949, EUC-KR, Shift-JIS 차이
업데이트 날짜
2026-05-14