한글이 왜 깨질까? 캐릭터셋과 인코딩에 대해서 알아보자
·
IT 지식
1. 깨진 한글과의 첫 만남 개발을 하다 보면 영어는 멀쩡한데, 한글만 ��처럼 깨져 보이는 경험을 하게 된다.“같은 요청인데 왜 영어는 괜찮고, 한글만 깨질까?”그 해답은 바로 문자셋(Character Set)과 인코딩(Encoding)에 숨어 있다.2. 문자셋과 인코딩의 차이문자셋(Character Set): 문자에 번호를 붙인 목록 (예: 가 = U+AC00)(사전 같은 개념이라고 생각해보자)인코딩(Encoding): 그 번호를 실제 바이트로 바꾸는 규칙예시 – "가" (U+AC00):UTF-8 → EA B0 80 (3바이트)UTF-16LE → AC 00 (2바이트)EUC-KR → B0 A1 (2바이트)즉, 같은 문자라도 인코딩 방식에 따라 바이트가 달라진다.영어는 ASCII 영역(0~127) 덕분..