- 전체
- JAVA 일반
- JAVA 수학
- JAVA 그래픽
- JAVA 자료구조
- JAVA 인공지능
- JAVA 인터넷
- Java Framework
- Java GUI (AWT,SWING,SWT,JFACE)
- SWT and RCP (web RAP/RWT)[eclipse], EMF
JAVA 일반 javac 로 컴파일 시 유니코드(utf-8) 한글 소스 코드 컴파일 문제
2015.02.02 20:39
javac 로 컴파일시 유니코드(utf-8) 한글 소스 코드 컴파일 문제
javac 로 컴파일시 유니코드(utf-8) 한글 소스 코드 컴파일 문제
자바 소스 파일(Java Source File)을 유니코드로 작성하면, 자바가 인코딩을 자동으로 인식하지 못합니다.
-encoding
자바 컴파일러에 위와 같은 옵션을 준 후, 한 칸 띄우고 인코딩 이름을 적어 주어야 합니다.
UTF-8 유니코드의 경우
javac -encoding UTF-8 Foo.java && java Foo
(utf8 로도 인식하더군요. 인터넷 웹문서용 유니코드는 UTF-8 이 표준입니다.)
UTF-16LE 유니코드의 경우
javac -encoding UTF-16LE Foo.java && java Foo
(MS윈도우에서는 UTF-16LE 유니코드가 사용됩니다.)
UTF-16BE 유니코드의 경우
javac -encoding UTF-16BE Foo.java && java Foo
(자바 가상머신은, 내부적으로 UTF-16BE 를 사용합니다.)
유니코드가 아닌, 한글 완성형의 경우
javac -encoding euc-kr Foo.java && java Foo
또는
javac -encoding 949 Foo.java && java Foo
(대문자로 EUC-KR 이렇게 적어도 되고, cp949, MS949 등을 사용해도 인식했습니다.) 한글 윈도우에서는 한글 완성형 인코딩이 기본이기에 지정해 줄 필요 없습니다.
중요 업데이트: 자바에서 한글 완성형 인코딩을 명시적으로 지정해 줄 때는 반드시 MS949 인코딩을 사용해야 "똠방각하" 등의 확장완성형이 표현됩니다.
유니코드 BOM 을 인식 못하는 문제
유니코드에는 파일의 맨앞에, 보이지 않는 어떤 표시를 해두는데 그런 것을 BOM이라고 합니다. 자바는 BOM이 있는 유니코드는 전혀 인식하지 못하더군요. BOM을 잘못된 글자/깨진 글자쯤으로 오해했습니다
가령 BOM이 있는 유니코드(utf8) 소스에서는
illegal character: 279
이런 에러가 났습니다. 텍스트 편집기의 File > Save As, 에서 BOM 이 없는 유니코드로 변환해 주면 문제가 해결됩니다.
[출처] http://mwultong.blogspot.com/2006/09/java-utf-8-utf-16-unicode.html
광고 클릭에서 발생하는 수익금은 모두 웹사이트 서버의 유지 및 관리, 그리고 기술 콘텐츠 향상을 위해 쓰여집니다.

