아스키로는 한국어, 일본어, 중국어 문자표현을 할 수 없다.
그래서 나라별로 문자 표현을 해야하는데
기본은 중복 된다.
유니코드는 전세계의 언어를 담았다.

euc-kr 웹페이지 작성시 사용한다.
표준이다.
영어 1바이트
한글 2바이트
ms949 마이크로 소프트에서 만들었음
민간 업체
완성된 글자에 2바이트를 할당함
각 --- ㄱ ㅏ ㄱ

getByte(문자셋)
분해해라.
new String( | 바이트[], 문자셋) |
msm949 는 euc-kr보다 한글의 모양을 더 많이 가진다.
msm949 뷁을 만든다

utf-16 특징: 고정 길이
영어도 2바이트
한글도 2바이트
utf-8
한글 3바이트
영어 2바이트


컴퓨터에 있는 default 문자셋을 리턴한다.
맥은 utf-8이다
영어로 텍스트 파일을 만드면 utf-8로 생성된다.
'학습 기록 (Learning Logs) > 자바' 카테고리의 다른 글
[Chap19] - byte단위입출력_2 FileInputStream (0) | 2022.12.12 |
---|---|
[Chap19] - byte단위입출력: InputStream_OutputStream (0) | 2022.12.12 |
[Chap19] - 자바의 파일(File) (0) | 2022.12.05 |
[chap18] 람다식 (0) | 2022.11.27 |
[Chap17] - Map의 공통특성 (HashMap, HashTable, LinkedHashMap) (0) | 2022.11.20 |