본문 바로가기

검색용 개발 블로그

\u003C 가 뭐니? 뭘 뜻하는거야

이미지 출처:  https://youtu.be/euGlkrYAl_c

유튜브 게임유저도 궁금해하는 \u003C 넌 도대체 뭐냐!!

(이미지의 정답: <----- 즉 왼쪽으로 가라 )

 

It's a unicode character. In this case \u003C and \u003E mean :

U+003C < Less-than sign

U+003E > Greater-than sign

https://stackoverflow.com/questions/4858494/what-does-u003c-mean

 

What does \u003C mean?

I'm looking at twitter's javascript file, and I see this in the templates hash: Browse Interests{{/i}}\u003C/a\u003E\n \u003C/li\u003E\n {{#logged_in}}\n What do those codes represent?

stackoverflow.com

라고 스택오버플로우에서 대답해주고 있다.

유니코드라고 한다.

 

이것은 JavaScript에서 문자열로 구문 분석할 때 해당 문자로 변환되는 유니코드 문자 코드입니다(JavaScript는 의 모든 항목을 \uXXXX해당 유니코드 문자로 자동 변환함 ).

 

종종 javascirpt에서 

내가 알고있는 문자 대신 이상한 문자로 대체되어서 js 파일에 나타는 경우가 종종 있었다.

 

오늘은 유니코드를 그래서 알아보려고 한다.

 

유니코드가 뭐지? https://youtu.be/ABPOjjre0C8

1. 문자표

캐릭터셋, 왜 등장? 컴퓨터가 등장했을때는 수학적 계산을 위해 만들어짐. 사람이 보는 형태로 나타내야하는데

그때 당시에는 모니터이다.

컴퓨터와 약속함. 숫자와 문자를 매칭시키는

가 = 1이야. 나 =2 라고 표현해줘. 기계에 입력해놓은거임.

아스키코드가 대표적 예제이다.

 

2. 문자표를 인코딩한다

개발자들이 많아진 상태였음. 그래서 너무 많은 표준이 많아서 컴퓨터는 헷갈림.

그래서 통일하자! 해서 나온 것이 유니코드다. 

영어는 1바이트 

한글은 2바이트

그외 3바이트

 

유니코드 앞에 코드를 앞에 단 것이. 인코딩이다.

그 방법은 utf8 utf16처럼 방법은 다양하다.

 

오늘의 예제! (https://shop.uplus.co.kr/pc/event/eventView)

구글태그매니저로 스크립트를 넣었을때 유니코드가 있다! 

 

"\u003Cscript type=\"text\/gtmscript\" 

data-gtmsrc=\"\/\/s3.ap-northeast-2.amazonaws.com\/vegas-kor-o\/sdk\/web\/vegastracker.min.js\"\u003E

\u003C\/script\u003E\n

 

\u003Cscript type=\"text\/gtmscript\"\u003E

var tracker=new VegasTracker,

initData=tracker.InfoBuilder.setCountry(\"KR\").build();

tracker.init(initData);

tracker.firstLanding();

tracker.open();

\u003C\/script\u003E\n",

 

<script type="text/javascript" id="" src="//s3.ap-northeast-2.amazonaws.com/vegas-kor-o/sdk/web/vegastracker.min.js">

</script>

 

<script type="text/javascript" id="">

var tracker=new VegasTracker,

initData=tracker.InfoBuilder.setCountry("KR").build();

tracker.init(initData);

tracker.firstLanding();

tracker.open();

</script>

 

이 둘은 똑같다.

 

유니코드는 숫자로 시작하는거같은데

\" 이건 정규표현식에서 썼던거 같은데..

https://heropy.blog/2018/10/28/regexp/

 

정규표현식, 이렇게 시작하자!

매일 쓰는 것도, 가독성이 좋은 것도 아니지만, 모르면 안되는 정규표현식. 저는 이렇게 공부하기 시작했습니다! (자바스크립트를 기준으로 설명합니다)

heropy.blog

 

자바스크립트에서

문자를 유니코드로

유니코드를 문자로 바꾸는 함수가 있다.

출처: https://webisfree.com/2018-07-20/%EC%9E%90%EB%B0%94%EC%8A%A4%ED%81%AC%EB%A6%BD%ED%8A%B8-unicode-string%EC%9C%BC%EB%A1%9C-%EB%B3%80%ED%99%98%ED%95%98%EA%B1%B0%EB%82%98-%EC%95%8C%EC%95%84%EB%82%B4%EB%8A%94-%EB%B0%A9%EB%B2%95

 

자바스크립트 unicode string으로 변환하거나 알아내는 방법

자바스크립트를 사용하여 유니코드(unicode) 문자열로 변환하는 방법을 알아봅니다. 어떻게하면 unicode를 문자열 Character로 변환하거나 반대로 unicode로 변환할 수 있을까요?

webisfree.com

// 문자-> unicode 변환
charToUnicode = function(str) {
  if (!str) return false; // Escaping if not exist
  var unicode = '';
  for (var i = 0, l = str.length; i < l; i++) {
    unicode += '\\' + str[i].charCodeAt(0).toString(16);
  };
  return unicode;
}
// unicode -> 문자 변환
String.fromCharCode(parseInt(unicode,16))

음?? 내가 원한 결과가 아닌데???

뭐야